Erfassung der RWTH-Software-Shop-Daten und Auswertung am Beispiel von MATLAB Campus Mareike van Heel Rechen- und Kommunikationszentrum Seminarvortrag 01.10.2012
Inhalt Einleitung Datenerfassung Datenauswertung (MATLAB Campus) Motivation Aufgabenstellung Datenerfassung Randbedingungen/ Aufbau der asknet-Exports Datenbankschema Daten einpflegen Datenauswertung (MATLAB Campus) Gesamtverkaufszahlen an der RWTH Erwerb durch Institute Fazit und Ausblick
Einleitung
Motivation 1 Software-Shop Netzwerk-Lizenzen ITSM Betrieben von der asknet AG Bietet Software für Institute, Mitarbeiter und Studierende der RWTH an Verschiedene Lizenzarten (z.B. Einzelplatz- und Netzwerk-Lizenzen) Liefert Infos darüber, was erworben wird Netzwerk-Lizenzen Lizenz-Server Logfiles Liefert Infos darüber, was genutzt wird ITSM Seit 2009 schrittweise am RZ eingeführt Ziel u.a.: Prozesse messbarer gestalten und dadurch ggf. verbessern
Motivation 2 Matlab Campus Seit 2007 im Software-Shop der RWTH für RWTH-Mitglieder Umfasst neben Matlab diverse häufig verwendete Toolboxen 0-Euro-Kauf Finanziert durch Fakultäten 1, 4 und 6 Zeitlich begrenzt gültige Netzwerk-Lizenz
Aufgabenstellung Software-Shop Daten erfassen Exports analysieren Datenbankschema entwickeln Daten einpflegen Beispielhafte Auswertung MATLAB Campus Gesamt-Nutzung Studierende, Mitarbeiter, Institute getrennt
Datenerfassung
Randbedingungen/ Aufbau der Exports Exports der asknet AG Enthält alle Transaktionsdaten des Vortags Täglich als CSV auf VM des RZs Alle älteren Transaktionen in einem Export zusammengefasst Aufbau der Exports Beliebig viele Datensätze pro Export 30 Attribute pro Datensatz Attribute getrennt durch “;“
Aufbau der asknet-Exports Beispielhafter Datensatz Doppelte Attribute hersteller_name: Inhalt beider Felder identisch serien_nr: Inhalt unterschiedlich, mindestens eins leer Wichtige Attribute hersteller_nr: „LNR “ gefolgt von 4 Ziffern; dient zur Identifikation des Beginns eines neuen Datensatzes artikel_beschreibung: enthält bei begrenzt gültigen Lizenzen ein Ablaufdatum (Format variabel)
Datenbankschema Attribute in Relationen unterteilen: Besteller Einrichtung Artikel Hersteller Transaktion Relationen aus Campus-Export: campus_einrichtung campus_fachbereich
Datenbankschema
Daten einpflegen Grober Ablauf: Export-Daten zeilenweise einlesen => formatieren Formatierte Daten zeilenweise einlesen Datensatz aufteilen Hersteller-, Artikel-, Besteller-Daten und Transaktions-Daten in dieser Reihenfolge bestimmen und in die Datenbank eintragen/aktualisieren
Daten einpflegen asknet-Export/ Zeile formatieren Artikel bestimmen Zeile beginnt mit „LNR “ gefolgt von 4 Ziffern => neuer Datensatz beginnt Vorherigen Datensatz auf Vollständigkeit (30 Attribute) überprüfen Kein neuer Datensatz beginnt: Zeile an vorherige anhängen Formatierte Datei: Ein vollständiger Datensatz pro Zeile Artikel bestimmen Wert benötigter Attribute bestimmen und in DB eintragen Primärschlüssel bereits vorhanden => Daten aktualisieren Hersteller-, Besteller- und Einrichtungs-Daten analog
Daten einpflegen Transaktion bestimmen Bis auf serien_nr und ablaufdatum Werte der Attribut wie in „Artikel bestimmen“ festlegen serien_nr: beide Einträge, in denen Serien-Nummern stehen können aneinander hängen ablaufdatum: artikel_beschreibung auf Schlüsselwörter und Datums-Formate untersuchen (Vgl. Seminararbeit) Transaktion in DB eintragen
Datenauswertung (MATLAB Campus)
Gesamtverkaufszahlen an der RWTH Insgesamt steigende Verkaufszahlen Aktuelles Intervall: bis zum 29.08.2012 6458 erworbene Lizenzen Erwerb nach Gruppen Studenten größte Erwerber-Gruppe (71%) Institute 26% Mitarbeiter (privat) kleinste Gruppe (3%) Intervall Anzahl 2007/2008 3302 2009/2010 5431 2008/2009 2701 2010/2011 5774
Erwerb durch Institute – Gesamt 1 Verkaufszahlen zu Beginn eines Intervalls deutlich höher Grund: Dauerhafte Nutzung => Dauerhaft Lizenzen nötig Großteil der Lizenzen in den ersten 3 Monaten (2010/2011: 77,8%) Grund: Lizenzen dauerhaft notwendig => zu Beginn kaufen „Sättigungseffekt“ Zu Beginn eines Intervalls wenig gültige Lizenzen (2010/2011: 11%) Grund: Lizenzen müssen erworben werden Aber: Insgesamt steigende Anzahl gültiger Lizenzen zu Beginn eines Intervalls Grund: Institute erwerben häufiger neue Lizenzen vor Ablauf der alten Sprungstellen Grund: Institute kaufen teilweise große Anzahlen von Lizenzen auf einmal 2-Jahres-Rhythmus Im ersten Jahr werden jeweils wesentlich mehr Lizenzen erworben als im Zweiten Grund: Institute vergessen Lizenzen zu erneuern (gilt erst seit 2007) => Institute werden erinnert => Mehr Lizenzen werden wieder erworben Insgesamt positive Tendenz Grund: z.B. steigende Mitarbeiterzahlen, „Kaufen auf Vorrat“ (Lizenzen, die nur möglicherweise genutzt werden, 0-Euro-Kauf)
Erwerb durch Institute - Gesamt 2.1 Verkaufszahlen zu Beginn eines Intervalls deutlich höher Grund: Dauerhafte Nutzung => Dauerhaft Lizenzen nötig Großteil der Lizenzen in den ersten 3 Monaten (2010/2011: 77,8%) Grund: Lizenzen dauerhaft notwendig => zu Beginn kaufen „Sättigungseffekt“
Erwerb durch Institute - Gesamt 2.2
Erwerb durch Institute - Gesamt 3.1 Zu Beginn eines Intervalls wenig gültige Lizenzen (2010/2011: 11%) Grund: Lizenzen müssen erworben werden Aber: Insgesamt steigende Anzahl gültiger Lizenzen zu Beginn eines Intervalls Grund: Institute erwerben häufiger neue Lizenzen vor Ablauf der alten Sprungstellen Grund: Institute kaufen teilweise große Anzahlen von Lizenzen auf einmal
Erwerb durch Institute - Gesamt 3.2
Erwerb durch Institute - Gesamt 4.1 Stark unterschiedliche Gesamt-Anzahl erworbener Lizenzen pro Laufzeit-Intervall Im ersten/ dritten Jahr werden jeweils wesentlich mehr Lizenzen erworben als im Zweiten/ Vierten Grund: Institute vergessen Lizenzen zu erneuern (gilt erst seit 2007) => Institute werden erinnert (2009) => Mehr Lizenzen werden wieder erworben Insgesamt positive Tendenz Grund: z.B. steigende Mitarbeiterzahlen, stärkere Nutzung, „Kaufen auf Vorrat“ (Lizenzen, die nur möglicherweise genutzt werden, da 0-Euro-Kauf)
Erwerb durch Institute - Gesamt 4.2
Erwerb nach Fakultäten - Gesamt Interessant, da Matlab Campus von bestimmten Fakultäten finanziert wird Erwerbszahlen von Oktober 2007 bis September 2011 Verhältnis Lizenz/Mitarbeiter bei Finanzierenden (und 5) deutlich höher, mit Ausnahme von Fakultät 1 Fakultäten Insgesamt Lizenzen/Mitarbeiter 4 44% 1,49 6 20% 1,75 5 15% 1,36 1 9% 0,41 Sonstige 12% 0,17 5: Georessourcen und Materialtechnik
Erwerb nach Fakultäten - Verlauf Auch deutlich schwankende Erwerbs-Zahlen je nach Intervall Im ersten Intervall überall Im zweiten nur Fakultät 5, 6 Bedarf von Sonstigen steigt seit 08/09 Fakultät 5: 09/10 Ausreißer Sonst ca. so viele wie Fakultät 1 Grund für Ausreißer: weitere Auswertungen notwendig, z.B. nach Instituten der Fakultät
Fazit und Ausblick
Fazit Daten werden in Datenbank erfasst Schnelle Antworten auf verschiedene Fragestellungen Darstellung und Auswertung der MATLAB Campus Daten Information über Verlauf Verbesserung des Angebots möglich, z.B.: Bei Fakultät 5 nachforschen, warum so viele Lizenzen erworben werden aber keine Kostenbeteiligung stattfindet
Bachelor-Arbeit Ausblick Zuordnung von Studierenden-Lizenzen zu Fakultäten Webservice, der Liste von TIM-Kennungen Fakultäten zuordnet, notwendig Voraussichtlich im November fertig (andere Bachelor-Arbeit) Tatsächliche Nutzung der Lizenzen interessant Auswertung der Log-Files der Lizenzserver notwendig Bachelor-Arbeit
Literaturverzeichnis ITIL, www.itil-ocialsite.com/AboutITIL , August 2012 Stephan Kleuker, Grundkurs Software-Engineering mit UML, Vieweg+Teubner 2009 Stéphane Faroult, The Art of SQL, O'Reilly 2006 MathWorks, http://www.mathworks.de/ , August 2012 Institut für Regelungstechnik der RWTH Aachen, http://www.matlab.rwth-aachen.de/ , August 2012 RWTH Aachen, Zahlenspiegel 2007-2011, http://www.rwthaachen.de/cms/root/Die_RWTH/Prol/enw/Daten_Fakten/, August 2012
Vielen Dank für die Aufmerksamkeit!