Big Data & Data Science WidasConcepts Unternehmensberatung GmbH  Maybachstraße 2  71299 Wimsheim  Business Analytics.

Slides:



Advertisements
Ähnliche Präsentationen
Das E-Portfolio – essentielles Instrument zukünftiger Wissensarbeit? 27. Community-Treffen der PWM, 23. Februar 2007 Paul Meinl GF, factline Webservices.
Advertisements

Firmenprofil i2s - einige Facts
E-Commerce Shop System
Arbeitskreis Software as a Service (SaaS) Berlin / Brandenburg 30
SQL Server 2005.NET Integration Sebastian Weber Developer Evangelist Microsoft Deutschland GmbH.
Überleben im Paragraphendschungel.
Dynamische Mathematik
Universität Stuttgart Institut für Kernenergetik und Energiesysteme Was ist Refactoring? Bevor man die Integration angeht, mag es angebracht sein, den.
es gibt (fast) nichts, was nicht anders gemacht werden könnte
ASAM ODS Daten standardisiert auswerten
Junior Consultant (m/w) Marketing Sciences, befristet für 12 Monate Your chance to grow! GfK. Growth from Knowledge. Die Zukunft gehört denen, die nach.
1 Analyse von Software-statisch- Darmstadt,den Presentation: Sebastian Schikowski Steve Kenfack.
2. IT-Klausurtagung 2. Tag Neues beginnen Oktober 2002 in Ludwigslust.
Die Skriptsprache Python im Kontext des Softwareentwicklungsprozesses
Technische oder personenorientierte Lösungen?
Aichinger Christian, Strasser Jürgen
Synergieeffekte durch softwaregestützte Prozessmodelle
Konkrete Entwicklungen Wiederverwendung von XÖV-Bausteinen Mirco Kuhlmann | LAVA-Unternehmensberatung 6. November 2013 | 6. XÖV-Anwenderkonferenz | Bremen.
Bewertung von Cloud-Anbietern aus Sicht eines Start-ups
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Anforderungen von eScience und Grid-Technologie.
Kommunikation im Team verbessern mit Mindjet MindManager
University of Applied Sciences Übung Objektorientierte Programmierung II Dipl.-Inf. (FH) Markus Vogler.
? Was ist Informatik? Was ist Informatik? Alexander Lange
Informatiker.
DATA WAREHOUSE Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen Alfred Schlaucher, Detlef Schroeder DATA WAREHOUSE.
Technische Umsetzung von Transactional Promotion
Andreas Pichler IT-Consulting
Hardware / Software Codesign Hardware versus Software.
Wilhelm Klein, März 2010 Entwickeln mit Methode Projekt Manager Projektplanung Steuerung und Kontrolle Bereitstellung (Hardware und Software) Qualitätssicherung.
Wunsch Werkzeug Aufgabe & Modell Vorgehen Resultat Zukunft Machine Learning zur Steigerung der Usability Steigerung der Usability.
Rational Unified Process
MSDN TechTalk Anwendungen integrieren in Microsoft Dynamics CRM 4.0.
WIR LÖSEN DAS PROBLEM FÜR SIE
Die Management-Tools von Z&H COACH beinhalten zentrale Hilfsmittel für ein Management-System. Sorgfältig angewendet führen diese Tools Ihr Unternehmen.
Die Geschichte der Entwicklung der Informations-Technologie
Unified Process Historisch-Kulturwissenschaftliche Informationsverarbeitung Übung: Planung von Softwareprojekten Dozent: Christoph Stollwerk WS 2014/2015.
2. April 2015Solveigh Matthies BioRem als FESA3-Klasse BioRem-Ansteuerung mit einer FESA3- Klasse Sinn&Zweck Funktionialit ä t Implementierung.
Wizards & Builders GmbH Einführung in die W&B-Methode zur Softwareentwicklung Alf Borrmann.
Test-Driven Development
Hadoop-as-a-Service (HDaaS)
Blended Library Ergebnisworkshop Konstanz, 31.Juli 2014.
DevOps in der Praxis Umfrage Q4/2015
J.GehlenDept. of Medical Informatics 1 Department of Medical Informatics, Uniklinik RWTH Aachen, Germany Sichere Mobile Datenerfassung.
Case Management Ein Lösungsvorschlag für die Unterstützung des Case Managements in der Betreuung und Pflege.
Lernplattformen Evelyn Hartl Irmgard Haselbacher Maria Hillerbrandt Linz, Projektseminar E-Learning.
QM meets eLearning Erstes Treffen Kommunikationsrichtlinien Projektkoordination und Dokumentenaustausch über Weblog
Webdeployment auf Cluster Seminarvortrag von Lukas Bonzelett.
Funktionsweise eines Funambolservers Natascha Graf Aachen, 01. Februar 2010.
Hardware / Software Codesign Hardware versus Software.
H. Grottenegg 1 Geodaten – zur Prüfung bitte!. H. Grottenegg2 Um welche Prüfung gehts?  Prüfung von (Geo-)Daten gegen eine Richtlinie/Vorgabe (z.B.Naturbestand,
Wir befinden uns inmitten einer Zeit des Wandels.
Warum Data Science Ausbildung an einer Wirtschaftsuniversität? Axel Polleres, Institut für Informationswirtschaft, WU
COURSE 37Lattwein GmbH - Realtime-Bestellungen beim Lieferanten VSE nutzt WebService.
Microsoft Azure Die Cloud-Plattform für moderne Unternehmen ModernBiz 1 Kleine und mittlere Unternehmen (KMU) wünschen sich die Möglichkeit und Flexibilität,
Projekt: Freie Tauchausbildungsunterlagen
Wisdom of Crowds und Spiele
LehrerOffice 10 Vorteile.
X-NetMES – MES mit SAP-ERP Migrations- und Einführungsszenarien
Daten als Basis für Entscheidungen
Aktuelle Trends im EIM Enterprise Information Management
InsurTech und Startups
Von Oracle Reports zum BI Publisher
Geschäftsregeln in XÖV-Standards XÖV-Konferenz 2018
klassisches und agiles Projektmanagement
GegenÜberstellung agiles und klassisches Projektmanagement
Dokumentation Vanessa Henn.
DATA INTELLIGENCE REPORTING © Wolfgang Kress BI Consultant.
 Präsentation transkript:

Big Data & Data Science WidasConcepts Unternehmensberatung GmbH  Maybachstraße 2  Wimsheim  Business Analytics Day Karlsruhe, 3. März 2016 Transfer vs. Integration Rick Moritz, Big Data Scientist

2 Was ist Data Science? Wie passt es zu Big Data? Warum ist Spark so wichtig? Data Science mit Notebooks Beispiel SMACK Fazit Odds and Ends: Exkurse Fahrplan

Substantive Expertise Math & Statistics Knowledge Drew Conway, Head of Data at Project Florida Rapid prototyping Hacking Skills Danger Zone! Traditional Research Data Science Machine Learning

5 Die Daten skalieren Die Prinzipien bleiben gleich Die Werkzeuge müssen angepasst werden Und mit Big Data?

6 Klassisch: R, Python, Weka, SAS, SPSS, Rapidminer, sed, awk… Kombinierte Herangehensweise: Anbinden der klassischen Tools an den Cluster Über: Hive-Connectoren HDFS-Zugriff Werkzeuge DAS IST NICHT BIG DATA!

7 „Bring die Logik zu den Daten“ : Map-Reduce Neue Werkzeuge für neue Paradigmen production-example-qcon-london phpapp01/95/nosql-overview-neo4j-intro-and-production-example- qcon-london jpg?cb=

Verteilte Datenstruktur Ausführungsgraphen definieren  Lazy Evaluation Scala/JVM Bibliotheken

Spark REPL-API Read – Eval – Print – Loop

13 Die Daten bleiben da wo sie sind Datenschutz freut sich! Den Code kann man Wiederverwenden Leicht lesen Warten Testen In Produktivlogik direkt einbinden Ergebnisse sind Nachvollziehbar Reproduzierbar Frei von Sampling-Effekten Schnell verfügbar Echtzeitfähig Präsentierbar Integration!

14 Spark Mesos Akka Cassandra Kafka SMACK!

15 SMACK! Mesos Kafka C* Spark Akka

16 Beispielsablauf Kafka C* Spark Nexus Z Z ZCli ent Git Jenkins Spark Kafka Reports

17 Data-DevOps Einbeziehung von QS/Test: Dummy-Daten für Integrationstests Data-Science-Tester Code-Review durch Entwickler Eingliederung in agiles Projektmanagement Definition of Done für Erkenntnisse aus Daten? Delivrables! Gesamtverständnis des Produkts Shared Hardware – Shared Knowledge Durch Verwendung von Kollaborationsplattformen Wiederverwendung von Code und Methodik Transparente Prozesse Besserer Wissenstransfer Bessere Dokumentation Bessere Kollaboration Integration

18 Optimierter Entwicklungsprozess Wenn man die Investition in das nötige Know-How macht Interaktive Entwicklungsumgebung Mit noch eingeschränkter Verfügbarkeit von Bibliotheken Ohne den Komfort einer IDE Kein Vendor-Lock-In Aber meist nur Support des bestehenden Funktionsumfangs Skalierbare Lösung Wenn man von Anfang an die Skalierbarkeit beachtet Für und Wider – pragmatisch betrachtet

19 Rapid Miner im Cluster? Radoop!? ….oder SeaHorse, was dank Spark funktioniert DAGs aus DAGs! Python! Seahorse

20 Was muss ein Data Scientist eigentlich dürfen? Daten lesen Ergebnisse schreiben Vorgehen dokumentieren Aber auch Fehler machen? Beliebige Software installieren? (Roh-)Daten mitnehmen? Data Science ist KEIN Hacking Sondern Datengetriebene-Entwicklung Prototypen ja – aber keine Bastelei Wissenschaft toleriert kein Chaos Ein Wort zu Flexibilität

WidasConcepts HighEnd-Technology requires HighEnd-Competence ( Wir beraten Sie gerne WidasConcepts GmbH Maybachstraße Wimsheim Rick Moritz, Big Data Scientist Telefon:+49 (7044) – 100 Mobile: Dieses Dokument wurde von WidasConcepts erstellt. Die Verteilung, Zitierung und Vervielfältigung – auch auszugsweise – zum Zwecke der Weitergabe an Dritte ist nur mit vorheriger schriftlicher Zustimmung von WidasConcepts gestattet.