Machine Learning Workflows mit git, dvc und mlflow
-
Datum Termin auf Anfrage
-
Uhrzeit 09:00 - 13:00 Uhr
-
Preis 1.820,00 € *
-
Frühbucher 1.638,00 € *
-
max. 15 Teilnehmer
-
online
Die moderne Entwicklung von Machine-Learning-Modellen ist ein sehr dynamischer Prozess. Es arbeiten viele Personen gemeinsam an sich kontinuierlich änderndem Code, Daten, Modell-Designs, Trainingsroutinen und Hyperparametern. Dabei ist es essenziell, stets der Überblick zu behalten und die Funktionalität sicherzustellen.
In diesem Online-Workshop lernen Sie an vier Vormittagen, wie Sie Ihre ML-Modelle mit Versionierung und Reproduzierbarkeit der Ergebnisse fit für den Praxiseinsatz im Betrieb machen:
-
Aufbau und Integration eines modernen Entwickler-Stacks für Machine Learning
-
Tools für iteratives Machine Learning zur Versionierung und Reproduzierbarkeit beherrschen
-
Vergleich des Open-Source-Stacks mit den kommerziellen Produkten der Cloud-Provider
Zielgruppe
- Softwareentwickler, die sich bereits mit den Grundlagen von Machine Learning oder mit einem Teilgebiet des maschinellen Lernens (NLP, CV, Robotics) beschäftigt haben
- Data Scientists
Voraussetzungen
- Grundkenntnisse Python und Machine Learning
- Vorbereitung
Sie sollten Ihren Rechner wie folgt vorbereiten:- VS Code installieren
- VS Code Extension: “Remote - SSH” installieren
- SSH-Client installieren
- Sicherstellen, dass eine SSH-Verbindung vom eigenen Rechner zu Servern im Internet möglich ist (im Workshop verwenden wir VMs in AWS, zu denen eine SSH-Verbindung hergestellt wird)
Hinweis: Bei Verwendung von Firmenlaptops und VPN stellen Sie bitte vorher sicher, dass eine solche SSH-Verbindung funktioniert.
Zur Workshop-Durchführung wird Zoom verwendet mittels eines DSGVO-konformen On-Premise-Connectors. Wir bitten Sie, ein Mikrofon oder Headset sowie einen aktuellen Browser zu nutzen.
Inhalte (für mehr Details auf die einzelnen Punkte klicken)
Anhand eines Anwendungsbeispiels wird der Workshop einen iterativen Data-Science-Ablauf mit gängigen Werkzeugen wie dvc, mlflow, git, docker und einigen mehr abbilden. Sie lernen, wie die Versionierung nicht nur von Code, sondern auch von Daten und Modellen erfolgt, wie sich ML-Experimente übersichtlich verwalten lassen und wie Sie stets reproduzierbare Ergebnisse erreichen.
Der Fokus liegt dabei auf einem cloud-agnostischen Open-Source-Stack. Am letzten Workshoptag erhalten Sie jedoch auch einen kleinen Überblick über die Tools und Möglichkeiten, die die großen Cloud-Anbieter AWS, Azure und GCP in diesem Bereich als eigene Produkte zu bieten haben.
Keine Jupyter-Notebooks – In diesem Workshop bildet eine moderne ML-Entwicklungsumgebung mit VS Code die Basis. In dieser lernen Sie den Einsatz von Tools und Techniken in Code-Along-Sessions. Sie haben in diesem Workshop reichlich Gelegenheit, selbst Aufgaben zu lösen. Die Referenten gehen dabei stets auf Ihre Fragen ein und freuen sich auf eine interaktive Veranstaltung.
-
Entwicklungsumgebung
- Einführung
- Überblick über den kompletten Tech Stack des Kurses (git, DVC, mlflow, …)
- Einstieg in den Anwendungsfall
- Moderne Machine Learning Entwicklung mit VS Code, project templates, conda und Best Practices für Software Engineering in ML
-
Daten
- Code-Versionierung mit git
- Anwendung von DVC
- Versionierung von Daten
- Reproduzierbare Pipelines zu Datenverarbeitung
- Validierung und Testen von Daten
-
Modelle
- Iterativer Data Science Arbeitsablauf mit mlflow
- Experiment Definition und Parametrisierung
- Experiment-Erfassung und Überwachung
- Artefakt-Speicherung und Model-Registrierung
- Validierung und Tests von Modellen
- Modell-Analyse und Verständnis
- Iterativer Data Science Arbeitsablauf mit mlflow
-
MLOps und Ausblick
- Docker für produktionsreifes Machine Learning
- Hyperparameter Tuning
- Modell-Kompression und Laufzeitoptimierung
- Ausblick
- Automatisierung für CI / CD
- Datenzentriertes ML
- Fairness in Machine Learning
- Kontinuierliches Monitoring im Betrieb
- Non-open-source Produkte der Cloud Provider
Trainer
Philipp Braunhart
Philipp Braunhart ist Data Scientist, Mitgründer von ingenio ai und studierter Physiker und IT-Ingenieur. Für und mit Kunden entwickelt er auf der Basis gängiger, skalierbarer Infrastruktur KI-Modelle für den direkten Einsatz in den Bereichen Bio-, Agrar- und Medizin-Technologie. Dabei steht immer der reale Nutzen im Fokus. Bei diesen Tätigkeiten helfen ihm seine Industrie-Erfahrungen von Siemens. Mit viel Freude gibt er sein Wissen weiter und begeistert andere für Machine Learning.
Moustapha Karaki
Moustapha Karaki ist Data Scientist, Mitgründer von ingenio ai und studierter Maschinenbauer und IT-Ingenieur. Er schätzt die enge und lösungsorientierte Zusammenarbeit mit Kunden, bei der er den realen Mehrwert immer im Blick hat. Dabei betrachtet er KI aus einer ganzheitlichen Perspektive und konzentriert sich daher auf End-to-End-KI-Lösungen und KI-Architektur. Derzeit unterstützt er KMUs in der Bio-, Agrar- und Medizinbranche bei ingenio ai und Großunternehmen in den Bereichen Automotive, Produktion und erneuerbare Energien bei IBM.
Leistungen Ihres Workshoptickets
- Workshopunterlagen
- Teilnahmebescheinigung
Durchführung
Ist die Durchführung der Veranstaltung aufgrund höherer Gewalt, wegen Verhinderung eines Referenten, wegen Störungen am Veranstaltungsort oder aufgrund zu geringer Teilnehmerzahl (weniger als 50%) nicht möglich, werden die Teilnehmer spätestens 7 Tage vorher durch das heise Events-Team informiert.
Jetzt Tickets buchen
10% Frühbucherrabatt bis 4 Wochen vor Veranstaltungsbeginn
Bitte nutzen Sie für den Ticketkauf eine E-Mail-Adresse, auf die Sie freien Zugriff haben.
* Preise beinhalten 19% Mehrwertsteuer.
Haben Sie Fragen zur Organisation oder der Veranstaltung? Gern beantworte ich Ihre Fragen per E-Mail.
Jennifer Rypalla
Projektmanagerin Workshops