Newsletter

   Kontakt

Kompetentes und unabhängiges Wissen für IT-Profis. 

Konferenzen, Workshops und Webinare.

Big Data-Analyse mit PySpark -
Skalierbare Datenverarbeitung auf dem Cluster

  • Datum 04. - 05.11.2021

  • Uhrzeit 10:00 - 17:00 Uhr

  • Preis 908,00 €

  • Frühbucher 825,00 €

  • max. 15 Teilnehmer

  • online

Apache Spark ist als Distributed Computing Engine fester Bestandteil vieler aktueller Big Data-Plattformen und -Strategien. Spark ermöglicht es Workflows der Datenanalyse durch die parallelisierte Ausführung auf einem Cluster beliebig zu skalieren. Dazu zählen Lösungen für die Verarbeitung von Textdaten, tabellarische Daten, Graph-Datensätze, Streaming-Anwendungen sowie Machine Learning-Algorithmen. Die PySpark-API verbindet die Spark Engine mit der Python-Welt. 

Dieser zweitägige Intensivkurs bietet eine gründliche Einführung in das Framework und vermittelt grundlegende Paradigmen sowie die handwerklichen Fähigkeiten anhand von Praxisübungen. Produktivität im Umgang mit der Spark-API und Skalierbarkeit der entwickelten Lösungen gehören zu unseren Hauptzielen.

Zielgruppe

Der Kurs richtet sich an Softwareentwickler:innen, Data Scientists, Data Engineers und andere mit dem Ziel, die Plattform Spark für die Verarbeitung und Analyse großer Datenmengen zum Einsatz zu bringen. Wir betrachten Spark aus der Anwenderperspektive.

Voraussetzungen

  • Praxisbezug zu Big Data-Anwendungen sowie sichere Grundkenntnisse in der Programmiersprache Python werden für den Einstieg benötigt.
  • Die Materalien des Workshops sind auf Englisch. Die Unterrichtssprache ist Deutsch.
  • Wir empfehlen Spark als Ergänzung zu den Werkzeugen, die wir im Grundkurs "Datenanalyse mit Python” vorstellen.

Für diesen Kurs verwenden wir die OpenSource Plattform BigBlueButton. Alles, was Sie dafür benötigen, ist ein Mikrofon oder Headset und einen aktuellen Browser (Firefox/ Chrome). 

Inhalte

Trainer

Dr. rer. nat. Christian Staudt

unterstützt als Freelance Data Scientist Auftraggeber bei Herausforderungen rund um Data Mining, Big Data, Machine Learning und Artificial Intelligence. Als Referent ist er in der Community um Python und Data Science aktiv. Vor dem Wechsel in die Industrie war Christian in der Forschung zu Algorithmen für die skalierbare Datenanalyse tätig. Gemeinsam mit Point 8 realisiert er Data Science-Workshops für Einsteiger und Fortgeschrittene.

Leistungen Ihres Workshoptickets

  • Workshopunterlagen
  • Teilnahmebescheinigung

Durchführung

Ist die Durchführung der Veranstaltung aufgrund höherer Gewalt, wegen Verhinderung eines Referenten, wegen Störungen am Veranstaltungsort oder aufgrund zu geringer Teilnehmerzahl (weniger als 50%) nicht möglich, werden die Teilnehmer spätestens 7 Tage vorher durch das heise Events-Team informiert.

Jetzt Tickets buchen

10% Frühbucherrabatt bis 4 Wochen vor Veranstaltungsbeginn

04. - 05.11.2021

Bitte nutzen Sie für den Ticketkauf eine E-Mail-Adresse, auf die Sie freien Zugriff haben.

Haben Sie Fragen zur Organisation oder der Veranstaltung? Gern beantworte ich Ihre Fragen per E-Mail.

Jennifer Rypalla

Projektmanagerin Workshops