Newsletter

   Kontakt

Automatisierte Textanalyse mit Machine Learning

(3-tägiger iX-Workshop mit optionalem 4. Tag)

300 Mails an den Kundenservice pro Tag, jede einzelne muss manuell kategorisiert werden. 70.000 Verträge ohne automatisiertes Ablagesystem. 1.000 Online-Reviews zu einem Produkt, die für die Einkaufsverhandlung alle der Reihe nachgelesen werden müssen. 30 Leserkommentare pro Minute in der eigenen Online Community und der Community Manager entdeckt die dringendsten eher per Zufall.


Fortgeschrittene Methoden der Textanalyse helfen, bisher manuell durchgeführte und dadurch zeitaufwändige und fehlerbehaftete Prozesse der Verarbeitung großer Mengen von Text effizienter zu gestalten oder überhaupt erst zu ermöglichen. Außerdem bieten sie viel Potenzial, Kosten einzusparen, sich einen Wettbewerbsvorsprung durch neues Wissen zu erarbeiten – und die Nerven der eigenen Mitarbeiter zu schonen.


Natural Language Processing (NLP), Clustering, Topic Modelling, Klassifikation, Universal Embeddings – bei den KI-Technologien für die automatisierte Verarbeitung von Textmengen gibt es im Moment viele verschiedene Entwicklungsrichtungen. Sie lösen teils ganz unterschiedliche Probleme und entfalten ihre größte Leistungsfähigkeit erst, wenn man sie geschickt kombiniert.


Der Referent Christian Winkler hat gemeinsam mit seiner Kollegin Stefanie Fischer in ihrem Startup datanizing einen Textanalyse-Service entwickelt, der die gesamte Verarbeitungspipeline automatisiert – von der Texterfassung über die Bereinigung der Texte und die Anreicherung mit Hilfe von Machine Learning bis zur visuellen Darstellung der Erkenntnisse in einem Dashboard. In diesem Workshop gibt er Einblicke in ihre Erfahrungen, Arbeitsweisen und Algorithmen. Die Teilnehmer lernen an einem praktischen Beispiel alle Stufen eines anspruchsvollen Text-Analytics-Projekts kennen und erlangen Praxiswissen in den wichtigsten State-of-the-Art Techniken zur automatisierten Textanalyse.

Zielgruppe

Der Workshop richtet sich an Entwickler, Software-Architekten und Data Scientists, die sich mit der Massenverarbeitung von Text beschäftigen möchten.

Voraussetzungen

Bitte bringen Sie Ihren eigenen Laptop mit! 

Vorkenntnisse in Python sind hilfreich. Die Teilnehmer erhalten vor dem Training ein Jupyter-Notebook, um gegebenfalls ihre Python-Kenntnisse aufzufrischen und sich mit dem Umgang mit Jupyter-Notebooks vertraut zu machen. Jupyter Notebook ist eine Open-Source-Software, in der sich Code, Text und Grafiken interaktiv erstellen, bearbeiten und ausführen lassen und die sich hervorragend zur Implementierung von Prototypen in Python eignet (www.jupyter.org). Nach Installation der Software können Sie unser Jupyter-Notebook darin laden.

Leistungen Ihres Workshoptickets

  • Workshopunterlagen
  • Tagungsgetränke & Verpflegung
  • Teinahmebescheinigung


Der Workshop ist auf 20 Teilnehmer begrenzt!

Durchführung

Ist die Durchführung der Veranstaltung aufgrund höherer Gewalt, wegen Verhinderung eines Referenten, wegen Störungen am Veranstaltungsort oder aufgrund zu geringer Teilnehmerzahl (weniger als 50%) nicht möglich, werden die Teilnehmer spätestens 14 Tage vorher durch das heise Events-Team informiert.

Kontakt

Haben Sie Fragen zu der Organisation oder der Veranstaltung? Gern beantworte ich Ihre Fragen per E-Mail!

Jennifer Rypalla // jery@heise.de

Termine & Preise

Online - Workshop

Nehmen Sie jetzt unkompliziert an unserem Online-Workshop teil.

Alles, was Sie dafür benötigen, ist ein Mikrofon oder Headset an Ihrem Rechner oder Laptop und einen aktuellen Browser. Selbstverständlich sind die Inhalte online die gleichen wie in dem Präsenz-Workshop. Sie können Fragen stellen und sich mit dem Referenten und den anderen Teilnehmern austauschen. Die auf 15 Personen begrenzte Teilnehmerzahl garantiert ein effektives und abwechslungsreiches Lernerlebnis – sicher und bequem in Ihrem Arbeitsumfeld.

Nach dem Kauf eines Tickets erhalten Sie eine Bestätigung per Mail und kurz vor der Veranstaltung in einer separaten Mail Ihren Zugangslink. Bitte nutzen Sie daher für den Ticketkauf eine E-Mail-Adresse, auf die Sie freien Zugriff haben!

Für diesen Kurs verwenden wir BigBlueButton. Für die Teilnahme ist es nicht erforderlich, einen Account bei BigBlueButton anzulegen. Die Teilnahme kann im Browser oder über den Desktop-Client von BigBlueButton erfolgen


17. - 20.11.2020, jeweils 09:00 - 17:00 Uhr


Tickets Online-Workshop

Tag 1 - 3 

Frühbucherpreis: 2.250,00 € *

Standardpreis: 2.475,00 €

Alle Preise inkl. MwSt.

Tag 4 (optional) 

Frühbucherpreis: 730,00 € *

Standardpreis: 803,00 €

Alle Preise inkl. MwSt.

* Rechtzeitig buchen und 10% Frühbucherrabatt erhalten!

Agenda & Trainer

Tag 1

  • 08:30 - 09:00 Uhr Registrierung

  • 09:00 - 12:00 Uhr Einführung / Python und Jupyter

  • 12:30 - 13:30 Uhr Mittagspause

  • 13:30 - 17:00 Uhr NLP und Textaufbereitung / Statistische Analyse von Text und Metadaten

Tag 2

  • 09:00 - 12:30 Uhr Überblick Machine Learning / Vektorisierung von Text

  • 12:30 - 13:30 Uhr Mittagspause

  • 13:30 - 17:00 Uhr Unüberwachtes Lernen: Clustering Topic Modelling

Tag 3

  • 09:00 - 12:30 Uhr Überwachte Lernverfahren / Metriken und Ergebniskontrolle

  • 12:30 - 13:30 Uhr Mittagspause

  • 13:30 - 17:00 Uhr Word Embeddings

Tag 4 (optional)

  • 09:00 - 17:00 Uhr Content-Akquisition: Extraktion und Aufbereitung von Textmaterial aus unterschiedlichen Quellen für die Analyse

Jeweils 15 Minuten Kaffeepause am Vor- und Nachmittag.

Dr. Christian Winkler

Data Scientist und Machine Learning Architect. Er promovierte in theoretischer Physik und arbeitet seit 20 Jahren im Bereich großer Datenmengen und Künstliche Intelligenz, insbesondere mit Fokus auf skalierbaren Systemen und intelligenten Algorithmen zur Massentextverarbeitung. Er ist Gründer der datanizing GmbH, Referent auf Konferenzen und Autor von Artikeln zu Machine Learning und Text Analytics.