Newsletter

   Kontakt

Automatisierte Textanalyse mit Machine Learning

(3-tägiger iX-Workshop mit optionalem 4. Tag)

300 Mails an den Kundenservice pro Tag, jede einzelne muss manuell kategorisiert werden. 70.000 Verträge ohne automatisiertes Ablagesystem. 1.000 Online-Reviews zu einem Produkt, die für die Einkaufsverhandlung alle der Reihe nachgelesen werden müssen. 30 Leserkommentare pro Minute in der eigenen Online Community und der Community Manager entdeckt die dringendsten eher per Zufall.


Fortgeschrittene Methoden der Textanalyse helfen, bisher manuell durchgeführte und dadurch zeitaufwändige und fehlerbehaftete Prozesse der Verarbeitung großer Mengen von Text effizienter zu gestalten oder überhaupt erst zu ermöglichen. Außerdem bieten sie viel Potenzial, Kosten einzusparen, sich einen Wettbewerbsvorsprung durch neues Wissen zu erarbeiten – und die Nerven der eigenen Mitarbeiter zu schonen.


Natural Language Processing (NLP), Clustering, Topic Modelling, Klassifikation, Universal Embeddings – bei den KI-Technologien für die automatisierte Verarbeitung von Textmengen gibt es im Moment viele verschiedene Entwicklungsrichtungen. Sie lösen teils ganz unterschiedliche Probleme und entfalten ihre größte Leistungsfähigkeit erst, wenn man sie geschickt kombiniert.


Die beiden Referenten Stephanie und Christian haben in ihrem Startup datanizing einen Textanalyse-Service entwickelt, der die gesamte Verarbeitungspipeline automatisiert – von der Texterfassung über die Bereinigung der Texte und die Anreicherung mit Hilfe von Machine Learning bis zur visuellen Darstellung der Erkenntnisse in einem Dashboard. In diesem Workshop geben sie Einblicke in ihre Erfahrungen, Arbeitsweisen und Algorithmen. Sie spannen den Bogen von der fachlichen Fragestellung bis zur technischen Lösung. Die Teilnehmer lernen an einem praktischen Beispiel alle Stufen eines anspruchsvollen Text-Analytics-Projekts kennen und erlangen Praxiswissen in den wichtigsten State-of-the-Art Techniken zur automatisierten Textanalyse.

Zielgruppe

Der Workshop richtet sich an Entwickler, Software-Architekten und Data Scientists, die sich mit der Massenverarbeitung von Text beschäftigen möchten.

Voraussetzungen

Bitte bringen Sie Ihren eigenen Laptop mit! 

Vorkenntnisse in Python sind hilfreich. Die Teilnehmer erhalten vor dem Training ein Jupyter-Notebook, um gegebenfalls ihre Python-Kenntnisse aufzufrischen und sich mit dem Umgang mit Jupyter-Notebooks vertraut zu machen. Jupyter Notebook ist eine Open-Source-Software, in der sich Code, Text und Grafiken interaktiv erstellen, bearbeiten und ausführen lassen und die sich hervorragend zur Implementierung von Prototypen in Python eignet (www.jupyter.org). Nach Installation der Software können Sie unser Jupyter-Notebook darin laden.

Leistungen Ihres Workshoptickets

  • Workshopunterlagen
  • Tagungsgetränke & Verpflegung
  • Teinahmebescheinigung


Der Workshop ist auf 20 Teilnehmer begrenzt!

Durchführung

Ist die Durchführung der Veranstaltung aufgrund höherer Gewalt, wegen Verhinderung eines Referenten, wegen Störungen am Veranstaltungsort oder aufgrund zu geringer Teilnehmerzahl (weniger als 50%) nicht möglich, werden die Teilnehmer spätestens 14 Tage vorher durch das heise Events-Team informiert.

Kontakt

Haben Sie Fragen zu der Organisation oder der Veranstaltung? Gern beantworten wir Ihre Fragen per E-Mail!

heise Events // events@heise.de

Termine & Preise

19. - 22.03.2019, Hannover

Heise Medien GmbH & Co. KG, Karl-Wiechert-Allee 10, 30625 Hannover

Tickets Hannover

05. - 08.11.2019, Frankfurt am Main

DE-CIX Managament GmbH, Lindleystraße 12, 60314 Frankfurt am Main

Tickets Frankfurt

Tag 1 - 3 

Frühbucherpreis: 2.120,00 € *

Standardpreis: 2.355,00 €

Alle Preise inkl. MwSt.

Tag 4 (optional) 

Frühbucherpreis: 707,00 € *

Standardpreis: 785,00 €

Alle Preise inkl. MwSt.

* Rechtzeitig buchen und 10% Frühbucherrabatt erhalten!

Agenda & Trainer

Tag 1

  • 08:30 - 09:00 Uhr Registrierung

  • 09:00 - 12:00 Uhr Einführung / Python und Jupyter

  • 12:30 - 13:30 Uhr Mittagspause

  • 13:30 - 17:00 Uhr NLP und Textaufbereitung / Statistische Analyse von Text und Metadaten

Tag 2

  • 09:00 - 12:30 Uhr Überblick Machine Learning / Vektorisierung von Text

  • 12:30 - 13:30 Uhr Mittagspause

  • 13:30 - 17:00 Uhr Unüberwachtes Lernen: Clustering Topic Modelling

Tag 3

  • 09:00 - 12:30 Uhr Überwachte Lernverfahren / Metriken und Ergebniskontrolle

  • 12:30 - 13:30 Uhr Mittagspause

  • 13:30 - 17:00 Uhr Word Embeddings

Tag 4 (optional)

  • 09:00 - 17:00 Uhr Content-Akquisition: Extraktion und Aufbereitung von Textmaterial aus unterschiedlichen Quellen für die Analyse

Jeweils 15 Minuten Kaffeepause am Vor- und Nachmittag.

Stephanie Fischer

Expertin für datengetriebene Geschäftsmodelle, insbesondere wenn es darum geht, maschinelles Lernen auf Text anzuwenden. Sie war als Unternehmensberaterin in den Bereichen Künstliche Intelligenz und Innovation tätig und hat einen Hintergrund in Organisationsentwicklung. Sie ist Referentin auf Konferenzen, Autorin von Artikeln zu Big Data und KI, Teil der Plattform Lernende Systeme und Mitglied des Programmbeirats für den Big-Data.AI Summit des BITKOM.

Dr. Christian Winkler

Data Scientist und Machine Learning Architect. Er promovierte in theoretischer Physik und arbeitet seit 20 Jahren im Bereich großer Datenmengen und Künstliche Intelligenz, insbesondere mit Fokus auf skalierbaren Systemen und intelligenten Algorithmen zur Massentextverarbeitung. Er ist Gründer der datanizing GmbH, Referent auf Konferenzen und Autor von Artikeln zu Machine Learning und Text Analytics.