Automatisierte Textanalyse mit Machine Learning

(3-tägiger iX-Workshop mit optionalem 4. Tag)

300 Mails an den Kundenservice pro Tag, jede einzelne muss manuell kategorisiert werden. 70.000 Verträge ohne automatisiertes Ablagesystem. 1.000 Online-Reviews zu einem Produkt, die für die Einkaufsverhandlung alle der Reihe nachgelesen werden müssen. 30 Leserkommentare pro Minute in der eigenen Online Community und der Community Manager entdeckt die dringendsten eher per Zufall.


Fortgeschrittene Methoden der Textanalyse helfen, bisher manuell durchgeführte und dadurch zeitaufwändige und fehlerbehaftete Prozesse der Verarbeitung großer Mengen von Text effizienter zu gestalten oder überhaupt erst zu ermöglichen. Außerdem bieten sie viel Potenzial, Kosten einzusparen, sich einen Wettbewerbsvorsprung durch neues Wissen zu erarbeiten – und die Nerven der eigenen Mitarbeiter zu schonen.


Natural Language Processing (NLP), Clustering, Topic Modelling, Klassifikation, Universal Embeddings – bei den KI-Technologien für die automatisierte Verarbeitung von Textmengen gibt es im Moment viele verschiedene Entwicklungsrichtungen. Sie lösen teils ganz unterschiedliche Probleme und entfalten ihre größte Leistungsfähigkeit erst, wenn man sie geschickt kombiniert.


Die beiden Referenten Stephanie und Christian haben in ihrem Startup datanizing einen Textanalyse-Service entwickelt, der die gesamte Verarbeitungspipeline automatisiert – von der Texterfassung über die Bereinigung der Texte und die Anreicherung mit Hilfe von Machine Learning bis zur visuellen Darstellung der Erkenntnisse in einem Dashboard. In diesem Workshop geben sie Einblicke in ihre Erfahrungen, Arbeitsweisen und Algorithmen. Sie spannen den Bogen von der fachlichen Fragestellung bis zur technischen Lösung. Die Teilnehmer lernen an einem praktischen Beispiel alle Stufen eines anspruchsvollen Text-Analytics-Projekts kennen und erlangen Praxiswissen in den wichtigsten State-of-the-Art Techniken zur automatisierten Textanalyse.

19. - 22.03.2019
Heise Medien GmbH & Co. KG, Karl-Wiechert Allee 10, 30625 Hannover
Zum Ticketshop für den 19. - 22.03.2019

05. - 08.11.2019

DE-CIX Managament GmbH, Lindleystraße 12, 60314 Frankfurt am Main


+++ Sichern Sie sich jetzt 10% Frühbucherrabatt (regulärer Preis: 3.140,00 Euro für alle 4 Tage) +++

+++ Bis 04.02.2019 für Hannover +++ Bis 23.09.2019 10 % für Frankfurt +++

Zielgruppe

Der Workshop richtet sich an Entwickler, Software-Architekten und Data Scientists, die sich mit der Massenverarbeitung von Text beschäftigen möchten.

Voraussetzungen

Vorkenntnisse in Python sind hilfreich. Die Teilnehmer erhalten vor dem Training ein Jupyter-Notebook, um gegebenfalls ihre Python-Kenntnisse aufzufrischen und sich mit dem Umgang mit Jupyter-Notebooks vertraut zu machen. 

Jupyter Notebook ist eine Open-Source-Software, in der sich Code, Text und Grafiken interaktiv erstellen, bearbeiten und ausführen lassen und die sich hervorragend zur Implementierung von Prototypen in Python eignet (www.jupyter.org). Nach Installation der Software können Sie unser Jupyter-Notebook darin laden.

Leistungen Ihres Workshoptickets

  • Workshopunterlagen
  • Tagungsgetränke & Verpflegung
  • Teinahmebescheinigung


Der Workshop ist auf 20 Teilnehmer begrenzt!

Ist die Durchführung der Veranstaltung aufgrund höherer Gewalt, wegen Verhinderung eines Referenten, wegen Störungen am Veranstaltungsort oder aufgrund zu geringer Teilnehmerzahl (weniger als 50%) nicht möglich, werden die Teilnehmer spätestens 14 Tage vorher durch das heise Events-Team informiert.

Kontakt

Haben Sie Fragen zu der Organisation oder der Veranstaltung? Gern antworte ich auf Ihre Anfrage per E-Mail!

Silvia Langer, Event-Manager // sil@heise.de

Agenda & Trainer

Stephanie Fischer

Stephanie Fischer ist Expertin für datengetriebene Geschäftsmodelle, insbesondere wenn es darum geht, maschinelles Lernen auf Text anzuwenden. Sie war als Unternehmensberaterin in den Bereichen Künstliche Intelligenz und Innovation tätig und hat einen Hintergrund in Organisationsentwicklung. Sie ist Referentin auf Konferenzen, Autorin von Artikeln zu Big Data und KI, Teil der Plattform Lernende Systeme und Mitglied des Programmbeirats für den Big-Data.AI Summit des BITKOM.

Dr. Christian Winkler ist Data Scientist und Machine Learning Architect. Er promovierte in theoretischer Physik und arbeitet seit 20 Jahren im Bereich großer Datenmengen und Künstliche Intelligenz, insbesondere mit Fokus auf skalierbaren Systemen und intelligenten Algorithmen zur Massentextverarbeitung. Er ist Gründer der datanizing GmbH, Referent auf Konferenzen und Autor von Artikeln zu Machine Learning und Text Analytics.

Tag 1

08:30 - 09:00 Uhr Registrierung

09:00 - 12:30 Uhr

  • Einführung
  • Python und Jupyter

12:30 - 13:30 Uhr Mittagspause

13:30 - 17:00 Uhr

  • NLP und Textaufbereitung
  • Statistische Analyse von Text und Metadaten


Tag 2
09:00 - 12:30 Uhr

  • Überblick Machine Learning
  • Vektorisierung von Text

12:30 - 13:30 Uhr Mittagspause

13:30 - 17:00 Uhr

  • Unüberwachtes Lernen: Clustering
  • Topic Modelling


Tag 3

09:00 - 12:30 Uhr

  • Überwachte Lernverfahren
  • Metriken und Ergebniskontrolle

12:30 - 13:30 Uhr Mittagspause

13:30 - 17:00 Uhr

  • Word Embeddings


Optionaler Tag 4

09:00 - 17:00 Uhr

Content-Akquisition:
Extraktion und Aufbereitung von Textmaterial aus unterschiedlichen Quellen für die Analyse


Jeweils 15 Minuten Kaffeepause am Vormittag und Nachmittag!

Hotelzimmer

Sie benötigen noch eine Übernachtungsmöglichkeit zur Teilnahme an unserem Workshop? Folgende Hotels in der Nähe der Location können wir Ihnen empfehlen:


Hannover


Frankfurt

Auf Anfrage unter sil@heise.de