Kontakt
Kompetentes und unabhängiges Wissen für IT-Profis.
Konferenzen, Workshops und Webinare.
Datum auf Anfrage
Uhrzeit 09:00 - 17:00 Uhr
Preis 1820,00 € *
Frühbucher 1638,00 € *
max. 15 Teilnehmer
online
Dieser Workshop zeigt Ihnen, wie sich große Datenmengen automatisiert erschließen, und sich daraus wichtige Erkenntnisse gewinnen lassen.
Jedes Unternehmen hat sie in großer Menge, alle fürchten sich davor: Daten in Textform. Über viele Jahre hat sich meistens ein erkleckliches Datenarchiv angesammelt, aber niemand hat sich um die Struktur und die Ablage gekümmert. Dabei finden sich in diesen Datensätzen oft wahre Schätze wie Studien oder Anforderungsanalysen, die ein Mitarbeiter vielleicht schon vor Jahren durchgeführt hat, an die sich aber niemand mehr erinnert.
Nach diesem Workshop können Sie
Textdaten aus verschiedenster (auch ganz alten) Formaten verarbeiten
gescannte Daten in Text verwandeln
Dokumentenarchive strukturieren (Clustering, Topic Modeling)
Texte klassifizieren (Keywords vergeben)
Texte wiederfinden (Information Retrieval)
verschiedenste Fragen zu Texten beantworten (Question Answering)
Zielgruppe
Dieser Workshop richtet sich an Datenanalysten, Content-Managerinnen, Document-Management-Spezialisten und Entwicklerinnen.
Voraussetzungen
Idealerweise verfügen Sie über
Um den Installationsaufwand in Grenzen zu halten, werden Jupyter-Notebooks bereitgestellt, die sich wahlweise auch auf Google Colab ausführen lassen. Die Arbeit in diesem Workshop erfolgt sehr praxisorientiert mit lediglich kurzen Theorie-Blöcken. Die Jupyter-Notebooks können als Blaupausen für eigene Aufgaben dienen.
Zur Workshop-Durchführung wird Zoom verwendet mittels eines DSGVO-konformen On-Premise-Connectors. Wir bitten Sie, ein Mikrofon oder Headset sowie einen aktuellen Browser zu nutzen.
Inhalte (für mehr Details auf die einzelnen Punkte klicken)
Datenextraktion
Unterschiedliche Datenformate (PDF, Word, Excel, Powerpointm aber auch Legacy-Formate wie WordPerfect, usw.)
Extraktion mit Apache Tika
Textextraktion aus HTML
Textextraktion aus gescannten Dokumenten mit Tesseract
Strukturerkennung
Unüberwachte Lernverfahren
Kurze Einführung in Vektorisierung
Topic Models
Clustering-Verfahren
Klassifikationsverfahren
Klassische Verfahren wie Support Vector Machines (SVM)
Moderne Verfahren mit Finetuning wie BERT
Erzeugung von gelabelten Datensets mit geringem manuellem Aufwand
Information Retrieval
Klassisches Scoring mit TF/IDF und BM25
Semantische Methoden mit Word Embeddings
Kontextualisierte Verfahren mit Sprachmodellen
Kombination z.B. mit Passage Retrieval
Question Answering
Segmentierung der Texte in Sätze oder Absätze
Berechnung von Sentence Embeddings
Nutzung von spezifischen Sprachmodellen
Cross-Encoder zum verbesserten Ranking
Autoencoder, Variations-Autoencoder (VAE)
Siamesische Netzwerke in Pytorch
Generative Modelle
Generative Adversarial Networks (GANs)
Deepfake
Unüberwachte Lernverfahren
Kurze Einführung in Vektorisierung
Topic Models
Clustering-Verfahren
Trainer
Dr. Christian Winkler
Data Scientist und Machine Learning Architect. Er promovierte in theoretischer Physik und arbeitet seit 20 Jahren im Bereich großer Datenmengen und Künstliche Intelligenz, insbesondere mit Fokus auf skalierbaren Systemen und intelligenten Algorithmen zur Massentextverarbeitung. Er ist Gründer der datanizing GmbH, Referent auf Konferenzen und Autor von Artikeln zu Machine Learning und Text Analytics.
Leistungen Ihres Workshoptickets
Durchführung
Ist die Durchführung der Veranstaltung aufgrund höherer Gewalt, wegen Verhinderung eines Referenten, wegen Störungen am Veranstaltungsort oder aufgrund zu geringer Teilnehmerzahl (weniger als 50%) nicht möglich, werden die Teilnehmer spätestens 7 Tage vorher durch das heise Events-Team informiert.
Jetzt Tickets buchen
10% Frühbucherrabatt bis 4 Wochen vor Veranstaltungsbeginn
Bitte nutzen Sie für den Ticketkauf eine E-Mail-Adresse, auf die Sie freien Zugriff haben.
* Preise beinhalten 19% Mehrwertsteuer.
Haben Sie Fragen zur Organisation oder der Veranstaltung? Gern beantworte ich Ihre Fragen per E-Mail.
Anna Ludwig
Projektmanagerin Workshops