Handelsblatt

MenüZurück
Wird geladen.

22.03.2004

11:00 Uhr

Text-Mining-Programme werten Informationen automatisiert aus

Das lästige Sortieren der Unterlagen erledigt der elektronische Assistent

VonJürgen Fritz (Director Marketing & Strategie der SAS Deutschland)

Lesen bildet, Lesen informiert, Lesen entspannt. Kurzum: Es ist eine großartige Kulturleistung. Mitunter kann Lesen aber auch äußerst mühsam sein. Zum Beispiel, wenn es darum geht, große Mengen an Kundenkorrespondenz zu klassifizieren. Eine Aufgabe, die viele Unternehmen überfordert - mit der Folge, dass wichtige Informationen brach liegen. Ein neues Verfahren namens Text Mining soll Unternehmen dabei helfen, Dokumente automatisiert auszuwerten.

HB DÜSSELDORF. Text Mining verbindet Linguistik und Data-Mining-Verfahren - Analysemethoden, die verborgene Zusammenhänge in großen Datenmengen erkennen können. Das Verfahren kann deshalb funktionieren, weil Sprache eindeutig gegliedert ist, ganz gleich, um welchen Texttyp es sich handelt. Sowohl die Wort- und Satzbildung folgt klaren Mustern als auch die Darstellung von Bedeutungen. Wenn es gelingt es, die Struktur der verwendeten Sprache in einem Dokument zu klassifizieren, so lassen sich die relevanten Informationen herausfiltern. Im Prinzip passiert genau das, was der Mensch beim Lesen selbst täglich tut.

Das Klassifizieren von Texten ist an sich nichts Neues. Bisher lief dies jedoch bestenfalls über automatisierte Stichwortsuchen, die lediglich auf vorgegebene Wortlisten reagieren konnten. Im Gegensatz zu diesem reaktiven Vorgehen können Text-Mining-Verfahren proaktiv Zusammenhänge erkennen, die bis dahin unbekannt waren. Dafür reduzieren die Systeme Worte in Wortstämme, analysieren alle wichtigen Wortkombinationen des Textes und betrachten einzelne Dokumente als Teil einer größeren Textsammlung. So ist gewährleistet, dass sie kontextabhängige Ergebnisse liefern.

Direkt vom Startbildschirm zu Handelsblatt.com

Auf tippen, dann auf „Zum Home-Bildschirm“ hinzufügen.

Auf tippen, dann „Zum Startbildschirm“ hinzufügen.

×