@inbook{fc299bc745154aa88eb7a3927140c72e,
title = "Text und Text Mining",
abstract = "Text repr{\"a}sentiert Wissen. Im Unterschied zu den strukturierten Daten in einer Datenbank stellen Texte unstrukturierte Daten dar. Eine wichtige Eigenschaft nat{\"u}rlicher Sprachen ist Redundanz. Im Text Mining werden verschiedene Arten von Redundanz genutzt, um W{\"o}rter oder ganze Texte zu klassifizieren sowie strukturelle oder inhaltliche Zusammenh{\"a}nge zwischen W{\"o}rtern zu ermitteln. Dabei ist zu unterscheiden zwischen der Makro-Sicht auf ein ganzes Textkorpus und der Mikro-Sicht auf einzelne W{\"o}rter. Text Mining verwendet regelbasierte, statistische sowie neuronale Verfahren und erlaubt somit innovative Anwendungen, bei denen sehr gro{\ss}e Mengen an Text sehr schnell und sehr umfangreich ausgewertet werden. F{\"u}r das Text Mining ist es meist erforderlich, die linguistische Struktur von Texten zu ber{\"u}cksichtigen. Die Beschreibung linguistischer Strukturen setzt voraus, dass sich Texte in verschiedene linguistische Ebenen untergliedern lassen. Wichtige Ebenen f{\"u}r das Text Mining sind die Ebenen der Morpheme, der W{\"o}rter, der Phrasen und der S{\"a}tze. Auf allen Ebenen finden sich Mehrdeutigkeiten, sprachstatistische Gesetzm{\"a}{\ss}igkeiten und sprachliche Dynamiken.",
author = "Chris Biemann and Gerhard Heyer and Uwe Quasthoff",
year = "2022",
doi = "10.1007/978-3-658-35969-0_1",
language = "English",
isbn = "978-3-658-35968-3",
pages = "1--34",
booktitle = "Wissensrohstoff Text",
publisher = "Springer",
address = "Germany",
}