@misc{Schreiber2016, author = {Schreiber, Marc}, title = {Mit Maximum-Entropie das Parsing nat{\"u}rlicher Sprache erlernen}, publisher = {FH Aachen}, address = {Aachen}, pages = {23 Seiten}, year = {2016}, abstract = {F{\"u}r die Verarbeitung von nat{\"u}rlicher Sprache ist ein wichtiger Zwischenschritt das Parsing, bei dem f{\"u}r S{\"a}tze der nat{\"u}rlichen Sprache Ableitungsb{\"a}ume bestimmt werden. Dieses Verfahren ist vergleichbar zum Parsen formaler Sprachen, wie z. B. das Parsen eines Quelltextes. Die Parsing-Methoden der formalen Sprachen, z. B. Bottom-up-Parser, k{\"o}nnen nicht auf das Parsen der nat{\"u}rlichen Sprache {\"u}bertragen werden, da keine Formalisierung der nat{\"u}rlichen Sprachen existiert [3, 12, 23, 30]. In den ersten Programmen, die nat{\"u}rliche Sprache verarbeiten [32, 41], wurde versucht die nat{\"u}rliche Sprache mit festen Regelmengen zu verarbeiten. Dieser Ansatz stieß jedoch schnell an seine Grenzen, da die Regelmenge nicht vollst{\"a}ndig sowie nicht minimal ist und wegen der ben{\"o}tigten Menge an Regeln schwer zu verwalten ist. Die Korpuslinguistik [22] bot die M{\"o}glichkeit, die Regelmenge durch Supervised-Machine-Learning-Verfahren [2] abzul{\"o}sen. Teil der Korpuslinguistik ist es, große Textkorpora zu erstellen und diese mit sprachlichen Strukturen zu annotieren. Zu diesen Strukturen geh{\"o}ren sowohl die Wortarten als auch die Ableitungsb{\"a}ume der S{\"a}tze. Vorteil dieser Methodik ist es, dass repr{\"a}sentative Daten zur Verf{\"u}gung stehen. Diese Daten werden genutzt, um mit Supervised-Machine-Learning-Verfahren die Gesetzm{\"a}ßigkeiten der nat{\"u}rliche Sprachen zu erlernen. Das Maximum-Entropie-Verfahren ist ein Supervised-Machine-Learning-Verfahren, das genutzt wird, um nat{\"u}rliche Sprache zu erlernen. Ratnaparkhi [25] nutzt Maximum-Entropie, um Ableitungsb{\"a}ume f{\"u}r S{\"a}tze der nat{\"u}rlichen Sprache zu erlernen. Dieses Verfahren macht es m{\"o}glich, die nat{\"u}rliche Sprache (abgebildet als Σ∗) trotz einer fehlenden formalen Grammatik zu parsen.}, language = {de} }