Lexikonbasierte Sentimentanalyse

Programmierprojekt zum Abschluss des Moduls "Computerlinguistische Programmiertechnik" (Prasch/Ortikov WiSe 2017/18)

Die Sentiment-Analyse ist ein Teilaspekt des Text Mining, das ein Teilgebiet der Computerlinguistik ist. Sie analysiert durch computergestützte Verfahren Meinungen und klassifiziert sie als positiv, negativ oder neutral. Besonders in der Wirtschaft, aber auch in der Gesellschaft spielt das Feedback für die Weiterentwicklung eine wichtige Rolle.

Ziel dieses Programmierprojekts war es, eine lauffähige Software zu entwickeln, die mithilfe von SentiWS maschinell die Valenz von Sätzen bestimmt und die Ergebnisse übersichtlich darstellt. Dabei sollte vor allem die Eignung bzw. die Schwierigkeiten dieses Ansatzes getestet werden, was durch den Abgleich einer zuvor erstellten manuellen Annotation der Sätze erreicht wurde.

Automatische Verschlagwortung

Programmierübung im Rahmen des Seminars "Mathematische Modellierung" (Palm WiSe 2017/18)

Ein weit verbreiteter Aufgabenbereich des Natural Language Processing ist das Information Retrieval. Bei diesem geht es insbesondere darum, wie Informatonseinheiten repräsentert, gespeichert und organisiert werden. In Anbetracht der wachsenden Menge an Daten im Internet, bedingt unter anderem durch die steigenden Nutzerzahlen, wird diese Aufgabe zunehmend wichtig.

Die meisten Information-Retrieval-Systeme basieren heutzutage auf einer automatischen Indexierung (Verschlagwortung) von Dokumenten.

Im Rahmen dieser Programmierübung wurden 1257 Texte vorverarbeitet und unter Berücksichtigung einer Stoppwortliste mit dem tf-idf-Maß verschlagwortet.

Moses - statistical machine translation

Projektarbeit zum Projektseminar "Computerlinguistik" (Henne/Kunterding/Leuschen SoSe 2018)

Ziel der Projektarbeit war die Einrichtung und Dokumentation einer Moses-Installation auf Basis eines Linux-Betriebssystems und das Erstellen eines Benutzerhandbuchs. Moses ist ein System für die statistische maschinelle Übersetzung (SMT) und ist unter der LGPL (GNU Lesser General Public License) lizenziert.

Die Homepage des Moses-Projekts ist unter http://www.statmt.org/moses/ zu erreichen. Das ausführliche Handbuch zur Engine ist ebenfalls über diese Seite zu finden. Mehrsprachige, parallele Korpora sind über das OPUS-Portal unter http://opus.nlpl.eu/ verfügbar. Dort finden sich auch die kompletten, in der aktuellen Installation benutzten Korpora JRC-Acquis und OpenSubtitles2018.