Lexikonbasierte Sentimentanalyse

Die Sentiment-Analyse ist ein Teilaspekt des Text Mining, das ein Teilgebiet der Computerlinguistik ist. Sie analysiert durch computergestützte Verfahren Meinungen und klassifiziert sie als positiv, negativ oder neutral. Besonders in der Wirtschaft, aber auch in der Gesellschaft spielt das Feedback für die Weiterentwicklung eine wichtige Rolle.

Ziel dieses Programmierprojekts war es, eine lauffähige Software zu entwickeln, die mithilfe von SentiWS maschinell die Valenz von Sätzen bestimmt und die Ergebnisse übersichtlich darstellt. Dabei sollte vor allem die Eignung bzw. die Schwierigkeiten dieses Ansatzes getestet werden, was durch den Abgleich einer zuvor erstellten manuellen Annotation der Sätze erreicht wurde.

Automatische Verschlagwortung

Ein weit verbreiteter Aufgabenbereich des Natural Language Processing ist das Information Retrieval. Bei diesem geht es insbesondere darum, wie Informatonseinheiten repräsentert, gespeichert und organisiert werden. In Anbetracht der wachsenden Menge an Daten im Internet, bedingt unter anderem durch die steigenden Nutzerzahlen, wird diese Aufgabe zunehmend wichtig.

Die meisten Information-Retrieval-Systeme basieren heutzutage auf einer automatischen Indexierung (Verschlagwortung) von Dokumenten.

Im Rahmen dieser Programmierübung wurden 1257 Texte vorverarbeitet und unter Berücksichtigung einer Stoppwortliste mit dem tf-idf-Maß verschlagwortet.