Hauptnavigation

Pages about teaching are available in German only Zurück zu der Liste der Abschlussarbeiten

Entdeckung von relevanten Inhalten für Stimmungsanalyse

Title Entdeckung von relevanten Inhalten für Stimmungsanalyse
Description

Automatische Stimmungsanalysen aus Webtexten (Sentiment Analysis, Opinion Mining) haben sich zu einem wichtigen Anwendungsfall für Text und Web Mining entwickelt. Das prinzipielle Vorgehen der Analyse bestehend aus der Vorverarbeitung von Texten beispielsweise mit Verfahren wie TDIDF und der nachfolgenden Modellerung ist gut untersucht und funktioniert in der Praxis sehr gut. Das Problem besteht nun vielmehr in der Sammlung der Daten und der Erkennung der relevanten Inhalte. Ist man beispielsweise an der Stimmungsanalyse zu einem bestimmten Unternehmen interessiert, so möchte man auch nur die für dieses Unternehmen relevanten Textpassagen analysieren. Auf den ersten Blick wirkt dies trivial: Man könnte einfach Absätze wählen und extrahieren, bei denen der interessierende Unternehmensname oder das interessierende Stichwort vorkommen. Bleiben wir beim Beispiel Microsoft, so könnte man jedoch auch das folgende Konstrukt "Das Unternehmen aus Redmond..." verwenden und Microsoft damit meinen. Ganz allgemein stellt sich also nun die Frage nach den relevanten Textbausteinen, um Passagen mit anderen Themen oder auch vollständig irrelevante Bereiche wie beispielsweise einen Footer aus einem Forum zu entfernen. Das Ziel dieser Arbeit ist die Implementierung der notwendigen Operatoren im Open Source Analysesystem RapidMiner für diese Extraktionen und die Umsetzung der Datensammlung aus Nachrichten, Foren, Blogs und Quellen wie Twitter für die automatisierte Stimmungsanalyse mit Hilfe von RapidMiner-Prozessen. Diese Arbeit wird in Zusammenarbeit mit Rapid-I, dem Open Source Entwickler von RapidMiner, durchgeführt.

Second Tutor Pfahler, Lukas
Status Entwurf