Software

Einige Übungsaufgaben verlangen eine Implementierung von bekannten Lernverfahren innerhalb einer RapidMiner-Extension. Folgende Anleitung soll helfen eine funktionierende Entwicklungsumgebung zur Bearbeitung dieser Aufgaben einzurichten. Diese Informationen sind auch hilfreich zur Erstellung eigener Extensions in RapidMiner.

Als IDE wird hierbei Eclipse verwendet. Prinzipiell kann auch jede andere IDE oder ein Texteditor verwendet werden, wobei die einzelnen Schritte dann jeweils angepasst werden müssen.

Importieren der Projekte

  1. Installation von Eclipse inkl. Subclipse (eingebauter Subversion-Client). Subclipse kann direkt über Eclipse installiert werden. Hierfür klickt man innerhalb von Eclipse auf "Help", dann auf "Install New Software", fügt als Update-Seite http://subclipse.tigris.org/update_1.6.x hinzu, markiert alle Checkboxen und fährt im Dialog fort.
  2. Als nächstes wird der Quellcode von RapidMiner 5 (Vega) und eine vorbereitete Lehre-Extension aus

    https://www-ai.cs.uni-dortmund.de/svn/MLV-uebung/

    in Eclipse geladen, indem man in Eclipse 'File -> Import... -> SVN -> Checkout Projects from SVN' angibt. Die zu verwendende Repository-Location ist

    https://www-ai.cs.uni-dortmund.de/svn/MLV-uebung/

    Unter dieser Location liegen zwei Eclipse-Projekte:

    • RapidMiner_Vega: Dies ist der Quellcode von RapidMiner 5. Dieses Projekt sollte als erstes importiert werden. Wichtig ist, dass der Name des Projektes beibehalten werden muss, da ansonsten die Konfiguration der Extension angepasst werden muss.
    • RapidMiner_Extension_MLV: Das ist der Quellcode der RapidMiner Extension für die Implementierung der Übungsaufgaben.

  3. Die zu implementierenden Klassen sind innerhalb der Extension zu finden. Welche Klassen implementiert werden müssen, ist den Übungsblättern zu entnehmen.

Installieren der Extension

Zum Installlieren der Extension liegt eine Ant-Build Datei zur Verfügung, die die Extension kompiliert und in den lib/plugins von RapidMiner_Vega kopiert und somit die Extension installiert. Hierfür muss das Ant-Target install aufgerufen werden. Dieses Target wird automatisch aufgerufen, wenn innerhalb von Eclipse im Projekt RapidMiner_Extension_MLV die Datei build.xml mit der rechten Maustaste angeklickt wird und innerhalb des Kontextmenüs 'Run as... -> Ant Build' gewählt wird. In der Eclipse Konsole kann man nun sehen, wie die Extension kompiliert und installiert wird.

Anschließend kann nun RapidMiner_Vega gestartet werden. Dies geschieht über einen Rechtklick auf RapidMiner_Vega und dann 'Run as... -> Java Application'. Eclipse sucht jetzt nach der der Main-Klasse. Zum Start von RapidMiner muss hier com.rapidminer.gui.RapidMinerGUI angegeben werden. Bei der Operatoren sollte es nun einen Ordner namens MLV Exercise geben. Hier tauchen die implementierten Operatoren aus der Extension auf.

Debuggen der Extension

Als letzten Schritt konfigurieren wir Eclipse so, dass RapidMiner inkl. der installierten ML-Lehre Extension im Debug-Modus gestartet wird. So können die Operatoren mit den gewohnte Debug-Mö von Eclipse getestet werden.

Vor jedem Debuggen muss erst einmal über das Ant-Target install (siehe oben) die Extension installiert werden. Während des Debuggens kann dann der Code innerhalb der Extension verändert werden und wird dann auch direkt so ausgeführt. Wird RapidMiner jedoch neu gestartet, dann muss das Ant-Target wieder ausgeführt werden.

Im folgenden ist beschrieben, wie die "Debug Configuration" erstellt wird.

  1. Rechter Mausklick auf das Projekt RapidMiner_Vega, dann auf Debug as und anschließend auf Debug configurations ..
  2. Klick auf Java Applications und auf den New-Button. Dieser erzeugt eine Konfiguration, die nun noch angepasst werden muss. Für diese Konfiguration kann auch ein beliebiger Name gewählt werden.
  3. Unter dem Tab Main und unter Main class muss wieder com.rapidminer.gui.RapidMinerGUI angegeben werden.
  4. Unter Arguments und dann unter VM arguments muss nun folgende Zeile eingetragen werden:
    -Drapidminer.operators.additional=resources/com/rapidminer/resources/OperatorsMLV.xml
  5. Unter Classpath auf User Entries klicken und dann auf den Add Projects..-Button, wo dann das Projekt mit der Extension hinzugefügt wird.

Testen der Implementierung

Nachdem die geforderten Operatoren implementiert sind und die Extension gestartet ist, kann die Implementierung validiert werden. Für jeden zu implementierenden Operator liegen im Repository ML unter processes Prozesse bereit, die überprüfen, ob der Operator die richtigen Ergebnisse liefert. Um dies zu testen, muss der jeweilige Prozess geöffnet werden und im Menü unter MLV kann nun Test Operator angeklickt werden. Der Test-Prozess startet und am Ende erscheint ein Dialog, ob der Operator erfolgreich getestet wurde oder nicht.

Implementierung abgeben

Nachdem der Operator implementiert und getestet ist, kann die Implementierung abgegeben werden. Hierfür startet man das Ant-Target install (siehe oben). Im Ordner lib/plugins innerhalb des Projektes RapidMiner_Vega befindet sich die Datei rapidminer-MLV-5.0.000.jar (Falls die Datei nicht sichtbar ist, muss unter Umständen der Ordner aktualisiert werden. Hierfür muss auf den Ordner lib geklickt und anschließend F5 gedrückt werden). Bei dieser Datei handelt es sich um die Abgabe.