Text Mining

Text Mining

Studienbereich

  • Bachelor-Studienabschnitt, Wahlfach, Wahlkatalog 2, Empfohlenes Semester: 5. / 6. Semester

Anzahl Leistungspunkte (LP)

  • 5 (= 150 Stunden Lernzeit)

Fach

  • Vertiefung

Modulbeauftragter

  • Prof. Dr. Gerhard Heyer

Verwendung des Moduls

  • Bachelor-Studiengang: Web- & Medieninformatik
  • Bachelor-Studiengang: Wirtschaftsinformatik

Lernergebnisse / Kompetenzen

  • Nach Durcharbeitung dieses Moduls wissen die Studierenden, wie Text automatisch semantisch analysiert werden kann.
  • Sie haben die Grundlagen des Text Mining verstanden, können textorientierte Algorithmen anwenden und deren Nutzen bei der Entwicklung von Wissensmanagementlösungen beurteilen.

Inhaltsübersicht

Inhaltsübersicht

  • Wissen und Text
  • Grundlagen der Bedeutungsanalyse
  • Textdatenbanken
  • Sprachstatistik (Zipf’sche Gesetze, bedingte Wahrscheinlichkeiten, Kookkurrenzen, small worlds)
  • Clustering
  • Musteranalyse
  • Hybride Verfahren
  • Beispielanwendungen

Lehrformen/Prüfungen

Lehrformen/Prüfungen

Lehrformen

  • Die Inhalte stehen sowohl als Online-Kurs als auch als Lehrbuch zum Selbststudium zur Verfügung. Die einzelnen Konzepte werden Schritt für Schritt aufeinander aufbauend in kleinen, überschaubaren Wissensbausteinen/Kapiteln vermittelt. Besonderer Wert wird auf jeweils vollständige Beispiele gelegt, die selbst weiterentwickelt werden können.
  • Am Anfang und am Ende jedes Wissensbausteins können die bereits vorhandenen Fähigkeiten oder die im Wissensbaustein erworbenen Fähigkeiten anhand von Tests und Aufgaben überprüft werden.

Teilnahmevoraussetzungen

  • Formal: keine
  • Inhaltlich: Modul Statistik sollte absolviert sein.
  • Inhaltlich: Modul Data Warehouse und Data Mining ermöglicht es, Querbezüge herzustellen.

Prüfungsformen

  • Zweistündige schriftliche Präsenzklausur, die bei Nichtbestehen zweimal wiederholt werden kann. Werden alle Aufgaben richtig gelöst, dann erhält man 100 Punkte. Um die Klausur zu bestehen sind 50 Punkte notwendig.
  • Hilfsmittel: Alle handschriftlichen oder gedruckten Unterlagen.

Voraussetzungen für die Zulassung zur Präsenzklausur

  • Folgende Voraussetzungen müssen für die Zulassung zur Präsenzklausur erfüllt sein: 70% aller Tests, die zu dem jeweiligen Modul gehören, müssen in der E-Learning-Plattform bestanden werden. Jeder Test kann beliebig oft wiederholt werden. Tests werden in der E-Learning-Plattform automatisch ausgewertet. Folgende Testformen stehen zur Verfügung: Single Choice, Multiple Choice, Fill In, Zuordnungstests, Anordnungstests, Hot-Spot-Tests. Zu den Tests gibt es Tipps und Begründungen für die jeweilige Lösung.
  • Ist die vorherige Voraussetzung erfüllt, dann wird automatisch ein Online-Abschlusstest freigeschaltet (Dauer 30 Minuten). Um den Abschlusstest zu bestehen, müssen 70 von 100 Punkten erreicht werden. Ein gutes Abschneiden bei dem Online-Abschlusstest wird mit Bonuspunkten belohnt. Wird der Abschlusstest dreimal nicht bestanden, dann ist ein Gespräch mit dem Leiter des Studiengangs und dem zugehörigen Autor erforderlich.

Literatur/Kurs

Literatur/Kurs

Literatur

  • Buch: Text Mining: Wissensrohstoff Text von G.Heyer, U. Quasthoff und T. Wittig, W3L-Verlag, 2006

Weiterführende Literatur

  • Berry, Michael M.; Survey of Text Mining, Springer, 2003.

Online-Kurs

  • Text Mining

Wir beraten Sie gerne, rufen Sie uns an!

Mo. - Fr. 9:00 - 17:00 Uhr, Tel. 0231 / 61 804 - 126