Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Tagung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
Sitzungsübersicht
Sitzung
V4: Parameter in der Textanalyse
Zeit:
Mittwoch, 04.03.2020:
11:00 - 12:30

Chair der Sitzung: Nils Reiter, Universität zu Köln
Ort: H 1

Zeige Hilfe zu 'Vergrößern oder verkleinern Sie den Text der Zusammenfassung' an
Präsentationen

„The Vectorian“ – Eine parametrisierbare Suchmaschine für intertextuelle Referenzen

Manuel Burghardt, Bernhard Liebl

Computational Humanities Group, Universität Leipzig

In diesem Beitrag stellen wir eine parametrisierbare Suchmaschine für die Identifizierung intertextueller Referenzen vor. Dabei werden neben zwei verschiedenen "word embeddings" weitere Parameter wie bspw. die Berücksichtigung unterschiedlicher Wortarten, das Erlauben von Einfügungen und generell die Gewichtung von Textvariationen implementiert.

"The Vectorian" versteht sich als experimentelle Plattform mit deren Hilfe unterschiedliche Parameterkonfigurationen erprobt werden können, um so im Sinne eine "interpretable machine learning"-Ansatzes Rückschlüsse für die optimale Konfiguration eines maschinellen Lernverfahrens zur semi-automatischen Zitat-Detektion (bspw. für die Werke Shakespeares) zu erlangen.

Der "Vectorian" ist während des peer reviews für die Gutachter unter dieser Adresse verfügbar:

URL : http://vectorian.poke1024.com:8080/

Login (über den Suchschlitz): pixel-dolby-chariot-sunset



Der Spielraum zwischen „zu wenig“ und „zu viel“

Keli Du

Universität Würzburg, Deutschland

Topic Modeling wurde in den letzten Jahren mehr und mehr in Digital Humanities eingesetzt. Aber die technische Seite von Topic Modeling in Forschungsberichten, im Vergleich zur Analyse und Interpretation der Topics und des Modells, wurde weniger vorgestellt und diskutiert. Es gibt zum Beispiel keine Regeln, wie man die Topics-Anzahl festlegen kann, weil der Einfluss der Topics-Anzahl auf die Qualität des Topic Modells unklar ist. Deshalb wurde der Spielraum im Sinne von Topics-Anzahl bei Topic Modeling aus zwei Perspektiven in dieser Arbeit untersucht, nämlich Dokument-Klassifikation und Topic-Kohärenz.



Typisierte Varianz-Analyse von Texten

Nico Balbach1, Christian Reul1, Frank Puppe1,2

1Zentrum für Philologie und Digitalität „Kallimachos“, Universität Würzburg, Deutschland; 2Lehrstuhl für Künstliche Intelligenz und Angewandte Informatik, Universität Würzburg, Deutschland

Der Buchstaben-basierte Vergleich verschiedener Ausgaben oder Versionen eines Werkes ist eine häufige philologische Arbeit, die in vielen Texteditoren durch eine generische Diff-Funktion unterstützt wird. Allerdings muss eine feinere Differenzierung bisher manuell durchgeführt werden. Wir präsentieren das webbasierte, einfach bedienbare Open-Source Tool "Variance Viewer", mit dem man per Konfigurationsdatei verschiedene Typen von Differenzen definieren und übersichtlich anzeigen lassen kann. Weiterhin berichten wir von ersten, sehr positiven Erfahrungen in zwei philologischen Projekten sowie von Perspektiven der Weiterentwicklung.



 
Impressum · Kontaktadresse:
Datenschutzerklärung · Veranstaltung: DHd-Tagung 2020
Conference Software - ConfTool Pro 2.6.132
© 2001 - 2020 by Dr. H. Weinreich, Hamburg, Germany