Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Tagung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
Sitzungsübersicht
Sitzung
Workshop 10
Zeit:
Dienstag, 03.03.2020:
9:00 - 17:00

Ort: Q 1 213

Zeige Hilfe zu 'Vergrößern oder verkleinern Sie den Text der Zusammenfassung' an
Präsentationen

OCR4all – Eine semi-automatische Open-Source-Software für die OCR historischer Drucke

Maximilian Wehner1, Michael Dahnke2, Florian Landes3, Robert Nasarek4, Christian Reul1

1Julius-Maximilians-Universität Würzburg, Deutschland; 2Universität Siegen, Deutschland; 3Bayerische Akademie der Wissenschaften, Deutschland; 4Martin-Luther-Universität Halle-Wittenberg, Deutschland

Während die Optical Character Recognition (OCR) moderner Texte als informatisch gelöstes Problem betrachtet werden kann, gilt dies für vormoderne Frühdrucke von Inkunabeln bis hin zu den Frakturdrucken des 19. Jahrhunderts nur sehr eingeschränkt. Mit der Entwicklung der OCR-Software OCR4all wird dem vor allem geisteswissenschaftlichen Bedürfnis eines kohärenten und modularen OCR-Workflows Rechnung getragen. Dieser erlaubt es auch einem informatisch nicht geschulten Nutzerkreis, für besagte Textgruppen eigenständig maschinenverarbeitbaren Text zu generieren, der höchsten Qualitätsansprüchen und Anforderungen sowohl der modernen Editionsphilologie als auch quantitativen Analyseverfahren der Digital Humanities genügt. Der vorliegende Workshop beschäftigt sich diesbezüglich aus Anwendersicht mit Fragen der Installation der Software, der Durchführung und Anwendung der vorzustellenden Arbeitsabläufe sowie der projekt- und textgruppenspezifischen Anpassung des OCR-Workflows.



 
Impressum · Kontaktadresse:
Datenschutzerklärung · Veranstaltung: DHd-Tagung 2020
Conference Software - ConfTool Pro 2.6.129
© 2001 - 2020 by Dr. H. Weinreich, Hamburg, Germany