Bullingers Briefwechsel zugänglich machen: Stand der Handschriftenerkennung

Ströbel, Phillip; Hodel, Tobias; Fischer, Andreas; Scius, Anna; Wolf, Beat; Janka, Anna; Widmer, Jonas; Scheurer, Patricia; Volk, Martin (2023). Bullingers Briefwechsel zugänglich machen: Stand der Handschriftenerkennung. In: Trilcke, Peer; Busch, Anna; Helling, Patrick (eds.) DHd 2023 Open Humanities Open Culture. 9. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" (DHd 2023). Zenodo 10.5281/zenodo.7715356

[img]
Preview
Text
HODEL_Tobias_Bullingers_Briefwechsel_zug_nglich_machen__Stan.pdf - Published Version
Available under License Creative Commons: Attribution (CC-BY).

Download (719kB) | Preview

"Anhand des Briefwechsels Heinrich Bullingers (1504-1575), das rund 10'000 Briefe umfasst, demonstrieren wir den Stand der Forschung in automatisierter Handschriftenerkennung. Es finden sich mehr als hundert unterschiedliche Schreiberhände in den Briefen mit sehr unterschiedlicher Verteilung. Das Korpus ist zweisprachig (Latein/Deutsch) und teilweise findet der Sprachwechsel innerhalb von Abschnitten oder gar Sätzen statt. Auf Grund dieser Vielfalt eignet sich der Briefwechsel optimal als Testumgebung für entsprechende Algorithmen und ist aufschlussreiche für Forschungsprojekte und Erinnerungsinstitutionen mit ähnlichen Problemstellungen. Im Paper werden drei Verfahren gegeneinander gestellt und abgewogen. Im folgenden werde drei Ansätze an dem Korpus getestet, die Aufschlüsse zum Stand und möglichen Entwicklungen im Bereich der Handschriftenerkennung versprechen. Erstens wird mit Transkribus eine etablierte Plattform genutzt, die zwei Engines (HTR+ und PyLaia) anbietet. Zweitens wird mit Hilfe von Data Augmentation versucht die Erkennung mit der state-of-the-art Engine HTRFlor zu verbessern und drittens werden neue Transformer-basierte Modelle (TrOCR) eingesetzt." Ein Beitrag zur 9. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2023 Open Humanities Open Culture.

Item Type:

Conference or Workshop Item (Paper)

Division/Institute:

06 Faculty of Humanities > Other Institutions > Walter Benjamin Kolleg (WBKolleg) > Digital Humanities
06 Faculty of Humanities > Other Institutions > Walter Benjamin Kolleg (WBKolleg)

UniBE Contributor:

Hodel, Tobias Mathias, Janka, Anna Katharina, Widmer, Jonas Mikhael

Subjects:

100 Philosophy
800 Literature, rhetoric & criticism
900 History
000 Computer science, knowledge & systems

Publisher:

Zenodo

Language:

German

Submitter:

Tobias Mathias Hodel

Date Deposited:

17 Mar 2023 16:06

Last Modified:

17 Mar 2023 23:27

Publisher DOI:

10.5281/zenodo.7715356

BORIS DOI:

10.48350/180287

URI:

https://boris.unibe.ch/id/eprint/180287

Actions (login required)

Edit item Edit item
Provide Feedback