Transkription & OCR
Jun.-Prof. Dr. Mark Hall
Wintersemester 2018/19
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/joke_clean.png)
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/joke_clean.png)
Why is a herring like a graveyard?
Because it is full of bones.
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/joke_transcribe.png)
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/joke_layout.png)
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/joke_missing_letter.png)
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/joke_faded.png)
Optical Character Recognition
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/joke_clean.png)
Why is a herring like a graveyard?
Because it is full of bones.
Image pre-processing
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/joke_clean.png)
Image pre-processing
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/joke_binarised.png)
Image pre-processing
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/joke_binarised.png)
Image pre-processing
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/joke_blurred.png)
Line Segmentation
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/source_data.jpg)
Line Segmentation
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/line_1.png)
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/line_2.png)
Line Segmentation
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/source_data.jpg)
Character Recognition
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/line_2.png)
Character Recognition
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/letter_selected.png)
Character Recognition
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/letter_identified.png)
Machine Learning
Supervised Machine Learning
Artificial Neural Network
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/artificial_neural_network.png)
Lernen
Handschrifterkennung
![](https://mht.uzi.uni-halle.de/modules/informatik-in-den-geistes-und-kulturwissenschaften/inhalt/transkription/handwriting.png)
Literatur
- Springmann, U. (2016). OCR für alte Drucke. Informatik-Spektrum, 39(6), 459-462.