Manuscripts Classification Using Convolutional Deep Learning Networks

dc.contributor.advisor Christlein Vincent
dc.contributor.author Kožnarová, Zuzana
dc.contributor.referee Kordík, Pavel
dc.date.accepted 2017-09-06
dc.date.accessioned 2017-11-09T10:43:00Z
dc.date.available 2017-11-09T10:43:00Z
dc.date.issued 2017-08-02
dc.description.abstract Práce se zabývá možností zlepšení přesnosti klasifikace pro malé datové sady za použití konvolučních neuronových sítí (CNN). Konkrétně se jedná o klasifikaci typu historických ručně psaných latinských textů. Hlavními tématy je využití pretrainingu a vliv pretrainingu na rozšířené datové sady. V práci je dále sledován dopad změn learningratu a také účinek zafixování vah pro prvních několik vrstev. V neposlední řadě pak je věnován prostor preprocesingu datové sady pomocí whiteningu. Whitening je použit v kontextu jednotlivých obrázků. Byly použity modely CNN VGG16 [1] a Resnet50 [2], jelikož byly již v minulosti aplikovány pro klasifikaci latinských textů s jednou z nejvyšších přesností (architektura VGG16 dosáhla přesnosti 0.7649). Cílem těchto a dalších metod je dosáhnout zlepšení přesnosti klasifikace vůči výsledkům ze soutěže Classification of Medieval Handwritings in Latin 2016 Script [3]. [1] SIMONYAN, Karen and Andrew ZISSERMAN. Very deep convolutional networks for large-scale image recognition. arXiv preprint arXiv:1409.1556, 2014. [2] HE, Kaiming, Xiangyu ZHANG, Shaoqing REN and Jian SUN. Deep Residual Learning for Image Recognition. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2016, , 770-778. DOI: 10.1109/CVPR.2016.90. ISBN 978-1-4673-8851-1. [3] CLOPPET, Florence, Véronique EGLIN, Van KIEU, Dominique STUTZMANN and Nicole VINCENT. ICFHR2016 Competition on the Classification of Medieval Handwritings in Latin Script. Shenzhen, China, 2016, 2016(Oct.). cs
dc.description.abstract The thesis concentrates on improving recognition performance for small datasets using CNN. Specifically, it is about type classification of handwritings in Latin. The main topics are the use of pre-training and the influence of pre-training on augmented datasets. In the thesis, the impact of learning-rate changes and also the effect of fixing weights in several layers of the beginning of the network are examined. Last but not least, there is space devoted to preprocessing of the dataset using whitening. The whitening is used in the context of individual images. The CNN models VGG16 [1] and Resnet50 [2] were used, as they were applied to Latin texts classification with one of the highest precision (architecture VGG16 reached accuracy of 0.7649). The goal of these and other methods is to achieve improvement in classification against the results of the Classification of Medieval Handwritings in Latin 2016 Script competition [3]. [1] SIMONYAN, Karen and Andrew ZISSERMAN. Very deep convolutional networks for large-scale image recognition. arXiv preprint arXiv:1409.1556, 2014. [2] HE, Kaiming, Xiangyu ZHANG, Shaoqing REN and Jian SUN. Deep Residual Learning for Image Recognition. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2016, , 770-778. DOI: 10.1109/CVPR.2016.90. ISBN 978-1-4673-8851-1. [3] CLOPPET, Florence, Véronique EGLIN, Van KIEU, Dominique STUTZMANN and Nicole VINCENT. ICFHR2016 Competition on the Classification of Medieval Handwritings in Latin Script. Shenzhen, China, 2016, 2016(Oct.). en
dc.identifier KOS-587865114705
dc.identifier.uri http://hdl.handle.net/10467/72972
dc.language.iso ENG
dc.publisher České vysoké učení technické v Praze cs
dc.publisher Czech Technical University in Prague en
dc.rights A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act. en
dc.rights Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění. cs
dc.subject CNN,konvoluční hluboké neuronové sítě,středověké ručně psané latické texty,předtrénování,dotrénování,CLAMM12,ICDAR16,učení s učitelem,datová sada cs
dc.subject CNN,Convolutional Deep Learning Networks,Medieval handwritings in Latin script,pre-training,fine-tuning,CLAMM12,ICDAR16,supervised learning,dataset en
dc.title Aplikace hlubokých neuronových sítí pro klasifikaci rukopisů cs
dc.title Manuscripts Classification Using Convolutional Deep Learning Networks en
dc.type bachelor thesis en
dspace.entity.type Publication
relation.isAuthorOfPublication 703f706d-dd65-4e34-b0a8-1db1c95460c4
relation.isAuthorOfPublication.latestForDiscovery 703f706d-dd65-4e34-b0a8-1db1c95460c4
relation.isRefereeOfPublication 89151d71-aa84-441c-b049-096a1b4971cf
relation.isRefereeOfPublication.latestForDiscovery 89151d71-aa84-441c-b049-096a1b4971cf
theses.degree.discipline Robotika cs
theses.degree.grantor katedra kybernetiky cs
theses.degree.programme Kybernetika a robotika cs

Files

Original bundle

Now showing 1 - 5 of 5
Name:
F3-BP-2017-Koznarova-Zuzana-ManuscriptsClassificationUsingConvolutionalDeepLearningNetworks.pdf
Size:
1.32 MB
Format:
Adobe Portable Document Format
Description:
PLNY_TEXT
Name:
F3-BP-2017-Koznarova-Zuzana-priloha-DeepScript-master(WithoutDatasetsAndModels).zip
Size:
64.28 KB
Format:
Unknown data format
Description:
PRILOHA
Name:
F3-BP-2017-Koznarova-Zuzana-priloha-README.txt
Size:
479 B
Format:
Plain Text
Description:
PRILOHA
Name:
F3-BP-2017-posudek-Christlein_Vincent.pdf
Size:
700.63 KB
Format:
Adobe Portable Document Format
Description:
POSUDEK
Name:
F3-BP-2017-posudek-Kordik_Pavel.pdf
Size:
887.59 KB
Format:
Adobe Portable Document Format
Description:
POSUDEK