Aplikace hlubokých neuronových sítí pro klasifikaci rukopisů
Manuscripts Classification Using Convolutional Deep Learning Networks
dc.contributor.advisor | Christlein Vincent | |
dc.contributor.author | Kožnarová Zuzana | |
dc.date.accessioned | 2017-11-09T10:43:00Z | |
dc.date.available | 2017-11-09T10:43:00Z | |
dc.date.issued | 2017-08-02 | |
dc.identifier | KOS-587865114705 | |
dc.identifier.uri | http://hdl.handle.net/10467/72972 | |
dc.description.abstract | Práce se zabývá možností zlepšení přesnosti klasifikace pro malé datové sady za použití konvolučních neuronových sítí (CNN). Konkrétně se jedná o klasifikaci typu historických ručně psaných latinských textů. Hlavními tématy je využití pretrainingu a vliv pretrainingu na rozšířené datové sady. V práci je dále sledován dopad změn learningratu a také účinek zafixování vah pro prvních několik vrstev. V neposlední řadě pak je věnován prostor preprocesingu datové sady pomocí whiteningu. Whitening je použit v kontextu jednotlivých obrázků. Byly použity modely CNN VGG16 [1] a Resnet50 [2], jelikož byly již v minulosti aplikovány pro klasifikaci latinských textů s jednou z nejvyšších přesností (architektura VGG16 dosáhla přesnosti 0.7649). Cílem těchto a dalších metod je dosáhnout zlepšení přesnosti klasifikace vůči výsledkům ze soutěže Classification of Medieval Handwritings in Latin 2016 Script [3]. [1] SIMONYAN, Karen and Andrew ZISSERMAN. Very deep convolutional networks for large-scale image recognition. arXiv preprint arXiv:1409.1556, 2014. [2] HE, Kaiming, Xiangyu ZHANG, Shaoqing REN and Jian SUN. Deep Residual Learning for Image Recognition. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2016, , 770-778. DOI: 10.1109/CVPR.2016.90. ISBN 978-1-4673-8851-1. [3] CLOPPET, Florence, Véronique EGLIN, Van KIEU, Dominique STUTZMANN and Nicole VINCENT. ICFHR2016 Competition on the Classification of Medieval Handwritings in Latin Script. Shenzhen, China, 2016, 2016(Oct.). | cze |
dc.description.abstract | The thesis concentrates on improving recognition performance for small datasets using CNN. Specifically, it is about type classification of handwritings in Latin. The main topics are the use of pre-training and the influence of pre-training on augmented datasets. In the thesis, the impact of learning-rate changes and also the effect of fixing weights in several layers of the beginning of the network are examined. Last but not least, there is space devoted to preprocessing of the dataset using whitening. The whitening is used in the context of individual images. The CNN models VGG16 [1] and Resnet50 [2] were used, as they were applied to Latin texts classification with one of the highest precision (architecture VGG16 reached accuracy of 0.7649). The goal of these and other methods is to achieve improvement in classification against the results of the Classification of Medieval Handwritings in Latin 2016 Script competition [3]. [1] SIMONYAN, Karen and Andrew ZISSERMAN. Very deep convolutional networks for large-scale image recognition. arXiv preprint arXiv:1409.1556, 2014. [2] HE, Kaiming, Xiangyu ZHANG, Shaoqing REN and Jian SUN. Deep Residual Learning for Image Recognition. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2016, , 770-778. DOI: 10.1109/CVPR.2016.90. ISBN 978-1-4673-8851-1. [3] CLOPPET, Florence, Véronique EGLIN, Van KIEU, Dominique STUTZMANN and Nicole VINCENT. ICFHR2016 Competition on the Classification of Medieval Handwritings in Latin Script. Shenzhen, China, 2016, 2016(Oct.). | eng |
dc.language.iso | ENG | |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | CNN,konvoluční hluboké neuronové sítě,středověké ručně psané latické texty,předtrénování,dotrénování,CLAMM12,ICDAR16,učení s učitelem,datová sada | cze |
dc.subject | CNN,Convolutional Deep Learning Networks,Medieval handwritings in Latin script,pre-training,fine-tuning,CLAMM12,ICDAR16,supervised learning,dataset | eng |
dc.title | Aplikace hlubokých neuronových sítí pro klasifikaci rukopisů | cze |
dc.title | Manuscripts Classification Using Convolutional Deep Learning Networks | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.date.accepted | 2017-09-06 | |
dc.contributor.referee | Kordík Pavel | |
theses.degree.discipline | Robotika | cze |
theses.degree.grantor | katedra kybernetiky | cze |
theses.degree.programme | Kybernetika a robotika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 13133 [714]