Rozpoznávání matematických a chemických vzorců ve strukturovaných dokumentech
Recognizing mathematical and chemical formulas in structured documents
dc.contributor.advisor | Průša Daniel | |
dc.contributor.author | Csaba Filip | |
dc.date.accessioned | 2019-06-11T14:44:05Z | |
dc.date.available | 2019-06-11T14:44:05Z | |
dc.date.issued | 2019-06-05 | |
dc.identifier | KOS-773337312705 | |
dc.identifier.uri | http://hdl.handle.net/10467/82368 | |
dc.description.abstract | Ve své bakalářské práci se budu zabývat problematikou rozpoznávání jednoduchých matematických a chemických rovnic ve strukturovaných dokumentech. K detekci rovnic využiji systém pro detekci objektů YOLO vytrénovaný na automaticky vygenerovaných trénovacích datech. K rozpoznávání jednotlivých znaků použiji OCR engine Tesseract. Pro popis struktury vzorců navrhnu automat a implementuji parser. Nakonec implementuji mobilní aplikaci pro rozpoznávání rovnic v Androidu a otestuji ji. | cze |
dc.description.abstract | In my bachelor's thesis I will address the problem of recognizing mathematical and chemical equations in structured documents. For the detection of the equations in a scene I use the famous object detection system YOLO. I train my custom model on automatically generated data. For the recognition of individual characters I will use the OCR engine Tesseract. I propose a finite automaton for the description of equations. Lastly I am going to implement and test an Android mobile application capable of detecting and recognizing simple equations. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | Rozpoznávání | cze |
dc.subject | YOLO | cze |
dc.subject | Tesseract | cze |
dc.subject | Chemická rovnice | cze |
dc.subject | Matematická rovnice | cze |
dc.subject | Chemický vzorec | cze |
dc.subject | Recognition | eng |
dc.subject | YOLO | eng |
dc.subject | Tesseract | eng |
dc.subject | Chemical equation | eng |
dc.subject | Mathematical equation | eng |
dc.subject | Chemical formula | eng |
dc.title | Rozpoznávání matematických a chemických vzorců ve strukturovaných dokumentech | cze |
dc.title | Recognizing mathematical and chemical formulas in structured documents | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.contributor.referee | Bušta Michal | |
theses.degree.discipline | Software | cze |
theses.degree.grantor | katedra počítačů | cze |
theses.degree.programme | Otevřená informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 13136 [1056]