Mobilní aplikace pro vyhledání a rozpoznání textu v obrazech reálných scén
Mobile application for text localization and and recognition in real-world images
Typ dokumentu
diplomová prácemaster thesis
Autor
Milichovský Martin
Vedoucí práce
Novák Daniel
Oponent práce
Kordík Pavel
Studijní obor
Umělá inteligenceStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra počítačůObhájeno
2015-01-20Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Zobrazit celý záznamAbstrakt
Tato práce se zabývá implementací aplikace, která rozpozná text v obrázku reálné scény. To je komplikovanější obdoba rozpoznání textu z tištěného dokumentu. Aplikace je určena pro mobilní telefony, což je prostředí s omezenými prostředky. Tyto aspekty jsou v práci diskutovány.
Možné využití je pomoc zrakově postiženým osobám, nebo automatický překlad nalezeného textu.
Nejprve je popsán postup algoritmu pro získání textu ze vstupního obrázku. Dále je tento postup implementován do knihovny, která jednotlivé úkony provádí paralelně. Z ní vychází výsledná aplikace pro Android.
Na závěr je zhodnocena použitelnost aplikace, jejíž úspěšnost sice není 100%, což je ale dáno náročností této úlohy. Výsledky jsou porovnány s existujícími aplikacemi, řešícími podobný problém. This thesis describes implementation of an application for scene text recognition. That is a more complex task than text recognition in printed documents. The application is designed for mobile phones, thus allocation of resources is taken into special consideration.
Possible use of such application is assitence for visualy impaired, or machine translation of the recognized text.
At first, the algorithm for extracting text from image is described. This approach is implemented as a library that processes its tasks in parallel. On top of it an Android application is built.
The conclusion is, the application is not 100 % successful, which is determined by the task's complexity. The result is compared to existing state-of-the-art applications for mobile phone scene text recognition.
Kolekce
- Diplomové práce - 13136 [892]