Automatické generování názvu a popisek webových stránek s neznámým obsahem
Automatic Name and Snippet Generation of Web pages with Unknown Content
Type of document
bakalářská prácebachelor thesis
Author
Amrich Jonáš
Supervisor
Šedivý Jan
Opponent
Materna Jiří
Field of study
Informatika a počítačové vědyStudy program
Otevřená informatikaInstitutions assigning rank
katedra kybernetikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Show full item recordAbstract
Tato práce se zabývá problémem automatického generování názvů a popisek webových stránek, pomocí jejich okolí namísto jejich obsahu. Rostoucí počet webových stránek je namísto textem tvořen multimédii či je interaktivní, případně jejich obsah nemůže být stažen z různých důvodů. Tyto stránky ale mohou být pro uživatele důležité a vyhledávače potřebují uživatelům prezentovat jejich popisy. V této práci je zkoumána řada přístupů k této problematice a je představena metoda pro automatickou tvorbu názvů a popisků. Její úspěšnost je následně změřena a jsou vytvořeny ukázkové popisky. This thesis explores the problem of name and snippet generation of web pages based on their context rather than on their content. A growing number of web pages is short on text and rich on multimedia, or is highly interactive, or their content can not be downloaded for various reasons. But these web pages may still be valuable for users and search engines need to present their labels. In this thesis a survey of several approaches to this task is presented, the process of automatic generation of the synthetic content is proposed and the performance of proposed method is measured. Exemplary snippets are then generated.
Collections
- Bakalářské práce - 13133 [778]