Zobrazit minimální záznam

Extraction of company descriptors from web resources



dc.contributor.advisorKuchař Jaroslav
dc.contributor.authorTomáš Stanovčák
dc.date.accessioned2022-06-02T22:54:20Z
dc.date.available2022-06-02T22:54:20Z
dc.date.issued2022-06-02
dc.identifierKOS-1179143728105
dc.identifier.urihttp://hdl.handle.net/10467/101071
dc.description.abstractPředmětem této práce je získání a zpracování dat o firmách z jejich webových stránek. Po obeznámení se s přístupy extrakce a množinou dostupných firemních informací bude připraven datový soubor ve vhodném formátu, na kterém budou prováděny experimenty. Tato datová množina bude podrobena rozličným způsobům extrakce na principu pravidel i strojového učení. Výsledky experimentů budou vyhodnoceny a implementace jednotlivých přístupů zveřejněna jako knihovna pod volnou licencí.cze
dc.description.abstractThe subject of this thesis is to obtain and process company data from their websites. After getting acquainted with extraction approaches and available set of company information, dataset will be prepared in a format suitable for experiments. This dataset will undergo the extraction procedures based on both rule and machine learning principles. The results of the experiments will be evaluated and the implementation of the individual approaches will be publicly accessible as a library under a free licence.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectfirmacze
dc.subjectwebová stránkacze
dc.subjectextrakcecze
dc.subjectvytěžování obsahucze
dc.subjectweb scrapingcze
dc.subjectzpracování textucze
dc.subjectPythoncze
dc.subjectcompanyeng
dc.subjectwebsiteeng
dc.subjectextractioneng
dc.subjectcontent miningeng
dc.subjectweb scrapingeng
dc.subjecttext processingeng
dc.subjectPythoneng
dc.titleExtraktor informací o firmách z webových zdrojůcze
dc.titleExtraction of company descriptors from web resourceseng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereeKordík Pavel
theses.degree.disciplineZnalostní inženýrstvícze
theses.degree.grantorkatedra aplikované matematikycze
theses.degree.programmeInformatikacze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam