Show simple item record

System for classification of web pages

dc.contributor.advisorKuchař Jaroslav
dc.contributor.authorKusý Stanislav
dc.date.accessioned2018-06-07T10:25:56Z
dc.date.available2018-06-07T10:25:56Z
dc.date.issued2018-06-07
dc.identifierKOS-695600136905
dc.identifier.urihttp://hdl.handle.net/10467/76214
dc.description.abstractTato práce se zabývá automatickou klasifikací webových stránek na základě vstupní URL adresy. Klasifikace webové stránky se skládá ze tří částí. První částí je stažení stránky na základě předložené URL adresy. Druhou částí je extrakce dat ze stažené stránky a jejich úprava pro klasifikaci. Poslední částí je samotná klasifikace pomocí strojového učení. Výsledkem práce je program, který na základě předložené URL adresy přiřadí stránce některé z předem daných kategorií.cze
dc.description.abstractThis thesis describes automatic web page classification. Classification is composed of three parts. The first part is downloading web page according to URL address. The second part is extract and transform data from web page. The third part is classification by machine learning algorithm. The result of this thesis is application that assigns some of the predefined categories to the web page.eng
dc.language.isoCZE
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html.eng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html.cze
dc.subjectKlasifikace,strojové učení,text mining,web mining,data miningcze
dc.subjectClassification,machine learning,text mining,web mining,data miningeng
dc.titleSystém pro klasifikaci webových stránekcze
dc.titleSystem for classification of web pageseng
dc.typeMAGISTERSKÁ PRÁCEcze
dc.typeMASTER'S THESISeng
dc.date.accepted
dc.contributor.refereePavlíček Josef
theses.degree.disciplineWebové a softwarové inženýrstvícze
theses.degree.grantorkatedra softwarového inženýrstvícze
theses.degree.programmeInformatikacze


Files in this item




This item appears in the following Collection(s)

Show simple item record