Zobrazit minimální záznam

System for classification of web pages



dc.contributor.advisorKuchař Jaroslav
dc.contributor.authorKusý Stanislav
dc.date.accessioned2018-06-07T10:25:56Z
dc.date.available2018-06-07T10:25:56Z
dc.date.issued2018-06-07
dc.identifierKOS-695600136905
dc.identifier.urihttp://hdl.handle.net/10467/76214
dc.description.abstractTato práce se zabývá automatickou klasifikací webových stránek na základě vstupní URL adresy. Klasifikace webové stránky se skládá ze tří částí. První částí je stažení stránky na základě předložené URL adresy. Druhou částí je extrakce dat ze stažené stránky a jejich úprava pro klasifikaci. Poslední částí je samotná klasifikace pomocí strojového učení. Výsledkem práce je program, který na základě předložené URL adresy přiřadí stránce některé z předem daných kategorií.cze
dc.description.abstractThis thesis describes automatic web page classification. Classification is composed of three parts. The first part is downloading web page according to URL address. The second part is extract and transform data from web page. The third part is classification by machine learning algorithm. The result of this thesis is application that assigns some of the predefined categories to the web page.eng
dc.language.isoCZE
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectKlasifikace,strojové učení,text mining,web mining,data miningcze
dc.subjectClassification,machine learning,text mining,web mining,data miningeng
dc.titleSystém pro klasifikaci webových stránekcze
dc.titleSystem for classification of web pageseng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.date.accepted
dc.contributor.refereePavlíček Josef
theses.degree.disciplineWebové a softwarové inženýrstvícze
theses.degree.grantorkatedra softwarového inženýrstvícze
theses.degree.programmeInformatikacze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam