Systém pro klasifikaci webových stránek
System for classification of web pages
dc.contributor.advisor | Kuchař Jaroslav | |
dc.contributor.author | Kusý Stanislav | |
dc.date.accessioned | 2018-06-07T10:25:56Z | |
dc.date.available | 2018-06-07T10:25:56Z | |
dc.date.issued | 2018-06-07 | |
dc.identifier | KOS-695600136905 | |
dc.identifier.uri | http://hdl.handle.net/10467/76214 | |
dc.description.abstract | Tato práce se zabývá automatickou klasifikací webových stránek na základě vstupní URL adresy. Klasifikace webové stránky se skládá ze tří částí. První částí je stažení stránky na základě předložené URL adresy. Druhou částí je extrakce dat ze stažené stránky a jejich úprava pro klasifikaci. Poslední částí je samotná klasifikace pomocí strojového učení. Výsledkem práce je program, který na základě předložené URL adresy přiřadí stránce některé z předem daných kategorií. | cze |
dc.description.abstract | This thesis describes automatic web page classification. Classification is composed of three parts. The first part is downloading web page according to URL address. The second part is extract and transform data from web page. The third part is classification by machine learning algorithm. The result of this thesis is application that assigns some of the predefined categories to the web page. | eng |
dc.language.iso | CZE | |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | Klasifikace,strojové učení,text mining,web mining,data mining | cze |
dc.subject | Classification,machine learning,text mining,web mining,data mining | eng |
dc.title | Systém pro klasifikaci webových stránek | cze |
dc.title | System for classification of web pages | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.date.accepted | ||
dc.contributor.referee | Pavlíček Josef | |
theses.degree.discipline | Webové a softwarové inženýrství | cze |
theses.degree.grantor | katedra softwarového inženýrství | cze |
theses.degree.programme | Informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 18102 [1006]