Identifikace kompatibilních produktů z popisu produktu
Product Compatibility Detection from Product Description
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Tomáš Bánhegyi
Vedoucí práce
Čepek Miroslav
Oponent práce
Kopáček Luděk
Studijní obor
Znalostní inženýrstvíStudijní program
Informatika 2009Instituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Táto bakalárska práca sa zameriava na získavanie kompatibility produktov z produktových popisov. Riešenie využíva známe modely strojového učenia z oblasti spracovania prirodzeného jazyka. Špecificky sa práca zameriava na úlohy rozpoznávania pomenovaných entít, extrakcie vzťahov a odpovedania na otázky. Vhodný dataset musí obsahovať anotácie pre pomenované entity a vzťahy medzi nimi. Po vytvorení datasetu sa aplikujú vybrané modely strojového učenia. Podarilo sa mi extrahovať informácie o kompatibilite produktov so skóre 62.30 %, pričom som aplikoval len rozpoznávanie pomenovaných entít a extrakciu vzťahov. Rozhodli sme sa vynechať úlohu odpovedania na otázky, pretože by sme presiahli rozsah bakalárskej práce. Táto práca prináša riešenie pre využitie predtrénovaných modelov, za účelom analýzy popisov produktov a záskania informácie o ich kompatibilite. V závere sú popísané možnosti pre ďalší výskum. A ako príloha je uvedený podrobný popis konfiguračného súboru použitého pre náš model. This bachelor thesis focuses on processing product descriptions to extract product compatibility information. The solution uses known machine learning models from the natural language processing field and its subtasks named entity recognition, relationship extraction, and question answering. A suitable dataset must contain annotations specifying the named entities and their relationships. After creating the dataset, there are applied selected machine learning models. I extracted product compatibility information with a 62.30% score, using just named entity recognition and relationship extraction. We decided to skip the question answering task because it would be out of scope for this bachelor thesis. This thesis brings a solution for leveraging pre-trained models to analyse product descriptions and extract their compatibility. In summary, there are described the possibilities for further research. As an appendix, there is a detailed description of the configuration file used for our model.
Kolekce
- Bakalářské práce - 18105 [292]