Evoluce významu slov v jazyce
Evolution of meaning of words in time
Typ dokumentu
diplomová prácemaster thesis
Autor
Dominika Zogatová
Vedoucí práce
Mikolov Tomáš
Oponent práce
Šedivý Jan
Studijní program
Aplikované matematicko-stochastické metodyInstituce přidělující hodnost
katedra matematikyObhájeno
2023-01-30Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Jazyk je primárním způsobem komunikace a každý den přijdeme do styku z mnoha jeho formami. Zaznamenávání a kvantifikování změn významu určitých slov je dobrým způsobem jak monitorovat vztah veřejnosti k těmito slovům. Tato práce přestavuje nový způsob jak analyzovat a kvantifikovat evoluci významu slov. Součástí této diplomové práce je rozsáhlý úvod do strojového učení a zpracování přirozeného jazyka. Dále tato práce prezentuje zpracování dat Common Crawl z různých časových období, vytvořené Word2Vec modely a způsob měření změny významu slova založený na technikách automatického překladu textu. Language is a primary means of communication and each day everybody comes into contact with its many forms. Being able to notice and quantify changes in the meaning of words is a good way of capturing the changes in attitude towards those words. This thesis presents a new way of analysing and quantifying the evolution of meaning of words. This thesis consists of a theoretical and mathematical introduction to machine learning and natural language processing. Additionally, this work presents a form of processing Common Crawl data from different time corpora, creates multiple Word2Vec models based on those corpora and introduces a method of analysing the evolution of meaning of words based on automatic translation techniques.
Kolekce
- Diplomové práce - 14101 [152]