Využití strojového učení pro porovnávání pracovních nabídek a životopisů
A Machine Learning Approach for Job Posting and CV Alignment
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Karolina Zegeryte
Vedoucí práce
Kovalenko Alexander
Oponent práce
Čepek Miroslav
Studijní obor
Znalostní inženýrstvíStudijní program
Informatika, platnost do 2024Instituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Hlavním cílem bakalářské práce je vývoj komplexního modelu Strojového Učení určeného k normalizaci reprezentace dovedností v pracovních nabídkách a životopisech. Vyvinutý systém usnadňuje hladší a efektivnější náborový proces tím, že účinně řeší rozdíly v tom, jak jsou dovednosti a zkušenosti reprezentovány v pracovních inzerátech a životopisech. Toto zlepšení výrazně snižuje potenciální nesoulad mezi uchazeči o zaměstnání a náboráři. Metodika zahrňuje shromáždění a předběžné zpracování rozsáhlého souboru dat obsahujícího různé nabídky práce a životopisy. Vzhledem k absenci snadno dostupných trénovacích, testovacích a validačních dat ve veřejném prostoru je nutné vytvořit vhodný soubor dat pro trénování modelu ručně. Pro tyto účely budou vybrána a zpracována reálná data. Poté následuje vývoj normalizačního modelu s využitím technik Zpracování Přirozeného Jazyka a Strojového Učení. Tyto techniky jsou zaměřeny na interpretaci a kategorizaci různorodých vyjádření dovedností a zkušeností. Kromě toho studie navrhne vývoj sofistikovaných algoritmů pro porovnávání, využívajících rámce Strojového Učení i Hlubokého Učení, aby bylo možné přesně sladit pracovní nabídky s odpovídajícími životopisy na základě standardizovaných reprezentací dovedností. Po normalizaci dovedností v životopisech a pracovních nabídkách budou použity algoritmy jako Logistická Regrese, Gradient Boosting a Transformátory za účelem porovnání životopisů s volnými pracovními místy. Výkonnost těchto modelů bude hodnocena pomocí ukazatelů Precision, Recall a F1 Score. Bude provedena komplexní studie stávajících modelů, které jsou využívány pro podobné úlohy, zahrnující jejich vyhodnocení a porovnání s vyvinutým modelem. The main goal of the Bachelor's thesis is developing a comprehensive Machine Learning model designed to normalize the representation of skills in job postings and resumes. The developed system facilitates smoother and more efficient recruitment processes by effectively addressing the discrepancies in how skills and experiences are represented in job advertisements and resumes. This improvement significantly reduces the potential misalignment between job seekers and recruiters. The methodology involves collecting and preprocessing a substantial dataset comprising diverse job postings and resumes. Given the absence of readily available training, testing, and validation data in the public domain, it is necessary to manually create a suitable dataset to train the model. Real data will be selected and processed for these purposes. This will be followed by the development of a normalization model utilizing Natural Language Processing and Machine Learning techniques. These techniques are geared towards interpreting and categorizing the disparate expressions of skills and experiences. Additionally, the study proposes the development of sophisticated matching algorithms, leveraging both Machine Learning and Deep Learning frameworks to accurately align job postings with corresponding resumes based on standardized skill representations. After the normalization of skills in resumes and job postings, algorithms such as Logistic Regression, Gradient Boosting, and Transformers should be applied to match resumes with job vacancies. The performance of these models will be evaluated using metrics including Precision, Recall, and F1 Score. A comprehensive study will be conducted on existing models that are utilized for similar tasks, involving their evaluation and comparison with the developed model.
Kolekce
- Bakalářské práce - 18105 [369]