Vyhledávání opsaných programů
Detection of cribbed programs
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Michal Dvořák
Vedoucí práce
Vagner Ladislav
Oponent práce
Balík Miroslav
Studijní obor
Teoretická informatikaStudijní program
Informatika 2009Instituce přidělující hodnost
katedra teoretické informatikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Plagiátorství zdrojových kódů je problematika, se kterou se musí potýkat nejeden vysokoškolský kurz programování. Tato bakalářská práce se zaměřuje na vylepšení detekce opsaných programů pro systém ProgTest, portál pro podporu výuky programování na Fakultě informačních technologií ČVUT v Praze. Je navržen a implementován nový porovnávač, který využívá algoritmus Running Karp-Rabin Greedy String Tiling, jenž lze nalézt také v existujících state of the art detektorech plagiátorství. Nový porovnávač je schopen odhalit rafinovanější způsoby opisování, jako např. prohození funkcí. Dále také dokáže odstranit z odevzdání sdílený kód, který je studentům distribuován jako šablona řešení. Testování ukazuje, že nový porovnávač je pro velká data 3krát až 4krát rychlejší než současné řešení. Source code plagiarism is an issue that many programming courses face. The aim of this thesis is to improve source code plagiarism detection in ProgTest, a submission management system employed at the Faculty of Information Technology, CTU in Prague. A new tool has been implemented for this purpose. The tool makes use of an algorithm called Running Karp-Rabin Greedy String Tiling, which has been proven effective in many state of the art plagiarism detectors. The new tool is able to recognise a wider variety of techniques used to hide plagiarism, such as block transpositions. Furthermore the tool is capable of removing parts of shared code which have been distributed by the teachers as a submission template. Experiments have observed that the new tool is up to 3-4 times faster compared to the current solution.
Kolekce
- Bakalářské práce - 18101 [348]