Clustering a datová analýza Jupyter notebooků na GitHubu
Clustering and data analysis of Jupyter notebooks on GitHub
Typ dokumentu
diplomová prácemaster thesis
Autor
Tomáš Detko
Vedoucí práce
Žitný Jakub
Oponent práce
Kordík Pavel
Studijní obor
Znalostní inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Github je miestom kde developeri pracujú na projektoch a svoju prácu zdielajú s ostatnými. Uložisko sa postupom času stalo miestom s najväčšou code-base na svete. Ktokoľvek kto sa rozhodne zapojiť do vývoja, vytvoriť balíček alebo knižnicu tak môže urobiť. Vďaka tomu vzniká nepreberné množstvo nových projektov, ktoré posúvajú hranice v oblasti technológií. Postupne ako technológia dozrieva sa dostáva do širšieho povedomia developerov. Nástroj sa začína integrovať do iných knižníc a iné projekty integrujú časti tohto riešenia. Developeri ho vyvíjali v dobrej viere, že ho komunita bude ďalej používať a podporovať. Postupom času, ako vznikali alternatívy, riešenie zastaralo a developeri ho začali opúšťať. Odliv ľudí ma za následok zníženie kvality kódu a postupný zánik projektu. Táto práca si dáva za cieľ analyzovať informácie o repozitároch za účelom zistenia kvality repozitára a jeho životnosti. Github is a place where developers work on projects and share their work with others. Over time, the repository has become the place with the largest code-base in the world. Anyone who decides to solve a problem, create a package or a library can do so and can contribute. This has led to a plethora of new projects that are pushing the boundaries of technology. Gradually, as the technology matures, it becomes more widely known to developers. The solution starts to be integrated into other libraries and other projects integrate parts of the solution. Developers developed it in the good faith that the community will continue to use and support it. Over time, as alternatives were developed, the solution became obsolete and developers started to abandon it. The outflow of people resulted in a decrease in code quality and the gradual disappearance of the project. This work aims to analyse information about repositories in order to determine the quality of the repository and its lifespan.
Kolekce
- Diplomové práce - 18105 [203]