Generický extraktor metadat z databáze
Generic database metadata extractor
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Victor Petukhov
Vedoucí práce
Trávníček Jan
Oponent práce
Toušek Jiří
Studijní obor
Software Engineering (Bachelor, in English)Studijní program
Informatics 2010Instituce přidělující hodnost
katedra softwarového inženýrstvíPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato bakalářská práce si klade za cíl ukázat proveditelnost implementace generického extraktoru metadat pro DBMS pomocí JDBC API. V rámci studie byl implementován JDBC extraktor metadat, který může být použit pro všechny relační databázové systémy, které poskytují JDBC rozhraní. Motivací za implementací generického extraktoru metadat bylo vyřešit absenci vhodného generického extraktoru pro všechny databáze v softwarových řešeních Manta pro analýzu datových toků. Byl implementován generický extraktor metadat, který využívá JDBC API pro získání metadat. Extraktor je schopen získávat různé informace, jako je jméno, katalog a schéma procedur, funkcí, tabulek a pohledů. Navíc poskytuje informace o parametrech a návratových typech těchto rutin. Extraktor může získávat informace o sloupcích a jejich datových typech tabulek a pohledů. Extraktor byl testován a jeho schopnost získávat informace o struktuře databáze byla demonstrována. Extrahované položky jsou ukládány do paměti nebo H2 databází pomocí slovníku, který byl implementován pomocí abstrakcí slovníku Manta. Výsledky studie ukázaly, že je proveditelné implementovat generický extraktor metadat pro RDBMS pomocí JDBC API. Implementovaný extraktor může být použit pro databázové systémy podporované JDBC rozhraním. Může poskytnout informace o struktuře databáze, které jsou potřebné pro analýzu dat. Další vývoj a optimalizace extraktoru by mohl vést k ještě efektivnější a výkonnější analýze databáze. This bachelor's thesis aims to demonstrate the feasibility of implementing a generic metadata extractor for DBMSs using JDBC API. The study implemented the JDBC metadata extractor, which can be used for all relational database management systems that provide the JDBC interface. The motivation behind implementing a generic metadata extractor was to address the absence of a suitable generic extractor for all databases in Manta software solutions for data lineage analysis. The generic metadata extractor which uses JDBC API for gathering the metadata is implemented. The extractor is capable of retrieving various details such as the name, catalog, and schema of procedures, functions, tables, and views. Additionally, it provides information on the parameters and return types in these routines. The extractor can gather information about columns and their data types of tables, and views. The extractor was tested, and its ability to retrieve details about the database structure was demonstrated. The extracted entries are stored in in-memory or H2 databases using dictionary that was implemented using Manta dictionary abstractions. The findings of the study demonstrated that implementing a generic metadata extractor for RDBMS using JDBC API is feasible. The implemented extractor can be used for database management systems supported by the JDBC interface. It can provide information about the database structure required for data analysis. Further development and optimization of the extractor could lead to even more efficient and powerful database analysis.
Kolekce
- Bakalářské práce - 18102 [1608]