Editace obrázků obličejů v latentním prostoru generativních adversarialních sítí
Face Image Editing in Latent Space of Generative Adversarial Networks
Type of document
bakalářská prácebachelor thesis
Author
Nela Petrželková
Supervisor
Čech Jan
Opponent
Průša Daniel
Field of study
Informatika a počítačové vědyStudy program
Otevřená informatikaInstitutions assigning rank
katedra kybernetikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Pokrok v syntéze obrázků obličejů v posledních letech postupuje velmi rychle díky generativním adversariálním sítím. Bylo zjištěno, že manipulace v latetním prostoru generativních adversarálních sítí umožňuje sémanticky upravovat obrázky. Představíme metodu pro úpravu obrázků obličejů pomocí manipulace s obličejovými body a následné optimalizace latentního kódu. Popíšeme a zanalyzujeme navrhovanou metodu a porovnáme ji s populární metodou hledání lineárních sémantických směrů v latentním prostoru. Nakonec ukážeme, jak lze upravené obličeje zakomponovat zpět do původní fotografie. Face image synthesis has seen tremendous progress recently due to Generative Adversarial Networks (GANs). It was observed that latent space manipulation of GANs enables to semantically edit the generated images. We introduce a novel method for editing face images via manipulation with facial landmarks and subsequent latent optimization. We describe and analyze the proposed method and compare it with the popular approach of finding linear semantic directions in the latent space. Finally, we show an algorithm, where the manipulated face image is seamlessly blended into the original photography.
Collections
- Bakalářské práce - 13133 [706]