Computer Vision Methods for Sex Classification and Identity Verification Using Two-Dimensional Gas Chromatography Mass Spectrometry Data

Metody počítačového vidění pro klasifikaci pohlaví a ověřování identity s využitím dat z dvourozměrné plynové chromatografie s hmotnostní spektrometrií

Supervisors

Editors

Other contributors

Journal Title

Journal ISSN

Volume Title

Publisher

České vysoké učení technické v Praze
Czech Technical University in Prague

Date of defense

Research Projects

Organizational Units

Journal Issue

Abstract

Klasifikace pohlaví a ověřování identity na základě lidského pachu představují zajímavé výzvy. K pachovému rozpoznávání se historicky používali cvičení psi, ale v poslední době se začíná využívat chemická analýza, která odhaluje individuální charakteristiky jedince. Tato práce se zaměřuje na vzorky lidského pachu analyzované pomocí komplexní dvourozměrné plynové chromatografie ve spojení s hmotnostní spektrometrií s časem letu (GC×GC ToF-MS), což je technika generující velké objemy dat obtížně zpracovatelných tradiční chemickou analýzou. Pro jejich zpracování využíváme metody strojového učení a počítačového vidění. V této práci představujeme metodu k řešení obou úloh pomocí technik rozpoznávání vzorů. Na rozdíl od tradičních chemických analytických postupů pracuje naše metoda přímo se surovými výstupy GC×GC ToF-MS a využívá jejich bohatou prostorovou a spektrální strukturu pro automatizovanou predikci. Metodu testujeme a porovnáváme s doposud používanými. Metoda se skládá ze tří částí. Nejprve jsou detekovány prostorové pozice chemických látek. Poté jsou data zaregistrována do kanonického rámce pomocí po částech lineární interpolace a Delaunayovy triangulace. Nakonec je aplikován model založený na neuronových sítích pro klasifikaci pohlaví nebo pro zakódování měření pro účely ověřování identity. Tyto reprezentace jsou následně porovnány a na základě jejich vzdálenosti se rozhodne, zda vzorky pocházejí od stejné osoby. Metoda dosahuje 84,7% přesnosti při 5násobné křížové validaci pro klasifikaci pohlaví a AUC 0,91 s 50% mírou pravdivých pozitiv při 5% falešně pozitivních u ověřování identity na validační sadě.

Sex classification and identity verification from human scent samples are intriguing challenges. While scent-based recognition has historically relied on trained dogs, more recently chemical analysis has been applied revealing information about individual characteristics. This work focuses on human scent samples analyzed using comprehensive two-dimensional Gas Chromatography with Time-of-Flight Mass Spectrometry (GC×GC ToF-MS). This technique yields a large volume of data difficult to process using traditional methods of chemical analysis. To address this, machine learning and computer vision techniques are applied. In this work, we propose an approach for both tasks using pattern recognition techniques. Unlike traditional chemical analysis pipelines, our method operates directly on the raw GC×GC ToF-MS output, leveraging its rich spatial and spectral structure for automated prediction. We evaluate the performance of our approach and benchmark it against established chromatographic techniques. The method consists of three parts. First, the spatial positions of chemical compounds are detected. Then, data are registered to a canonical frame using piecewise linear interpolation with Delaunay triangulation. Finally, a neural network-based model is applied to classify sex or encode measurements into embeddings for identity verification. These embeddings are compared, and based on their distance a decision is made whether the samples originate from the same individual. Our method achieves 84.7% accuracy in 5-fold cross-validation for sex classification and an AUC of 0.91 with 50% true positive rate at 5% false positive rate for identity verification on the validation set.

Description

Citation

Rights/License

A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.

Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.

Endorsement

Review

Supplemented By

Referenced By