Exploiting a loss and a synthetic dataset protocol for biometrics system.

Silva, Pedro Henrique Lopes

Use este identificador para citar ou linkar para este item: http://www.repositorio.ufop.br/jspui/handle/123456789/15073

Título:	Exploiting a loss and a synthetic dataset protocol for biometrics system.
Autor(es):	Silva, Pedro Henrique Lopes
Orientador(es):	Moreira, Gladston Juliano Prates Luz, Eduardo José da Silva
Palavras-chave:	Machine learning Synthetic dataset Metric learning Biometrics Chimeric dataset
Data do documento:	2022
Membros da banca:	Moreira, Gladston Juliano Prates Luz, Eduardo José da Silva Queiroz, Rafael Alves Bonfim de Silva, Rodrigo César Pedrosa Oliveira, Luciano Rebouças de Santos, Thiago Oliveira dos
Referência:	SILVA, Pedro Henrique Lopes. Exploiting a loss and a synthetic dataset protocol for biometrics system. 2022. 81 f. Tese (Doutorado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2022.
Resumo:	Os sistemas biométricos são um assunto comum no cotidiano do ser humano. Os esforços para aumentar a segurança desses sistemas estão aumentando a cada ano devido à sua necessidade por robustez. Os sistemas baseados em uma modalidade biométrica não tem um desempenho próximo da perfeição em ambientes não cooperativos, o que exige abordagens mais complexas. Devido a isso, novos estudos são desenvolvidos para melhorar o desempenho de sistemas baseados em biometria, criando novas formas de ensinar um algoritmo de machine learning a criar novas representações. Atualmente, vários pesquisadores estão direcionando seus esforços para desenvolver novas abordagens de metric learning para arquiteturas de deep learning para uma ampla gama de problemas, incluindo biometria. Neste trabalho, propõe-se uma função de perda baseada em dados biométricos para criar representações profundas a serem utilizadas em sistemas biométricos, chamada de D-loss. Os resultados mostram a eficácia da função de perda proposta com a menor taxa de equal-error rate (EER) de 5,38%, 13,01% e 7,96% para MNIST-Fashion, CIFAR-10 e CASIA-V4. Uma estratégia diferente para aumentar a robustez de um sistema é a fusão de duas ou mais modalidades biométricas. No entanto, é impossível encontrar um conjunto de dados com todas as combinações de modalidades biométricas possíveis. Uma solução simples é criar um conjunto de dados sintéticos, embora a metodologia para criar um ainda seja um problema em aberto na literatura. Neste trabalho, propõe-se a criação de um critério para mesclar duas ou mais modalidades de tal forma a criar conjuntos de dados sintéticos semelhantes: o critério de Doddington Zoo. Várias estratégias de mesclagem são avaliadas: fusões ao nível de score (mínimo, multiplicação e soma) e nível de características (concatenação simples e metric learning). Um EER próximo a zero também é observado usando os critérios de fusão propostos com a fusão de soma de pontuação e as modalidades de Eletrocardiograma (CYBHi), olho e face (FRGC). Dois conjuntos de dados com mais de 1.000 indivíduos (UFPR-Periocular e UofTDB) são usados para avaliar os critérios de mesclagem junto com a D-loss e outras funções de metric learning. Os resultados mostram o aspecto do critério do Doddington Zoo de criar conjuntos de dados semelhantes (pequeno desvio padrão em relação ao critério randômico) e a robustez do D-loss (2,50% EER contra 2,17% da função de perda triplets e 5,74, da função de perda multi-similarity).
Resumo em outra língua:	Biometric systems are a common subject in human being’s daily life. The efforts to enhance the security of those systems are increasing every year due to their need for robustness. The system based on a biometric modality does not have a performance close to perfection in non-cooperative environments, which leads to more complex approaches. Due to that fact, new studies are developed to enhance biometric-based systems performance by creating new manners of teaching a machine learning algorithm to develop new representations. Currently, several researchers are directing their efforts to develop new metric learning approaches for deep learning architectures for a wide range of problems, including biometrics. In this work, we propose a biometric-based loss function to create deep representations to be used in biometric systems. It is called D-loss. The results show the effectiveness of the proposed loss with the smallest Equal-Error Rate (EER) of 5.38%, 13.01%, and 7.96% for MNIST-Fashion, CIFAR-10, and CASIA-V4. A different strategy to enhance system robustness is to fusion two or more biometric modalities. However, it is impossible to find a dataset with all possible biometric combinations. A simple solution is to create a synthetic one, although the methodology to create one is still an open problem in the literature. In this work, we propose a criterion to merge two or more modalities that create similar synthetic datasets: the Doddington Zoo criteria. Several merging strategies are evaluated: fusions at score level (minimal, multiplication, and sum) and feature level (simple concatenation and metric learning). We tested the proposed criterion on the FRGC (eye and face) and CYBHi (ECG - electrocardiogram) datasets. An EER close to zero is also observed using the merging criteria proposed with score sum fusion and the ECG, eye, and face modalities. Two datasets with over 1,000 individuals (UFPR-Periocular and UofTDB) are used to evaluate the merging criteria along with the D-loss and other metric learning losses. The results show the aspect of the Doddington Zoo criteria of creating similar datasets (small standard deviation compared to the random criteria) and the robustness of the D-loss (2.50% EER against 2.17% from the triplets and 5.74, multi-similarity loss).
Descrição:	Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
URI:	http://www.repositorio.ufop.br/jspui/handle/123456789/15073
Licença:	Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 15/07/2022 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho, desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais.
Aparece nas coleções:	PPGCC - Doutorado (Teses)

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
TESE_ExploitingLossSynthetic.pdf		14,3 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas

Este item está licenciado sob uma Licença Creative Commons