Provas de Doutoramento em Engenharia Informática (ProDEI): ”Novel Computational Methodologies for Detailed Analysis of Human Motion from Image Sequences”

Candidato:
João Ferreira de Carvalho Castro Nunes

Data, Hora e Local:
12 de dezembro de 2025, às 14:00 na Sala de Atos da Faculdade de Engenharia da Universidade do Porto

Presidente do Júri:
Doutor Pedro Nuno Ferreira da Rosa da Cruz Diniz, Professor Catedrático do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto

Vogais:
Doutor Carlos Miguel Fernandes Quental, Professor Auxiliar do Departamento de Engenharia Mecânica do Instituto Superior Técnico, Universidade de Lisboa;
Doutor Hugo Pedro Martins Carriço Proença, Professor Catedrático do Departamento de Informática da Universidade da Beira Interior;
Doutor João Manuel Ribeiro da Silva Tavares, Professor Catedrático do Departamento de Engenharia Mecânica da Faculdade de Engenharia, Universidade do Porto (Orientador);
Doutor Luís Paulo Gonçalves dos Reis, Professor Associado com Agregação do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto.

A tese foi coorientada pelo Doutor Pedro Miguel do Vale Moreira, Professor Catedrático do Instituto Politécnico de Viana do Castelo.

Resumo:

A análise da marcha humana fornece informações essenciais sobre a função biomecânica, a avaliação clínica e o reconhecimento biométrico. No entanto, alcançar uma compreensão do movimento que seja precisa e reprodutível em condições reais continua a ser um desafio significativo. As técnicas tradicionais de captura de movimento dependem de infraestruturas dispendiosas e
de ambientes controlados, o que limita a sua escalabilidade e validade em contextos reais. Esta tese procura ultrapassar essas limitações através do desenvolvimento de metodologias computacionais que exploram simultaneamente informação RGB e de profundidade, de modo a permitir uma análise da marcha robusta, eficiente e totalmente automática, recorrendo a sensores de baixo custo. A investigação seguiu uma trajetória estruturada que integra a criação de um conjunto de dados, o desenho de novas representações e a inovação metodológica. Em primeiro lugar, foi realizada uma revisão e análise comparativa abrangente dos conjuntos de dados existentes baseados em visão e profundidade, identificando lacunas quanto à diversidade de modalidades, qualidade das anotações e acessibilidade. Para colmatar estas limitações, foi concebido, adquirido e disponibilizado publicamente o Gait Recognition Image and Depth Dataset (GRIDDS). O GRIDDS fornece dados sincronizados de RGB, profundidade, silhueta e esqueleto 3D de 35 participantes registados em condições controladas, constituindo um dos primeiros recursos multimodais normalizados para análise e reconhecimento da marcha. Com base neste fundamento, foram propostas duas novas representações computacionais da marcha que combinam informação bidimensional de aparência com estrutura esquelética tridimensional, aumentando a robustez face a variações de ponto de vista, vestuário e objetos transportados. Estas variantes da Gait Skeleton Image (GSI), baseadas em articulações e em segmentos lineares, foram integradas em arquiteturas de aprendizagem profunda e avaliadas extensivamente, demonstrando um desempenho competitivo, e algumas circunstâncias, por vezes superior, em comparação com métodos baseados em aparência, através de múltiplos conjuntos de dados e condições de variabilidade. Por fim, foram introduzidos novos métodos de interpolação de silhuetas de marcha, que combinam raciocínio geométrico determinístico (BRIEF) com aprendizagem profunda bidirecional (BiSINet), permitindo reconstruir frames em falta e melhorar a coerência temporal. As técnicas de interpolação propostas evidenciaram melhorias significativas na precisão do reconhecimento e forte capacidade de generalização entre diferentes conjuntos de dados e taxas de amostragem. Em conjunto, as contribuições deste trabalho, que abrangem a aquisição multimodal de dados, o desenvolvimento de representações robustas da marcha e a reconstrucção temporal, avançam as fronteiras científicas e tecnológicas da análise da marcha humana, promovendo a reprodutibilidade, acessibilidade e aplicabilidade tanto nos domínios clínico como na visão por computador.

Posted in Destaque, Notícias, Provas PhD.