Provas de Doutoramento em Engenharia Informática (ProDEI): ”Educational Question Generation with Narrative and Difficulty Control: A Special Focus on Portuguese”

Candidato:
Bernardo José Coelho Leite

Data, Hora e Local:
17 de novembro de 2025, às 14:00 na Sala de Atos da Faculdade de Engenharia da Universidade do Porto

Presidente do Júri:

Doutor Pedro Nuno Ferreira da Rosa da Cruz Diniz, Professor Catedrático da Faculdade de Engenharia da Universidade do Porto

Vogais:

Doutor Hugo Ricardo Gonçalo Oliveira, Professor Associado do Departamento de Engenharia Informática da Faculdade de Ciências e Tecnologia da Universidade de Coimbra;

Doutora Maria Luísa Torres Ribeiro Marques da Silva Coheur, Professora Associada do Departamento de Engenharia Informática do Instituto Superior Técnico da Universidade de Lisboa;

Doutor Luís Paulo Gonçalves dos Reis, Professor Associado com Agregação do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto;

Doutor Henrique Daniel de Avelar Lopes Cardoso, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto (Orientador).

Resumo:

Os seres humanos colocam questões com frequência e têm sido desenvolvidos esforços para criar sistemas de Inteligência Artifical (IA) que façam o mesmo. Esta tarefa, conhecida como Geração de Questões (GQ), é um subcampo da geração de linguagem natural que visa produzir automaticamente questões relevantes e gramaticalmente corretas a partir de um determinado texto de referência. Uma das principais motivações para a GQ é apoiar tarefas morosas, como a criação manual de questões por parte dos professores. Embora os sistemas de GQ tenham melhorado significativamente, a correção gramatical por si só não garante um valor educativo nas questões geradas. Consequentemente, a adoção de ferramentas de GQ em contextos educativos continua a ser limitada.

Esta tese é motivada por três desafios principais identificados na GQ: (1) a fiabilidade das questões geradas pela IA; (2) a capacidade limitada do controlo da geração; (3) a reduzida aplicabilidade em línguas com menos recursos. Para abordar estes desafios, o foco incide na geração de questões de compreensão de leitura, de resposta aberta e de escolha múltipla, a partir de textos narrativos dirigidos a alunos do ensino básico. Relativamente ao desafio 1, analisamos e avaliamos a qualidade das questões geradas, identificando casos de sucesso e de insucesso. No desafio 2, reforçamos os mecanismos de controlo da geração, incorporando múltiplos atributos nas questões geradas, como elementos narrativos, grau de explicitude e nível de dificuldade. O desafio 3 é abordado através de uma atenção especial na Língua Portuguesa, que é morfologicamente rica, mas sub representada na investigação em GQ.

A abrangência da nossa metodologia vai desde abordagens iniciais baseadas em regras linguísticas e redes neuronais até técnicas mais avançadas de GQ com controlo, incluindo refinamento de modelos e prompting com nenhum ou poucos exemplos, usando modelos de linguagem de pequena e grande escala. Isto permite uma visão abrangente da evolução e desempenho dos sistemas de GQ ao longo das diferentes etapas. As contribuições incluem a aplicação e a adaptação sistemáticas de técnicas atuais de GQ, incluindo a elaboração de estudos que exploram o grau de controlo e a relevância educativa. São fornecidas, por isso, análises completas da qualidade das questões e são disponibilizados novos modelos e conjuntos de dados de GQ adaptados a línguas com menos recursos, como é o caso da Língua Portuguesa. A avaliação combina métricas de cálculo automático e análises centradas no utilizador, envolvendo especialistas, professores e alunos, cujas opiniões fornecem informações cruciais sobre a utilidade e eficácia das questões geradas.

Os resultados demonstram que é possível gerar questões bem formuladas com existência de resposta objetiva e passíveis de controlo. Embora as questões geradas pelos modelos se aproximem da qualidade daquelas criadas por seres humanos, continuam a verificar-se alguns problemas semânticos. Além disso, a geração de questões de escolha múltipla, em que as opções de resposta sejam eficazes para os alunos, continua a ser um desafio. As descobertas subjacentes sublinham a necessidade contínua da investigação na área da GQ no contexto educativo, especialmente através do apoio a línguas com menos recursos e na melhoria da fiabilidade dos sistemas automáticos de geração.

Provas de Doutoramento (PDMD): ”Food Wide Web: a digital food and media literacy program addressed to adolescents”

Candidata
Adriana Aguiar Aparício Fogel

Data, Hora e Local:
20 de outubro de 2025, às 14:30 na Sala de Atos da Faculdade de Engenharia da Universidade do Porto

Presidente do Júri:
Doutor António Fernando Vasconcelos Cunha Castro Coelho, Professor Associado com Agregação da Faculdade de Engenharia da Universidade do Porto

Vogais:
Doutora Joana Alves Dias Martins de Sousa Ferreira, Professora Auxiliar da Faculdade de Medicina da Universidade de Lisboa;
Doutora Ivone Marília Carinhas Ferreira, Professora Auxiliar do Departamento de Ciências da Comunicação da Faculdade de Ciências Sociais e Humanas da Universidade Nova de Lisboa;
Doutora Sara de Jesus Gomes Pereira, Professora Associada com Agregação do Departamento de Ciências da Comunicação do Instituto de Ciências Sociais da Universidade do Minho;
Doutora Ana Filipa Pereira Oliveira, Professora Auxiliar da Faculdade de Comunicação, Arquitetura, Artes e Tecnologias da Informação da Universidade Lusófona;
Doutor José Manuel Pereira Azevedo, Professor Catedrático do Departamento de Ciências da Comunicação e da Informação da Faculdade de Letras da Universidade do Porto (Orientador);
Doutor Ricardo José Pinheiro Fernandes Morais, Professor Auxiliar do Departamento de Ciências da Comunicação e da Informação da Faculdade de Letras da Universidade do Porto.

Resumo:

O complexo e saturado ambiente mediático atual deu origem a uma “infodemia” — um excesso de informações, tanto corretas quanto enganosas — com potencial impacto na saúde das populações. No campo da nutrição, a ampla disseminação de conteúdos enviesados ou incorretos contribui potencialmente para comportamentos alimentares pouco saudáveis e pode ajudar a explicar a elevada prevalência global de obesidade. Os adolescentes são especialmente sensíveis a este fenómeno pelo facto de os seus processos de autorregulação não estarem plenamente desenvolvidos e devido à maior suscetibilidade à influência de estímulos externos durante esta fase. Este contexto reforça a importância de promover, de forma integrada, uma literacia alimentar e mediática junto dos jovens, fornecendo-lhes ferramentas que lhes permitam interpretar criticamente, questionar, e lidar conscientemente com as influências do marketing alimentar e da desinformação sobre nutrição. Este estudo desenvolveu-se nesta conjuntura e teve três objetivos principais: (i) desenvolver e implementar uma intervenção que integrasse as dimensões da literacia alimentar e mediática em contexto escolar; (ii) avaliar a sua efetividade na promoção da literacia alimentar e mediática de adolescentes; e (iii) contribuir para a caracterização dos níveis de literacia alimentar e
mediática dos adolescentes em Portugal. A intervenção consistiu em dez sessões de 45 minutos, abordando oito dimensões do sistema alimentar — produção; transformação; distribuição; planeamento e gestão; seleção; preparação e confecção; consumo; e gestão do desperdício — através das competências centrais da literacia mediática: acesso, análise, avaliação e criação. Os conteúdos incluíram materiais mediáticos que incentivaram a reflexão e o debate sobre o sistema alimentar global. O programa foi implementado entre outubro de 2022 e maio de 2023 em quatro escolas do norte de Portugal — duas integraram o grupo de intervenção e duas o grupo controlo. A amostra final foi composta por 202 estudantes entre os 13 e os 16 anos (M = 13,6; DP = 0,75). Foram recolhidas informações através de um questionário que englobou cinco áreas temáticas principais: (a) exposição à publicidade de alimentos, (b) satisfação com o peso corporal, (c) opiniões, atitudes e conhecimento sobre media e alimentos, (d) padrões de ingestão alimentar e (e) literacia relacionada com a alimentação e os conteúdos mediáticos. O questionário construído a partir de instrumentos pré-existentes incluía perguntas abertas e fechadas, tendo sido aplicado em ambos os grupos, antes e após as sessões. No grupo de intervenção, os projetos desenvolvidos em sala de aula também foram alvo de análise. Os dados quantitativos foram avaliados estatisticamente e os dados qualitativos foram sujeitos a uma análise temática híbrida (indutiva/dedutiva), seguida de análise de conteúdo. Após a análise qualitativa inicial, foi desenvolvido um sistema de pontuação que atribuiu valores numéricos às respostas. Em linha com os objetivos do projeto, as escolhas saudáveis e sustentáveis, bem como as avaliações críticas e as criações com incentivo à participação foram valorizadas. Para este sistema de pontuação contribuíam as perguntas fechadas mas também as ações baseadas em tarefas, permitindo uma avaliação quantificável e abrangente do impacto da intervenção nas literacias alimentar e mediática dos estudantes, bem como nos seus comportamentos associados. As questões fechadas incluíram uma escala de resposta de Likert, composta por 15 questões sobre atitudes, opiniões e conhecimentos, tendo sido pontuada de 0 a 4 em cada item, com um máximo possível de 60 pontos. A secção relativa à frequência do consumo alimentar foi convertida para a respetiva ingestão semanal que resultou num índice de adequação alimentar, com pontuações positivas atribuídas a comportamentos saudáveis (ex.: consumo de frutas e legumes) e negativas a comportamentos não saudáveis (ex.: consumo de fast food), com uma pontuação inicial entre – 15 e 38, posteriormente transformada numa escala com início em 0, para facilitar a interpretação. Por fim, a secção sobre literacia mediática alimentar avaliou a compreensão de rótulos alimentares (0 a 6 pontos possíveis, com base em respostas corretas) e a literacia publicitária (pontuação até 14 pontos), incluindo análise crítica de anúncios (um em imagem e um em vídeo) e uma atividade criativa aberta. As respostas foram analisadas consoante à sua complexidade, considerando a capacidade de interpretar estratégias de marketing e expressar ideias de forma crítica e criativa. A conversão dos dados qualitativos em escalas numéricas permitiu comparações estatísticas entre momentos (pré vs. pós) e entre grupos (controlo vs. intervenção; masculino vs. feminino). Os resultados demostraram que a intervenção desenvolvida foi exequível e efetiva. Observaram-se melhorias significativas na literacia publicitária dos alunos (1,5 vs. 1,9; p = 0,009) e na sua capacidade de interpretar rótulos alimentares (2,0 vs. 2,2; p = 0,039). Entre as meninas do grupo de intervenção, observou-se uma melhora significativa nas pontuações totais referentes a opiniões, atitudes e conhecimento sobre media e alimentos (36.8 vs 38.1; p = 0,037). Relativamente à satisfação corporal, diferenças significativas entre as meninas do grupo intervenção e as do grupo controlo no momento pré intervenção tornaram-se insignificantes após a intervenção (p = 0,015 vs. p = 0,402). O mesmo aconteceu com as diferenças entre as meninas e meninos do grupo intervenção, que eram significativasapenas antes do programa (p = 0,010 vs. p = 0,412). Estes dados refletem melhorias na satisfação com a imagem corporal particularmente entre as participantes do sexo feminino, que reportam uma relação mais equilibrada e saudável com o seu corpo e hábitos alimentares após a participação no programa. Com relação aos padrões alimentares, os participantes do sexo masculino também apresentaram melhorias porém em hábitos específicos, destacando-se um incremento no consumo de cereais e tubérculos (6.2 vs. 8.2; p = 0,032). Contudo, identificou-se uma preocupação persistente relacionada com o peso corporal: 43.5% das meninas manifestaram desejo de alterar o seu peso, embora apenas 28.3% declarassem estar fora do peso que considerariam normal. Entre os rapazes, 76.1% deles se declararam num peso normal, mas 35.8% reportaram o desejo de mudar o seu peso, mesmo após participarem da intervenção. Além disso, constataram-se lacunas no conhecimento sobre o padrão alimentar mediterrânico recomendado em Portugal, um importante aspeto na caracterização dos adolescentes. Considerando-se a totalidade da amostra, os estudantes revelaram dificuldades em responder adequadamente a questões relativas a este tópico, reportando níveis apenas moderados de adesão ao referido padrão alimentar. Neste quesito, os participantes obtiveram uma pontuação 30,6 (SD = 7,4), de um máximo de 53. Os adolescentes relataram ainda uma habitual exposição a anúncios de alimentos ricos em açúcar, sal e gordura, apesar das medidas regulatórias existentes. Apenas 6,7% declararam não ter visto publicidade destes produtos nos 30 dias anteriores à pesquisa. Concluindo, esta tese propõe um modelo conceptual inovador que integra a literacia alimentar e mediática. Sustentada por evidência empírica, inclui um plano de aulas devidamente organizado e instrumentos de avaliação detalhados, constituindo um recurso prático para educadores em geral. Os recursos de apoio utilizados nas sessões são potencialmente adaptáveis a diferentes contextos educativos e geográficos. Os resultados contribuem para o crescente corpo de evidência que apoia intervenções educativas de carácter abrangente e reforçam a importância de integrar a literacia alimentar e mediática nos currículos escolares como estratégia para promover o pensamento crítico e escolhas alimentares informadas. Por fim, os dados apontam que um esforço conjunto é essencial para preparar os adolescentes para navegar num ambiente alimentar cada vez mais complexo, promovendo escolhas mais saudáveis e conscientes. Neste sentido, uma colaboração entre decisores políticos, profissionais de educação e agentes dos sectores envolvidos (anunciantes, agências de publicidade, veículos de comunicação, plataformas
digitais) é essencial. As ações adotadas hoje têm um impacto importante na saúde e no bem-estar desta e das futuras gerações.

Palavras-chave: literacia mediática; literacia alimentar; media digitais; programa educativo em
ambiente escolar; adolescentes.

Provas de Doutoramento em Engenharia Informática (ProDEI): ”Generative models for soccer”

Candidato:
Tiago Filipe Mendes Neves

Data, Hora e Local:
16 de setembro de 2025, 15h30, Sala de Atos da Faculdade de Engenharia da Universidade do Porto

Presidente do Júri:
Doutor Pedro Nuno Ferreira da Rosa da Cruz Diniz, Professor Catedrático do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto

Vogais:
Doctor Keisuke Fujii, Associate Professor at the Department of Intelligent Systems of the Graduate School of Informatics of the Nagoya University, Japan;
Doctor Jesse Jon Davis, Full Professor at the Department of Computer Science of the Faculty of Engineering Science of the Katholieke Universiteit Leuven, Belgium;
Doutor Luís Paulo Gonçalves dos Reis, Professor Associado com Agregação do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto;
Doutor João Pedro Carvalho Leal Mendes Moreira, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto (Orientador).

A tese foi coorientada pelo Doutor Luís Jorge Machado da Cunha Meireles, Senior Psychologist & Data Scientist, FC Porto.

Resumo:

Os grandes modelos auto-supervisionados em áreas como a linguagem, a visão e a biologia estão a transformar o mundo. No entanto, estes modelos generativos, que aprendem a distribuição dos dados com que são treinados, não apresentam o mesmo nível de desempenho em todos os usos. Por exemplo, os Large Language Models (LLMs) ainda não têm um caso de uso concreto na análise desportiva. Faltam capacidades de raciocínio a estes modelos para produzir conhecimento aplicável para poderem competir com um conjunto de métricas específicas já estabelecidas na análise desportiva.
Embora existam alguns estudos que exploram a aplicabilidade de modelos generativos no futebol, nenhum estudo ambiciona resolver o desafio de construir um modelo de aprendizagem autosupervisionada completo para dados de eventos de futebol. Se considerarmos os eventos num jogo de futebol (cada remate, passe, desarme, …) como as “palavras” que descrevem o que está a acontecer, podemos considerar cada posse de bola uma “frase”, cada jogo uma “composição” e os dados de eventos uma “linguagem”. Ao trabalhar neste enquadramento, temos todas as ferramentas para construir um modelo auto-supervisionado à imagem das LLMs. O objetivo desta tese é construir um modelo de base auto-supervisionado para dados de eventos de futebol – denominado Large Events Model (LEM) – e demonstrar a sua aplicabilidade no campo e generalidade na resolução de diferentes tarefas, como simulação e modelação, que de outra forma exigiriam abordagens individualizadas. Propomos três abordagens para construir LEMs: chain of classifiers, causal mask modeling, e sequential language modeling com transformers.
Em primeiro lugar, a chain of classifiers fornece o primeiro modelo generativo que modela todos os aspetos dos dados de eventos sem impor restrições aos tipos de eventos, alcançando um nível de desempenho que permite a simulação em larga escala de jogos de futebol. Investigamos também duas abordagens alternativas para remover restrições da primeira abordagem. A abordagem de causal mask modeling usando redes neuronais tem o melhor desempenho em vários dos nossos critérios de avaliação, fornecendo um conjunto de modelos prontos para resolver uma ampla gama de tarefas de análise de futebol. Exploramos aplicações desde a pesquisa automática de estratégias com aprendizagem por reforço até aos comportamentos de risco-recompensa dos jogadores de futebol. Esta tese apresenta mais de uma dúzia de casos de uso para LEMs. As LEMs têm o potencial de se tornarem o sistema operativo para dados de eventos na análise do futebol. Elas transformam a forma como os clubes trabalham, com um acesso facilitado a modelos que de outra forma exigiriam um grande esforço de modelação. Com as LEMs, a barreira de entrada diminuirá significativamente, pois qualquer clube do mundo poderá aceder a um modelo capaz de resolver os seus problemas mais relevantes.

Palavras Chave: modelos generativos; modelos de base; analítica desportiva; aplicações de aprendizagem profunda; simulação; futebol.

Provas de Doutoramento em Engenharia Informática (ProDEI): “Text Information Retrieval in Tetun”

Candidato:
Gabriel de Jesus

Data, Hora e Local:
1 de setembro de 2025, 14:30, Sala de Atos da Faculdade de Engenharia da Universidade do Porto

Presidente do Júri:
Doutor Rui Filipe Lima Maranhão de Abreu, Professor Catedrático do Departamento de Engenharia de Informática da Faculdade de Engenharia da Universidade do Porto

Vogais:
Doctor Arjen P. de Vries, Full Professor at the Institute for Computing and Information Sciences of the Radboud Universiteit, Nimega, The Netherlands;
Doutor Bruno Emanuel da Graça Martins, Professor Associado do Departamento de Engenharia Eletrotécnica e de Computadores do Instituto Superior Técnico da Universidade de Lisboa;
Doutor Henrique Daniel de Avelar Lopes Cardoso, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto;
Doutor Sérgio Sobral Nunes, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto (Orientador).

Resumo:

Garantir o acesso à informação em todas as línguas é crucial para reduzir as disparidades na participação das comunidades na era digital e promover uma sociedade mais inclusiva e equitativa, em particular para os falantes de línguas com poucos recursos. Contudo, permitir esse acesso continua a ser um desafio significativo para muitas dessas comunidades. O Tetun, uma língua que passou de dialeto a uma das línguas oficiais de Timor-Leste aquando da restauração da independência do país, em 2002, enfrenta desafios semelhantes. De acordo com o censo de 2015, o Tetun é falado por aproximadamente 79% da população, estimada em 1,18 milhões de habitantes. Apesar do seu estatuto oficial, o Tetun continua a ser subservido na tecnologia linguística. Em particular, não existem soluções de recuperação de informação para esta língua, o que dificulta a obtenção de informação relevante na internet e em plataformas digitais, no contexto de pesquisas textuais. Este trabalho aborda estes desafios, explorando estratégias de recuperação para pesquisas textuais que permitam aplicar técnicas de recuperação de informação no desenvolvimento de soluções de pesquisa para Tetun, com um foco específico na tarefa de recuperação ad-hoc de texto. Tendo em conta a inexistência de algoritmos, ferramentas e coleções de documentos para Tetun, este trabalho iniciou-se com a criação desses recursos fundamentais, que constituem contribuições relevantes para os domínios da recuperação de informação e do processamento de linguagem natural. Estes recursos incluem um tokenizador, um modelo de identificação de língua, um stemmer, uma lista de stopwords, uma coleção de documentos textuais em Tetun, uma coleção de julgamentos de relevância, resultados de referência para a tarefa de recuperação ad-hoc de texto, e uma coleção de interrogações de pesquisa. As contribuições para a recuperação de informação em línguas com poucos recursos incluem: (1) Um processo estruturado de recolha de dados, concebido para línguas com poucos recursos, que visa agilizar a construção de dados textuais a partir da web; (2) Uma metodologia com intervenção humana para anotar, processar e construir um conjunto de dados adequado a diversas tarefas de recuperação de informação e processamento de linguagem natural; (3) Uma abordagem baseada em redes para a deteção de stopwords; (4) Metodologias para o desenvolvimento de um stemmer, concebido para uma língua fortemente influenciada por empréstimos linguísticos, e a criação de um conjunto de dados de referência para a avaliação do seu desempenho; (5) Uma metodologia para a construção de um conjunto de dados de referência para a avaliação dos sistemas de recuperação; (6) Uma metodologia para estabelecer resultados de referência robustos para a tarefa de recuperação ad-hoc de texto; e (7) Estratégias de contextualização de documentos e de afinação com dois parâmetros para recuperação de texto baseada em pesquisa híbrida. Os resultados deste trabalho contribuem para o desenvolvimento de tecnologias associadas ao processamento computacional de Tetun, preenchem lacunas nos seus recursos linguísticos e alcançam resultados que elevam o estatuto do Tetun. Estes avanços abrem novas oportunidades para investigações e inovações futuras. Além disso, este trabalho introduz metodologias adaptáveis a outras línguas que enfrentam desafios semelhantes, contribuindo, assim, para o avanço da recuperação de informação em línguas com poucos recursos.

Provas de Doutoramento em Engenharia Informática: ”Onboard detection and guidance based on side scan sonar images for autonomous underwater vehicles”

Candidato:
Martin Joseph Aubard

Data, Hora e Local:
25 de julho de 2025, 14:00, Sala de Atos do DEEC (I-105), da Faculdade de Engenharia da Universidade do Porto

Presidente do Júri:
Doutor Pedro Nuno Ferreira da Rosa da Cruz Diniz, Professor Catedrático do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto

Vogais:
Doutor Bilal Wehbe, Senior Researcher at the German Research Center for Artificial Intelligence, Germany;
Doutora Catarina Helena Branco Simões da Silva, Professora Associada do Departamento de Engenharia Informática da Faculdade de Ciências e Tecnologia da Universidade de Coimbra;
Doutor Andry Maykol Gomes Pinto, Professor Associado do Departamento de Engenharia Eletrotécnica e de Computadores da Faculdade de Engenharia da Universidade do Porto;
Doutora Ana Maria Dias Madureira Pereira, Professora Coordenadora com Agregação do Departamento de Engenharia Informática do Instituto Superior de Engenharia do Porto (Orientadora).

A tese foi coorientada pelo Doutor Luís Filipe Pinto de Almeida Teixeira, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto.

Resumo:

Esta tese aborda o desafio de melhorar as capacidades de deteção e interação a bordo dos veículos subaquáticos autónomos (AUVs) utilizando dados de sonar de varrimento lateral (SSS). Tradicionalmente, as missões subaquáticas baseiam-se em planos pré-definidos em que os dados são analisados após a missão por operadores ou especialistas. Este fluxo de trabalho é moroso e requer frequentemente várias missões para identificar e localizar alvos subaquáticos. A necessidade de missões repetidas aumenta os custos operacionais e a complexidade, realçando a ineficiência das metodologias actuais. Além disso, estas abordagens não permitem que o AUV interaja com os alvos detectados em tempo real, limitando o âmbito da adaptação da missão e da tomada de decisões em tempo real. Para ultrapassar estas limitações, esta tese apresenta uma nova plataforma que integra modelos de aprendizagem profunda para a deteção de objectos diretamente embarcado de AUVs. Esta integração permite que o veículo detecte, localize e interaja com alvos subaquáticos em tempo real, oferecendo melhorias significativas em relação à análise tradicional pós-missão. A plataforma baseia-se nas ferramentas LSTS, responsáveis pelo controlo de movimento e comunicação do AUV, e introduz capacidades melhoradas de processamento de dados em tempo real. No entanto, a implementação de um modelo deste tipo num sistema embebido apresenta de limitações computacionais que afectam o desempenho do modelo. Assim, foram implementados métodos de Knowledge Distillation, garantindo modelos mais pequenos e mais eficientes para efetuar a deteção embarcado sem sacrificar a precisão. Além disso, para melhorar a robustez do modelo contra o ruído subaquático, foi introduzida uma nova plataforma de treino adversárial, ROSAR, que garante um funcionamento fiável mesmo em ambientes sonar ruidosos. Após a deteção a bordo e a melhoria da localização, aprofundamos a interação a bordo com o objeto detectado. Isto é realizado através da extensão da plataforma anterior e da sua validação através de um simulador personalizado, melhorando a interação com os objectos detectados. Isto é demonstrado através de um caso de utilização de inspeção de condutas, que reduz o tempo de missão ao combinar a deteção por sonar e a recolha de dados da câmara numa única missão, utilizando árvores de comportamento e modelos de segurança avaliados. Tendo em conta a falta de disponibilidade de dados de sonar no terreno, esta tese contribui com dois novos datasets de sonar de varrimento lateral disponíveis publicamente, SWDD e Subpipe, que incluem dados recolhidos no terreno em paredes e condutas, e anotados manualmente para deteção de objectos. Ao passar da análise pós missão para a deteção e interação em tempo real, esta tese melhora significativamente a eficiência operacional das missões AUV. A plataforma proposta simplifica as operações subaquáticas e melhora o comportamento autónomo dos AUVs, baseando-se num modelo de deteção de objectos eficiente, preciso e robusto para aplicações eficientes de exploração e monitorização subaquáticas.

Provas de Doutoramento em Engenharia Informática: ”Uncertainty interpretations for the robustness of object detection in self-driving vehicles”

Candidata:
Filipa Marília Monteiro Ramos Ferreira

Data, Hora e Local:
23 de julho de 2025, 14:30, Sala de Atos da Faculdade de Engenharia da Universidade do Porto

Presidente do Júri:
Doutor Carlos Miguel Ferraz Baquero-Moreno, Professor Catedrático do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto

Vogais:
Doutor Tiago Manuel Lourenço Azevedo, Investigador Associado do Department of Computer Science and Technology da Universidade de Cambridge, Reino Unido;
Doutor Marco António Morais Veloso, Professor Coordenador do Departamento de Ciências e Tecnologia da Escola Superior de Tecnologia e Gestão de Oliveira do Hospital do Instituto Politécnico de Coimbra;
Doutor Luís Filipe Pinto de Almeida Teixeira, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto;
Doutor Rosaldo José Fernandes Rossetti, Professor Catedrático do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto (Orientador).

Resumo:

Assegurar a fiabilidade e robustez de deep learning continua a ser um desafio urgente, particularmente com a tração atual para utilizar redes neuronais em aplicações de segurança crítica. Apesar de existir investigação extensiva focada em melhorar a eficácia destes modelos em variados bancos de dados, a generalisação, interpretabilidade e robustez no domínio de aplicação continuam pouco entendidas. Em cenários do mundo real, é frequente modelos falharem ou terem eficácia subpar sem uma explicação aparente. Para endreçar estas preocupações, quantificação de incerteza emergiu recentemente como uma direção chave de investigação, oferecendo uma vista mais aprofundada de redes neuronais e melhorando a confiança, interpretabilidade e robustez destes sistemas. Dentro das aplicações de segurança crítica, condução autónoma destaca-se como uma área onde deteção de objetos consciente da sua incerteza pode significativamente melhorar a perceção e o processo de tomada de decisão destes veículos. Esta tese explora interpretações de incerteza especificamente desenhadas para o âmbito de deteção de objetos no contexto de condução autónoma. Neste sentido, dois novos métodos para estimar o componente aleatórico e uma abordagem para modelar a incerteza epistémica são propostos. Através do uso de distribuições de âncoras já disponíveis em qualquer detetor de objetos baseado neste mecanismo, a incerteza é estimada holisticamente evitando procedimentos custosos de geração de amostragens. Para além disto, o conceito de existência é introduzido, traduzindo-se numa medida probabilística que indica se um objeto realmente existe no mundo real, independentemente da sua classificação. Construindo a partir destas ideias, três aplicações de incerteza e existência são exploradas, em concreto o Existence Map, o Uncertainty Map e a Existence Probability. Enquanto que os mapas de existência e incerteza codificam a medida de existência e a incerteza aleatórica no espaço dos exemplos de entrada, a probabilidade de existência combina a informação disponibilizada pelo Existence Map com o retorno standardizado do modelo, culminando numa avaliação dos dados mais completa. A avaliação mostra a coerência das estimativas de incerteza e demonstra a utilidade dos mapas de existência e incerteza a suportarem o modelo standardizado, permitindo capacidades de open-set e atribuindo um grau de confiança a verdadeiros e falsos positivos e a falsos negativos. A estratégia de fusão da probabilidade de existência reporta uma melhoria considerável na performance do detetor de objetos tanto em validação como em dados de perturbação, enquanto deteta todos os tipos de objetos apesar de o modelo ter sido apenas treinado em carros, peões e ciclistas.
A segunda parte desta tese apresenta um estudo sobre a distribuição de underspecification e a sua conexão com a incerteza epistémica. Underspecification, demonstrada recentemente, gravemente ameaça a utilização eficaz de deep learning em sistemas de segurança crítica visto que descreve a variabilidade de predictors gerados por uma arquitetura com desempenhos divergentes no domínio de aplicação. A análise feita mostra que, se a estimativa de incerteza estiver corretamente calibrada, um único predictor é suficiente para prever a dispersão da distribuição de underspecification, evitando custosas e repetidas sessões de treino. Para além disto, todos os métodos propostos são desenhados para serem independentes de modelo, compatíveis com processamento em tempo-real e aplicável a modelos já em utilização sem requerir novo treino, reinforçando a sua relevância para deteção de objetos robusta e interpretável em veículos autónomos.

Provas de Doutoramento em Engenharia Informática: ”Aiding researchers making their computational experiments reproducible”

Candidato:
Lázaro Gabriel Barros da Costa

Data, Hora e Local:
18 de julho de 2025, 16:00, Sala de Atos da Faculdade de Engenharia da Universidade do Porto

Presidente do Júri:
Doutor Pedro Nuno Ferreira da Rosa da Cruz Diniz, Professor Catedrático do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto.

Vogais:
Doctor Tanu Malik, Associate Professor in the Department of Electrical Engineering and Computer Science at the University of Missouri, U.S.A;
Doutor Miguel Carlos Pacheco Afonso Goulão, Professor Associado do Departamento de Informática da Faculdade de Ciências e Tecnologia da Universidade Nova de Lisboa;
Doutor Gabriel de Sousa Torcato David, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto;
Doutor Jácome Miguel Costa da Cunha, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto (Orientador).

A tese foi coorientada pela Doutora Susana Alexandra Tavares Meneses Barbosa, Investigadora Sénior do INESCTEC Porto.

Resumo:

A reprodutibilidade e a replicabilidade científica são pilares essenciais de uma investigação credível, especialmente à medida que os experiências computacionais se tornam cada vez mais prevalentes em diversas disciplinas científicas, como a química, a ciência do clima e a biologia. Apesar da forte defesa da Ciência Aberta e da adesão aos princípios FAIR (Findable, Accessible, Interoperable e Reusable — Localizável, Acessível, Interoperável e Reutilizável), alcançar uma verdadeira reprodutibilidade continua a ser um desafio considerável para muitos investigadores. Questões fundamentais como a gestão complexa de dependências, metadados inadequados e o acesso frequentemente moroso ao código e dados necessários comprometem seriamente os esforços de reprodutibilidade. Além disso, as ferramentas atualmente disponíveis oferecem frequentemente soluções fragmentadas que não conseguem responder às necessidades multifacetadas de configurações experimentais diversas e complexas, particularmente aquelas que envolvem múltiplas linguagens de programação e sistemas de dados intricados.
Esta tese aborda estes desafios através da apresentação de uma ferramenta abrangente concebida para melhorar a reprodutibilidade computacional em várias áreas científicas. A nossa abordagem
incluiu uma revisão sistemática detalhada das ferramentas existentes de reprodutibilidade com o objetivo de identificar lacunas e limitações prevalecentes ao nível do design e funcionalidade.
Esta revisão evidenciou a natureza fragmentada dessas ferramentas, cada uma suportando apenas aspetos do processo de reprodutibilidade, sem fornecer uma solução holística, em particular
para experiências que exigem uma gestão de dados robusta ou suporte a múltiplas linguagens de programação.
Para colmatar estas lacunas, introduzimos o SCIREP, uma ferramenta inovadora que automatiza aspetos essenciais do fluxo de trabalho da reprodutibilidade, como a gestão de dependências, containerização e compatibilidade entre plataformas. Esta ferramenta foi rigorosamente avaliada utilizando um conjunto curado de experiências computacionais, alcançando uma taxa de sucesso
de reprodutibilidade de 94%. Com o objetivo de aumentar a acessibilidade e a usabilidade da investigação reprodutível, desenvolvemos o SCICONV, uma interface conversacional que simplifica a configuração e execução de experiências computacionais, utilizando processamento de linguagem natural. Esta interface reduz significativamente as barreiras técnicas tradicionalmente associadas à configuração de estudos reprodutíveis, permitindo que os investigadores interajam com o sistema através de conversas simples e orientadas. Os resultados da avaliação indicaram que o SCICONV conseguiu reproduzir 83% das experiências do nosso conjunto de dados curado com a mínima interação do utilizador, demonstrando o seu potencial para tornar a investigação reprodutível mais acessível a uma gama mais ampla de investigadores.
Adicionalmente, reconhecendo o papel fundamental dos estudos com utilizadores na avaliação de ferramentas, metodologias e protótipos — particularmente nas áreas da engenharia de software e das ciências comportamentais—esta tese estende-se também ao domínio da avaliação experimental de ferramentas. Conduzimos uma análise aprofundada das ferramentas existentes utilizadas em experiencias nas áreas mencionadas, identificando e propondo funcionalidades especificas destinadas a melhorar a sua utilidade e facilidade de uso na condução de estudos com utilizadores. Estas funcionalidades foram validadas através de um inquérito a comunidade cientifica, confirmando a sua relevância e a necessidade da sua integração em ferramentas atuais e futuras. As contribuições desta tese são múltiplas, abrangendo o desenvolvimento de uma classificação para ferramentas de reprodutibilidade, a criação de um conjunto de dados de referencia padronizado para avaliação da eficácia das ferramentas, e a formulação das ferramentas SCIREP e SCICONV para um avanço significativo do estado da arte em reprodutibilidade computacional. No futuro, a investigação ira centrar-se na expansão das capacidades destas ferramentas para suportar fluxos de trabalho científicos mais complexos, melhorar as interfaces de utilizador e integrar funcionalidades adicionais que suportem os estudos com utilizadores. Ao faze-lo, este trabalho visa abrir caminho para um ecossistema de reprodutibilidade computacional mais robusto, acessível e eficiente, capaz de responder as necessidades em constante evolução da comunidade cientifica global.

Palavras-chave: Reprodutibilidade; Replicabilidade; Reutilização; Experiências computacionais; Interface de utilizador conversacional; Estudos de utilizadores.

Provas de Doutoramento em Media Digitais: ”Mapping Multi-Meter Rhythm in the DFT: Towards a Rhythmic Affinity Space”

Candidato:
Diogo Miguel Filipe Cocharro

Data, Hora e Local:
22 de julho de 2025, 15:00, Sala de Atos da Faculdade de Engenharia da Universidade do Porto

Presidente do Júri:
Doutor António Fernando Vasconcelos Cunha Castro Coelho, Professor Associado com Agregação do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto

Vogais:
Doutor Matt Chiu, Assistant Professor of Music Theory at the Conservatory of Performing Arts at the Baldwin Wallace University, EUA;
Doutor Daniel Gómez-Marín, Profesor del Departamento de Diseño e Innovación de la Escuela de Tecnología, Diseño e Innovación de la Facultad Barberi de Ingeniería, Diseño y Ciencias Aplicadas de la Universidad Icesi, Colombia;
Doutora Sofia Carmen Faria Maia Cavaco, Professora Auxiliar do Departamento de Informática da Faculdade de Ciências e Tecnologia da Universidade Nova de Lisboa;
Doutor Sérgio Reis Cunha, Professor Auxiliar do Departamento de Engenharia Eletrotécnica e de Computadores da Faculdade de Engenharia da Universidade do Porto;
Doutor Gilberto Bernardes de Almeida, Professor Auxiliar do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto (Orientador).

A tese foi coorientada pelo Doutor Rui Luis Nogueira Penha, Professor Coordenador da Escola Superior de Música e das Artes do Espetáculo.

Resumo:

A música é inerentemente uma manifestação temporal, e o ritmo é um componente crucial dela. Enquanto o ritmo pode existir sem melodia ou harmonia, estas últimas não podem existir sem o ritmo. No entanto, o ritmo é uma disciplina frequentemente menos estudada em comparação com a harmonia. A afinidade rítmica é um conceito musical que descreve a relação natural e agradável entre dois ou mais padrões rítmicos. Trata-se de quando esses padrões, mesmo que complexos ou aparentemente díspares, criam uma sensação de coesão e fluidez em vez de dissonância ou conflito. Esta afinidade pode surgir de vários fatores, como motivos rítmicos partilhados, estruturas rítmicas complementares ou um pulso subjacente forte que unifica as diferentes camadas. Estudiosos da música começaram recentemente a investigar estes fenómenos, particularmente o trabalho seminal de Harald Krebs sobre Dissonância Rítmica, que contribuiu com um quadro abrangente para compreender e categorizar a dissonância métrica na música, ou o trabalho de Godfried T. Toussaint, que discute vários métodos para medir a similaridade rítmica, oferecendo perspectivas sobre as inter-relações estruturais entre diferentes ritmos. Um estudo recente investigou o comportamento de métricas típicas de similaridade rítmica em diferentes géneros. As principais conclusões revelaram que a similaridade varia dentro de um intervalo limitado entre géneros e instrumentos. Esta análise sistemática abriu a discussão e pesquisa sobre o conceito de compatibilidade rítmica, enfatizando a necessidade de compreendê-la como um conceito distinto da similaridade rítmica. Conjuntamente, isso proporcionou condições para estudos subsequentes e abriu novas perspetivas para reunir conceitos relacionados à afinidade rítmica. O espaço da Transformada Discreta de Fourier (DFT) tem sido amplamente aplicado na harmonia para criar espaços de altura, mostrando grande potencial para mapear todos os tipos de configurações de alturas correspondentes às perceções humanas de alturas, acordes e tonalidades, bem como aos princípios da teoria musical como distâncias. A sua aplicação no ritmo tem sido geralmente limitada somente a padrões rítmicos ou dentro do contexto de uma peça musical, não como um espaço rítmico multimétrico que abrangente a todo o espectro de ritmos. Este estudo investiga o potencial da DFT como um espaço rítmico multimétrico para explorar afinidades rítmicas, focando especificamente na categoria de dissonância de agrupamento. Este fenómeno relaciona-se com práticas frequentemente encontradas na composição musical, como poli-metria, poli-ritmos, hemiolas e quiálteras, que permitem a sobreposição de padrões rítmicos que, em princípio, apresentam baixa similaridade entre si, mas que são percecionados como agradáveis enquanto dissonância combinada. O exemplo mais conhecido é o de três contra dois. O objetivo principal é analisar e criar padrões rítmicos examinando similaridade e dissonância no espaço. A nossa abordagem centra-se em estratégias para representar ritmos no domínio do tempo e as suas implicações no domínio da frequência. Constatámos que cada método tem capacidades distintas para captar similaridade e dissonância, podendo ser usado para diversos propósitos musicais.

Provas de Doutoramento em Media Digitais: “Integration of models for linked data in cultural heritage and contributions to the FAIR principles”

Candidata:
Inês Dias Koch

Data, Hora e Local:
1 de julho de 2025, 14:30, Sala de Atos da Faculdade de Engenharia da Universidade do Porto

Título:
“Integration of models for linked data in cultural heritage and contributions to the FAIR principles”

Presidente do Júri:
Doutor João Carlos Pascoal Faria, Professor Catedrático do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto.

Vogais:
Doutora Maja Žumer, Professora Catedrática, Department of Library and Information Science of the University of Ljubljana, Slovenia;

Doutora María Poveda Villalón, Professora Associada, Departament of Artificial Intelligence of the Technical University of Madrid, Spain;

Doutor José Luís Brinquete Borbinha, Professor Catedrático, Departamento de Informática do Instituto Superior Técnico da Universidade de Lisboa;

Doutor Pedro Manuel Rangel Santos Henriques, Professor Catedrático, Departamento de Informática da Escola de Engenharia da Universidade do Minho;

Doutora Carla Alexandra Teixeira Lopes, Professora Associada, Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto (Orientadora);

Doutora Mariana Curado Malta, Professora Auxiliar, Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto.

A tese foi Coorientada pela Doutora Maria Cristina de Carvalho Alves Ribeiro, Professora Associada Aposentada do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto.

Resumo:

As diversas áreas do Património Cultural, como os arquivos, os museus e as bibliotecas, têm investido no desenvolvimento tecnológico e na inovação para disponibilizar os seus recursos aos utilizadores de forma mais eficiente e completa. Para tal, a descrição destes recursos é essencial para que sejam explicitados em termos do seu contexto e conteúdo, bem como para facilitar a sua inteligibilidade e acessibilidade. Neste sentido, cada área do património começou a desenvolver os seus próprios modelos e normas para descrever os objetos culturais com que lida. Isto fez com que estas normas se tornassem específicas de cada domínio e pudessem apenas atender às necessidades de informação dentro da área de conhecimento em que foram desenvolvidos, explorando apenas a informação descrita dentro do seu domínio. Como resultado, ligar recursos de diferentes fontes de informação é desafiante. Com a necessidade de tornar os padrões e modelos mais interoperáveis, surgiram modelos de dados ligados no Património Cultural. Estes modelos permitem ligar os vários conceitos das diferentes áreas do património de forma eficiente e eficaz, considerando as características da Web Semântica.
Em Portugal, o Arquivo Nacional sentiu a necessidade de desenvolver um modelo de dados interligados para descrever os seus objetos culturais, o que levou à criação do Projeto EPISA, projeto do qual surgiu esta investigação. Assim, este trabalho tem como objetivo desenvolver um modelo de dados ligados para descrever os registos de arquivo, bem como conectá-los a outros domínios do património cultural. Para além disso, pretende integrar o modelo desenvolvido com os modelos de dados ligados existentes, promovendo o acesso e a reutilização de dados de instituições patrimoniais com base na descrição especializada. Além disso, visa ligar os modelos de dados existentes a dados de outras fontes disponíveis na Web, como a Wikidata e a DBpedi.Realizamos um estudo que inclui modelos de dados existentes no Património Cultural, como o CIDOC CRM em museus, o RiC-CM em arquivos e o LRMoo em bibliotecas, juntamente com modelos que surgiram em projetos Web, como o DBpedia e o Wikidata. Ao descrever objetos de arquivo, bem como ao criar e explorar relações entre outros modelos de dados, este estudo identifica características e princípios comuns, bem como os aspetos distintivos de cada área. Além disso, identifica a possibilidade de ligar elementos dos vários modelos, garantindo que os modelos podem ser adaptados às aplicações sem perder a riqueza da conceptualização realizada em cada um dos domínios. Num contexto em que a Web promove a explicitação da semântica dos dados através da Web Semântica e disponibiliza ferramentas para a sua representação, é necessário, por um lado, criar ligações entre modelos de diferentes comunidades e, por outro, ajustar a complexidade de cada modelo para cada aplicação de acordo com as suas necessidades específicas. Os Princípios FAIR (Findable, Accessible, Interoperable, Reusable) foram, portanto, utilizados como uma das fontes para os requisitos que os dados e metadados devem cumprir para terem uma estrutura modular. Reunimos uma coleção de casos de utilização ligados a utilizadores de arquivos, incluindo perfis que vão desde gestores de coleções a promotores de património e utilizadores informais. Além disso, compilámos e avaliámos um conjunto de experiências de modelação de dados utilizando diferentes modelos. Deste trabalho resultou o ArchOnto, uma ontologia modular que descreve registos de arquivo. Foi desenvolvido considerando os padrões arquivísticos existentes e validado por especialistas na área,
nomeadamente arquivistas do Arquivo Nacional Português. O ArchOnto baseia-se no CIDOC CRM, combinado com outras quatro ontologias específicas também desenvolvidas neste trabalho. O desenvolvimento do ArchOnto levou à criação de uma plataforma protótipo concebida para explorar e manipular registos de arquivo. Além disso, oferece o potencial de aplicar esta ontologia a outros domínios, especificamente à representação de registos cinematográficos.

Palavras Chave: Património Cultural; Dados Abertos Ligados; Integração de dados; Web Semântica; Princípios FAIR; Humanidades Digitais.

Provas de Doutoramento em Engenharia Informática: ”Towards Continuous Certification of Software Systems for Aerospace”

Candidato:
José Eduardo Ferreira Ribeiro

Data, Hora e Local:
30 de junho de 2025, às 14h30, na Sala de Atos da Faculdade de Engenharia da Universidade do Porto

Título:
”Towards Continuous Certification of Software Systems for Aerospace”

Presidente do Júri:

Doutor Rui Filipe Lima Maranhão de Abreu, Professor Catedrático, Departamento de Engenharia Informática, Faculdade de Engenharia da Universidade do Porto

Vogais:

Doutor Miguel Mira da Silva, Professor Catedrático, Departamento de Engenharia Informática, Instituto Superior Técnico da Universidade de Lisboa;

Doutor João Miguel Lobo Fernandes, Professor Catedrático, Departamento de Informática, Escola de Engenharia da Universidade do Minho;

Doutor João Carlos Pascoal Faria, Professor Catedrático, Departamento de Engenharia Informática , Faculdade de Engenharia da Universidade do Porto;

Doutor João Gabriel Monteiro de Carvalho e Silva, Professor Catedrático, Departamento de Engenharia Informática, Faculdade de Ciências e Tecnologia da Universidade de Coimbra (Coorientador).

A tese foi orientada pelo Doutor Ademar Manuel Teixeira de Aguiar, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto.

Resumo:

Desde a publicação do Manifesto Ágil em 2001, os métodos Ágeis evoluíram para se tornarem a abordagem dominante no desenvolvimento de software em diversos domínios. No entanto, a sua adoção no desenvolvimento de sistemas críticos, como na indústria aeroespacial, permanece limitada por razões habitualmente atribuídas aos rigorosos requisitos regulatórios de safety impostos por normas específicas do domínio. Esta dissertação explora a aplicabilidade dos métodos Ágeis no contexto do desenvolvimento de software aeroespacial crítico, especificamente sob as diretrizes da norma DO-178C, e conclui que, ao contrário dessa perceção generalizada, os métodos Ágeis também podem ser usados com vantagem neste contexto. A norma DO-178C, intitulada Software Considerations in Airborne Systems and Equipment Certification, é a principal norma de certificação para software aeronáutico por parte de agências como a Federal Aviation Administration (FAA) e a European Union Aviation Safety Agency (EASA).

Uma observação recurrente durante discussões com profissionais de diferentes organizações e indústrias com fortes requisitos de safety, incluindo espaço, aeroespacial, ferroviária, automóvel, energia e defesa, é a perceção generalizada de que métodos tradicionais como o modelo Waterfall são indispensáveis, se não mesmo obrigatórios, para garantir conformidade e obter a certificação. Esta perceção resulta da exigência de evidências rigorosas relacionadas com safety necessárias para a certificação. No desenvolvimento de software aeroespacial, a adoção mínima de métodos e práticas Ágeis é atribuída às exigências da DO-178C, considerada uma norma restritiva. Contudo, contrariamente a esta crença, a DO-178C não exige nenhum método de desenvolvimento específico, mas fornece diretrizes e objetivos para alcançar as evidências de safety necessárias. Esta flexibilidade abre a possibilidade de adaptar métodos Ágeis para cumprir os requisitos de certificação, mantendo as suas bem-documentadas vantagens, como a entrega incremental e a adaptabilidade a alterações nos requisitos.

Esta pesquisa examina se os métodos Ágeis, particularmente a Scrum framework, podem ser efetivamente integrados no desenvolvimento de sistemas de software aeroespacial críticos, mantendo a total conformidade com o DO-178C. O estudo apresenta o Scrum4DO178C, um processo ágil inovador baseado no Scrum, construído para abordar os desafios específicos do desenvolvimento de software aeroespacial, incluindo os extensos esforços de verificação e validação (V&V) necessários neste contexto. Através de uma revisão abrangente da literatura, das práticas da indústria e de dados, bem como de insights do mundo real provenientes de um caso de estudo industrial envolvendo um projeto aeroespacial crítico (Nível de Software A – Catastrófico), a pesquisa avalia a viabilidade e os benefícios desta abordagem. O caso de estudo demonstra que o Scrum4DO178C melhora o desempenho do projeto, aumenta a capacidade de resposta a mudanças nos requisitos e reduz os esforços de V&V, em comparação com Waterfall, ao mesmo tempo que cumpre os requisitos do DO-178C.
Estes resultados desafiam a noção prevalecente de que os métodos Ágeis são inerentemente incompatíveis com domínios críticos e mostram que, quando adaptados de forma ponderada, os métodos Ágeis podem satisfazer os rigorosos requisitos de normas como o DO-178C. Ao resolver as dificuldades existentes no uso de métodos e práticas Ágeis no desenvolvimento de sistemas críticos, este trabalho defende uma mudança de paradigma no desenvolvimento de software crítico, promovendo uma abordagem mais adaptável e centrada no cliente. Especificamente, a pesquisa destaca a capacidade do Ágil de acelerar a aquisição de conhecimento através de ciclos de entrega e de feedback mais curtos, e de melhorar a rastreabilidade e gerir alterações tardias nos requisitos de forma mais eficiente, também no domínio aeroespacial.

Partindo deste trabalho base estão em curso outras linhas de investigação para aprimorar o processo Scrum4DO178C através da automação, possibilitando a geração e reutilização dos outputs necessários para a conformidade com o DO-178C. Além disso, pesquisas futuras irão expandir estes conceitos para outras normas aeroespaciais e domínios críticos, garantindo a sua aplicabilidade e conformidade em diferentes frameworks regulatórias. Apoiada por iniciativas colaborativas com universidades (projetos de dissertação de mestrado na Faculdade de Engenharia da Universidade do Porto (FEUP) e no Departamento de Engenharia Informática da Universidade de Coimbra (UC)) e parceiros da indústria, esta pesquisa visa reformular as perceções da indústria sobre o papel dos métodos Ágeis em sistemas críticos, promovendo a inovação e adaptabilidade nestes ambientes complexos.

Palavras chave: Agile; Aerospace; DO-178C; FAA; Safety-critical; Software development.