Provas de Doutoramento em Engenharia Informática: ”Enhanced multiview experiences through remote content selection and dynamic quality adaptation”

Candidato
Tiago André Queiroz Soares da Costa

Data, Hora e Local:
16 de setembro, às 14:30, na Sala de Atos da Faculdade de Engenharia da Universidade do Porto

Presidente do Júri:
Doutor Carlos Miguel Ferraz Baquero-Moreno, Professor Catedrático da Faculdade de Engenharia da Universidade do Porto

Vogais:
Doutora Klara Nahrstedt, Full Professor do Department of Computer Science da University of Illinois at Urbana-Champaign, Estados Unidos da América;
Doutor Pedro António Amado de Assunção, Professor Coordenador Principal do Departamento de Engenharia Eletrotécnica da Escola Superior de Tecnologia e Gestão do Instituto Politécnico de Leiria;
Doutor Luís António Pereira de Meneses Corte-Real, Professor Associado do Departamento de Engenharia Eletrotécnica e de Computadores da Faculdade de Engenharia da Universidade do Porto;
Doutora Maria Teresa Magalhães da Silva Pinto de Andrade, Professora Auxiliar do Departamento de Engenharia Eletrotécnica e de Computadores da Faculdade de Engenharia da Universidade do Porto (Orientadora).

Resumo:
Esta tese propõe uma abordagem inovadora para a distribuição de experiências multimédia imersivas, baseadas em conteúdos multivista. Para que tal seja possível, modelos baseados em Inteligência Artificial são utilizados em conjunto com dados de comportamento visual, recolhidos a partir dos utilizadores durante a apresentação de conteúdos multimédia, de modo a que seja possível prever o seu foco de interesse no futuro próximo. O principal objectivo desta tese consiste em dar aos utilizadores a possibilidade de desfrutarem de uma experiência multimédia imersiva, sem o recurso a equipamentos dispendiosos e permitindo que ele/ela possam visualizar a cena a partir de qualquer ângulo, como se estivessem efectivamente no local onde essa cena foi filmada. Uma abordagem metodológica foi definida com base na revisão da literatura existente e na identificação de lacunas presentes na área de streaming imersivo, tendo resultado na conceptualização de uma nova arquitectura, denominada por Smooth Multiview (SmoothMV). Esta arquitectura é capaz de analisar os dados de comportamento visual dos utilizadores em tempo real e preparar preventivamente a entrega dos conteúdos, com base no interesse demonstrado ao longo da visualização de uma cena. A informação visual dos utilizadores é capturada e fornecida sem que haja necessidade de utilização de equipamentos intrusivos, sendo estes dados processados recorrendo a um novo conceito que esta tese descreve, a matriz Hot&Cold. Segundo este conceito, o ecrã encontra-se dividido em nove regiões distintas, estando cada uma delas ligada a uma vista adjacente que a plataforma SmoothMV poderá preparar e apresentar em qualquer instante. Filas individuais, alocadas para apresentação e preparação de futuros segmentos associados a cada uma das vistas seleccionada, foram também introduzidas nesta plataforma. A introdução destas filas permite que a experiência do utilizador não seja comprometida, fruto da entrega de conteúdos com o menor atraso possível. O número total de vistas disponíveis, bem como a abordagem utilizada para a análise do comportamento dos utilizadores durante a visualização dos conteúdos e posterior selecção da vista a ser processada, afecta o modo como essas filas são geridas. A plataforma elaborada no decurso desta tese evoluiu de uma abordagem puramente reativa para uma arquitectura bipartida baseada em Inteligência Artificial, capaz de identificar com elevado grau de precisão qual a vista que melhor se adaptará aos interesses visuais do utilizador. O desenvolvimento de um novo conjunto de dados tratou-se de uma necessidade, dado que a informação disponibilizada por opções alternativas não eram adequadas ao cenário proposto. Após 128 sessões experimentais, conduzidas para recolha de dados visuais a partir de 45 participantes durante a visualização de conteúdos multi-perspectiva, o conjunto de dados Data2MV foi criado e disponibilizado publicamente. Os conceitos fundamentais e resultados práticos desta tese são considerados de importância significativa para o corpo de conhecimento da área de investigação em causa e fornecem um conjunto de ferramentas relevantes para o aperfeiçoamento das arquitecturas de distribuição de conteúdos multimédia multivista.

Palavras-chave: Multimédia; Transmissão; Multivista; Foco de Atenção; Inteligência Artificial.

DEI Talks | “The Limitations of Data, Machine Learning & Us” pelo Prof. Ricardo Baeza-Yates

“Machine learning (ML), particularly deep learning, is being used everywhere. However, not always is used well, ethically and scientifically. In this talk we first do a deep dive in the limitations of supervised ML and data, its key component. We cover small data, datification, bias, predictive optimization issues, evaluating success instead of harm, and pseudoscience, among other problems.  The last part is about our own limitations using ML, including different types of human incompetence: cognitive biases, unethical applications, no administrative competence, copyright violations, misinformation, and the impact on mental health. In the final part we discuss regulation on the use of AI and responsible AI principles, that can mitigate the problems outlined above.”

The Limitations of Data, Machine Learning & Us” será apresentada dia 10 de setembro, às 11:00, na sala B032. A entrada é livre mas sujeita a inscrição aqui.

Ricardo Baeza-Yates is the Director of Research at the Institute for Experiential AI of Northeastern University, as well as part-time professor at the Dept. of Computer Science of University of Chile. Before, he was VP of Research at Yahoo Labs, based in Barcelona, Spain, and later in Sunnyvale, California, from 2006 to 2016. He is co-author of the best-seller Modern Information Retrieval textbook published by Addison-Wesley in 1999 and 2011 (2nd ed), that won the ASIST 2012 Book of the Year award. From 2002 to 2004 he was elected to the Board of Governors of the IEEE Computer Society and between 2012 and 2016 was elected for the ACM Council. In 2009 he was named ACM Fellow and in 2011 IEEE Fellow, among other awards and distinctions. He obtained a Ph.D. in CS from the University of Waterloo, Canada, and his areas of expertise are responsible AI, web search and data mining plus data science and algorithms in general.”

Candidaturas abertas ao Prémio Prof. Doutor Raul Vidal/Deloitte

Decorre desde o dia 19 de julho o período para submissão de candidaturas ao Prémio Prof. Doutor Raul Vidal/Deloitte. Os estudantes do Mestrado em Engenharia Informática e Computação e do Mestrado em Engenharia de Software podem concorrer até dia 31 de agosto ao Prémio que está agora na sua 3ª edição.

Este prémio destina-se a agraciar anualmente um recém-graduado de um destes cursos da FEUP que se tenha distinguido em atividades curriculares, pela qualidade e inovação dos trabalhos realizados no âmbito da Engenharia de Software, pelo envolvimento em atividades de apoio a outros estudantes, nomeadamente em atividades associadas a núcleos estudantis da FEUP e ainda pelo envolvimento em iniciativas de caráter social e solidário.

O Prémio foi proposto pela Deloitte, com o apoio da FEUP, por intermédio do DEI, com o objetivo de homenagear o Professor Emérito da U.Porto como reconhecimento de todo o seu trabalho ao serviço da FEUP na área da informática, que se tem traduzido na projeção da FEUP a nível nacional e internacional e na preparação de elevada qualidade dos seus estudantes para o mercado de trabalho, fazendo com que a FEUP seja inquestionavelmente uma das principais escolas com um ensino de excelência a nível tecnológico.

Toda a informação sobre o processo de candidatura e regulamento podem ser consultados em: Prémio Prof. Doutor Raul Vidal – DEI – Departamento de Engenharia Informática (up.pt)

FC Portugal a grande vencedora da RoboCUP 2024

O Genneper Parken em Eindhoven foi o palco escolhido para a edição 2024 da RoboCUP, o evento mais emocionante do mundo dos robôs autónomos. A equipa conjunta das Universidades do Porto e de Aveiro, FC Portugal, sagrou-se nesta competição, tricampeã de Futebol Robótico Simulado. A final disputada com a equipa alemã magmaOffenburg teve um resultado de 5-3 para a FC Portugal, um resultado que reforça a qualidade da equipa portuguesa, altamente eficaz e coesa.

Para esta vitória, contribuiu uma equipa de finalistas da L:IACD – Licenciatura em Inteligência Artificial e Ciência de Dados, curso conjunto das Faculdades de Ciências (FCUP) e Engenharia (FEUP) da Universidade do Porto. Tomás Azevedo e Francisco Gomes da Silva estiveram presentes nesta final da Liga de Simulação 3D – Humanoides.

A vitória no RoboCup 2024 é fruto de metodologias de Machine Learning (ML) e Deep Reinforcement Learning (DRL) no treino dos agentes robóticos e que integram as temáticas abordadas na L:IACD. O ML permite que os robôs aprendam e melhorem o seu desempenho com base em dados e experiências anteriores, enquanto o DRL foca-se em ensinar os robôs a tomar decisões ótimas através da interação com o ambiente de simulação.

No contexto da Liga de Simulação 3D, estas técnicas foram essenciais para o desenvolvimento de agentes capazes de desempenhar tarefas complexas tais como a coordenação de equipa, estratégia de jogo, skills individuais avançados (tais como o remate, sprint e drible). Os robôs da FC Portugal foram treinados para aprender autonomamente e otimizar o seu comportamento de forma contínua, resultando numa equipa ganhadora, que venceu também o Desafio Científico (melhor contribuição inovadora para o progresso desta liga) e o Desafio “FatProxy” (simulação de humanóides através de comandos de alto nível do tipo “move” e “kick” em vez de controlo direto dos vários graus de liberdade).

O sucesso desta equipa é comprovado com os 30 prémios internacionais alcançados, tendo inspirado a publicação de mais de 100 artigos científicos em revistas e conferências indexadas.

O Brasil será o próximo destino da RoboCUP que de 15 a 21 de julho de 2025 levará a Salvador os entusiastas mundiais desta competição.

Toda a informação em: https://2024.robocup.org/

Foto: Bart van Overbeeke

Provas de Doutoramento em Media Digitais: “Narrative in Interactive Documentary: a Categorisation Framework”

Candidata
Ana Sofia Airosa Coelho de Passos Baptista

Data, Hora e Local
23 de julho, às 14:30, na Sala de Atos da Faculdade de Engenharia da Universidade do Porto

Presidente do Júri
Doutor António Fernando Vasconcelos Cunha Castro Coelho, Professor Associado com Agregação do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto

Vogais
Doutor Paulo Filipe Gouveia Monteiro, Professor Catedrático do Departamento de Ciências da Comunicação da Faculdade de Ciências Sociais e Humanas da Universidade Nova de Lisboa;
Doutora Manuela Maria Fernandes Penafria, Professora Associada do Departamento de Artes da Faculdade de Artes e Letras da Universidade da Beira Interior;
Doutora Patrícia Nogueira da Silva, Professora Auxiliar do Departamento de Artes da Faculdade de Artes e Letras da Universidade da Beira Interior;
Doutor José Manuel Pereira Azevedo, Professor Catedrático do Departamento de Ciências da Comunicação e da Informação da Faculdade de Letras da Universidade do Porto (Orientador);
Doutor Hugo Daniel da Silva Barreira, Professor Auxiliar do Departamento de Ciências e Técnicas do Património da Faculdade de Letras da Universidade do Porto.

Resumo
O Documentário Interativo oferece formas inovadoras de contar histórias baseadas na realidade, alcança mais facilmente públicos amplos e a sua acessibilidade, garantida pela Internet, é aparentemente duradoura. No entanto, rapidamente percebemos que as suas possibilidades são acompanhadas por igual número de obstáculos. Além de um sistema de produção mais complicado, envolvendo profissionais com competências tecnológicas, de um modelo de negócio adaptado à distribuição na web e do problema da obsolescência tecnológica, a narrativa interativa é um desafio complexo. A abertura inerente à interatividade afeta a forma como a história é construída e experienciada pelo público. Alguns documentários interativos focam-se mais na navegação do que na história. A narrativa e o storytelling são frequentemente negligenciados em investigação, que se tende a centrar nas novas possibilidades da interatividade. Esta jornada teve como objetivo compreender como os documentários interativos podem equilibrar a importância de histórias coerentes e relevantes com o proveito da interatividade e com as potenciais não-linearidade e colaboração, através de novas estruturas narrativas. Ambicionamos apoiar criadores e investigadores no desenvolvimento e estudo do Documentário Interativo, identificando estratégias e melhores práticas em relação à narrativa e storytelling, com base em revisão de literatura, estudos de caso e entrevistas. Para aplicação prática, propomos uma Estrutura de Categorização, ilustrada com os estudos de caso, que nos permite tipificar i-docs sob a perspetiva da narrativa e storytelling. Por fim, sugerimos um guia prático, compreendendo doze táticas, para criadores que visam desenvolver documentários interativos com narrativas mais expressivas e coerentes.

Palavras-chave: Documentário Interativo; Narrativa; Storytelling; Interatividade; Linearidade; Categorização.

Provas de Doutoramento em Media Digitais (PDMD): ”Emotion-driven Physiological Actor Dynamics For Interactive Theatre Sound”

Candidato

Luís Alberto Teixeira Aly

Data, Hora e Local

22 de julho, às 14:00, na Sala de Atos da FEUP

Presidente do Júri

Doutor António Fernando Vasconcelos Cunha Castro Coelho, Professor Associado com Agregação da Faculdade de Engenharia da Universidade do Porto

Vogais

Doutor Javier Enrique Jaimovich Fernández, Professor Associado do Departamento de Sonido da Facultad de Artes da Universidad de Chile, Chile;
Doutor William Ruddock Primett, Postdoctoral Researcher da School of Digital Technologies da Tallinn University, Estónia;
Doutora Carla Maria de Jesus Montez Fernandes, Investigadora Principal do Instituto de Comunicação (ICNOVA) da Faculdade de Ciências Sociais e Humanas da Universidade Nova de Lisboa;
Doutor Rui Pedro Amaral Rodrigues, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto;
Doutor Gilberto Bernardes de Almeida, Professor Auxiliar do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto (Orientador).

A tese foi coorientada pelo Professor Hugo Plácido da Silva, do Instituto Superior Técnico.

Resumo

Esta tese, intitulada ’Emotion-driven Physiological Actor Dynamics for Interactive Theatre Sound,’embarca numa jornada exploratória na integração de respostas emocionais expressas por sinais fisiológicos e design de som no teatro. Esta pesquisa investiga a complexa relação entre os estados emocionais dos atores e os respetivos sinais fisiológicos, explora o impacto do som gerado a partir de dados fisiológicos na expressão emocional e agência dos atores, e examina como esta integração pode redefinir narrativas teatrais tradicionais. O estudo examina as experiências e percepções dos atores recorrendo a metodologias qual itativas e quantitativas. Utiliza grupos de foco, estudos observacionais, sensores fisiológicos e inquéritos para capturar e analisar os sinais fisiológicos e o feedback dos atores. Esta abordagem permite uma compreensão matizada da interação entre os aspectos fisiológicos e emocionais da atuação, lançando luz sobre como os atores incorporam e transmitem emoções complexas através das suas performances. Uma contribuição empírica crucial desta pesquisa é o dataset DECEIVER, que compreende um extensivo arquivo de gravações fisiológicas. Estas gravações fornecem informações valiosas sobre a consistência e variabilidade da expressão emocional em ambientes de performance teatral. Este conjunto de dados é de interesse para investigadores e profissionais da área na compreensão da reação entre expressão emocional e respostas fisiológicas em teatro. Além disso, a tese apresenta uma análise histórica abrangente do uso de sensores fisiológicos em música interativa, abrangendo o período de 1965 a 2023. Esta visão histórica não apenas traça a evolução tecnológica neste domínio, mas também prepara o terreno para entender as tendências atuais e os desenvolvimentos futuros. Ela contextualiza a pesquisa na trajetória mais ampla dos avanços tecnológicos, destacando as mudanças incrementais e, por vezes, revolucionárias que moldaram o estado atual dos sistemas de música interativa. A tese introduz uma taxonomia empírica e funcional para Sistemas Musicais Interativos impulsionados por sinais fisiológicos. Esta taxonomia representa uma contribuição significativa para o design e aplicação de Sistemas Musicais Interativos, fornecendo um quadro estruturado que pode guiar desenvolvimentos futuros no campo. Ela categoriza diferentes abordagens e metodologias na integração de dados fisiológicos em design de som, oferecendo uma compreensão abrangente do potencial e das limitações destes sistemas. A pesquisa também envolve o desenvolvimento de um protocolo experimental projetado para analisar os correlatos fisiológicos de valência emocional e excitação na atuação. Um sofisticado conjunto de ferramentas de software para processamento de dados complementa este protocolo. O design do protocolo sublinha a eficácia da elicitação em despoletar estados emocionais específicos e destaca a complexidade da expressão emocional em atores de teatro. Este aspecto da pesquisa fornece um modelo metodológico para futuros estudos que visam explorar temas e questões semelhantes. Biosignal Processing Toolbox, uma ferramenta de software para operações em tempo real que integra sinais fisiológicos com som, é central para o desenvolvimento do estudo. A Biosignal Processing Toolbox possibilita a criação de som de forma dinâmica e responsiva que interage com os atores, potenciando a expressão emcional através do som, e a narrativa teatral. A Biosignal Processing Toolbox está equipada para lidar com vários sinais fisiológicos, como eletromiografia, eletrocardiografia e atividade eletrodérmica, cada um oferecendo oportunidades e desafios únicos para a sonificação. A versatilidade da A Biosignal Processing Toolbox reside na sua capacidade de se adaptar e responder a diferentes entradas fisiológicas, tornando-o uma ferramenta eficaz para designers de som no teatro. Uma parte significativa da pesquisa foi um projeto tecno-artístico colaborativo, que utilizou o teatro de Samuel Beckett como pano de fundo. Este projeto levou ao desenvolvimento de um protótipo para um Sistemas Musicais Interativos impulsionado por sensores fisiológicos. Este projeto explorou as possibilidades transformadoras da integração de sensores fisiológicos e tipologias de gestos no teatro, oferecendo novas perspectivas sobre o desenvolvimento de personagens e a construção narrativa. O projeto demonstrou o potencial desta tecnologia para trazer uma nova dimensão às performances teatrais, permitindo uma experiência mais imersiva e interativa tanto para atores quanto para diretores artísticos. Apesar da sua natureza inovadora, a pesquisa reconhece os desafios e limitações de tais integrações tecnológicas. Estes incluem questões como a necessidade de processamento de dados em tempo real, a necessidade de calibração do sistema específico para cada ator, restrições técnicas e financeiras, requisitos de treino para atores e equipes de produção, garantindo o conforto e discrição dos sensores durante as performances, considerações éticas relacionadas ao uso de dados fisiológicos e a interpretação subjetiva de tais dados em contextos artísticos. Em conclusão, esta tese contribui para os estudos teatrais e para a arte de mídia interativa e fornece novas perspectivas para o design de som e treinamento de atores e contribui para o discurso mais amplo sobre a interseção da tecnologia com a arte.

Provas de Doutoramento em Engenharia Informática (ProDEI): ”Time-To-Event Prediction”

Candidata
Maria José Gomes Pedroto

Data, Hora e Local
22 de julho, às 10:00, na Sala de Atos da FEUP

Presidente do Júri
Doutor Carlos Miguel Ferraz Baquero-Moreno, Professor Catedrático da Faculdade de Engenharia da Universidade do Porto

Vogais
Doutora Myra Spiliopoulou, Full Professor of Business Information Systems da Faculty of Computer Science da Otto-von-Guericke-University Magdeburg, Alemanha;
Doutor Manuel Filipe Vieira Torres dos Santos, Professor Associado com Agregação do Departamento de Sistemas de Informação da Escola de Engenharia da Universidade do Minho;
Doutor Alípio Mário Guedes Jorge, Professor Catedrático do Departamento de Ciência de Computadores da Faculdade de Ciências da Universidade do Porto (Orientador);
Doutor Rui Carlos Camacho de Sousa Ferreira da Silva, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto.

A tese foi coorientada pelo Doutor João Pedro Carvalho Leal Mendes Moreira, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto.

Resumo

Este trabalho foca-se em modelar e prever episódios Time-to-Event (TTE), e tem dois propósitos. O primeiro propósito é explorar o potencial de recorrer a dados genealógicos para previsão time-to-event. Adicionalmente, visa melhorar o diagnóstico feito pelos profissionais que trabalham com pacientes portadores de Hereditary Transthyretin Amyloidosis (ATTRv amyloidosis). Esta é uma doença genética, hereditária, altamente debilitante, com um passado histórico que transporta para as aldeias piscatórias da Póvoa do Varzim, no norte de Portugal.

Para explorar o valor dos dados genealógicos para previsão time-to-event, este trabalho tem contribuições em feature engineering, nomeadamente na área de construção e seleção de features. Para este propósito, explora e compara uma abordagem de sumarização focada na extração manual de características significativas de árvores genealógicas, com uma abordagem mais automatizada que usa embeddings. Contribui para model construction criando uma abordagem multivariada, orientada a dados, para rastrear o risco de um paciente desenvolver o início de sintomas em diferentes idades. Ainda neste campo, explora o impacto da combinação de diferentes modelos focados em previsão de idades, usando janelas temporais próximas. Finalmente, contribui para model evaluation, abordando as questões de implementação de uma abordagem que indica o retorno expectável em alterar um conjunto de diretrizes clínicas, tomando

partido de capacidades de previsão. Ainda neste campo, apresenta esquemas de avaliação robustos que suportam a abordagem multivariada orientada a dados na seleção do melhor modelo. A aplicação é focada em pacientes com ATTRv Amyloidosis. Para caraterizar o trabalho realizado, esta tese está estruturada em quatro secções principais. Começa com uma introdução e uma apresentação de ATTRv Amyloidosis tendo por base uma perspetiva histórica. Em seguida, apresenta o contexto relevante, relacionando a ligação entre previsão time-to-event com feature engineering, model construction e model evaluation. Em seguida, ainda neste âmbito, apresenta conceitos-chave de estudos genealógicos. Em seguida, apresenta as principais contribuições, na forma das principais publicações que constituem este trabalho (um artigo por capítulo). Termina com um epílogo que resume o trabalho realizado, partilha as principais conclusões e, por fim, discute a tese numa perspetiva técnica e clínica.

Palavras-chave: Dados Time-to-Event; Modelação de Dados; Modelos de Regressão.

DEI TALKS | “Temporal mining on systematically sparse medical data” por Myra Spiliopoulou

“The acquisition of features for patient diagnostics, treatment planing and monitoring purposes is costly. Moreover, when patients with chronic diseases are called to used mobile health apps, they are also called to interact with the app in a regular way; the willingness to do so may wane with time. In this talk, we see forms of missingness in data collected in a clinic for treatment planning and in data collected with an app for monitoring. Then, we discuss methods that iteratively build up a minimal feature subspace for treatment outcome prediction, and neighbourhood-based methods that build up a minimal data space for patient condition monitoring. The methods have been applied on clinical data of tinnitus patients and on mhealth data of patients with tinnitus or diabetes. The results demonstrate that small subsets of features are often adequate for prediction.”

Temporal mining on systematically sparse medical data” será apresentada dia 22 de julho, às 15:30, na sala B012. A sessão será moderada pelo docente João Moreira (DEI).

Myra Spiliopoulou is Professor of Business Information Systems at the Faculty of Computer Science, Otto-von-Guericke-University Magdeburg, Germany. Her main research is on mining temporal complex data and extracting predictive patterns from evolving objects. One of the core application areas for her research, and a constant source of inspiration is health: her work encompasses methods and findings from observational medical data, from clinical studies, from digital health solutions, and from experiments on understanding the process of human and animal learning. She is involved as (senior) reviewer in major conferences on data mining and knowledge discovery, as Action Editor in the Data Mining and Knowledge Discovery Journal of Springer Nature, as Special Editor for survey papers in the International Journal of Data Science and Analytics (JDSA) and as Editorial Board Member for the Artificial Intelligence in Medicine Journal. In 2016, 2019 and 2023, she served as a PC Chair of the IEEE Int. Symposium on Computer-Based Medical Systems (CBMS). In 2024, she serves as senior reviewer for KDD 2024. She also serves as one of the Journal Track Chairs for ECML PKDD 2024, responsible for the submissions to the Machine Learning Journal. In May 2023, she received the Distinguished Service Contributions Award for the Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD).

Provas de Doutoramento em Engenharia Informática: ”Symmetry, hierarchical structures and shallow neural networks: Advancing reinforcement learning for humanoids”

Candidato:
Miguel António Mourão de Abreu

Data, Hora e Local:
19 de julho, às 15:00, na Sala Professor Joaquim Sarmento (G129) do DEC, da Faculdade de Engenharia da Universidade do Porto

Presidente do Júri:
Doutor Rui Filipe Lima Maranhão de Abreu, Professor Catedrático da Faculdade de Engenharia da Universidade do Porto

Vogais:
Doutor Francisco António Chaves Saraiva de Melo, Professor Associado com Agregação do Departamento de Engenharia Informática do Instituto Superior Técnico da Universidade de Lisboa;
Doutor Carlos Fernando da Silva Ramos, Professor Coordenador Principal do Departamento de Engenharia Informática do Instituto Superior de Engenharia do Porto do Instituto Politécnico do Porto;
Doutor Abbas Abdolmaleki, Senior Scientist na Google DeepMind;
Doutor Luís Paulo Gonçalves dos Reis, Professor Associado com Agregação do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto (Orientador);
Doutor Henrique Daniel de Avelar Lopes Cardoso, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto;
Doutor Armando Jorge Miranda de Sousa, Professor Associado do Departamento de Engenharia Eletrotécnica e de Computadores da Faculdade de Engenharia da Universidade do Porto.

A tese foi coorientada pelo Doutor José Nuno Panelas Nunes Lau, Professor Associado do Departamento de Eletrónica, Telecomunicações e Informática da Universidade de Aveiro.

Resumo:
No crescente campo da robótica, a aprendizagem por reforço (AR) tornou-se uma ferramenta crucial. No entanto, à medida que as tarefas se tornam mais complexas, os métodos tradicionais de AR enfrentam desafios em termos de eficiência, coordenação entre tarefas, estabilidade e qualidade da solução. Para resolver este problema, investigámos diferentes abordagens. Inicialmente, exploramos o enriquecimento o espaço de estados para complementar o treino de raiz de comportamentos usando AR, o que resultou em excelentes comportamentos individuais.
No entanto, a integração destes comportamentos revelou ser um desafio, uma vez que exploravam o vasto espaço de ações de forma não estruturada. Para resolver este problema, mudámos para uma abordagem estruturada, começando por abstrair o modelo de locomoção do robô com um controlador analítico e melhorando a eficiência da parte superior do corpo. Gradualmente, a componente de aprendizagem foi alargada a todo o robô, tornando o controlador analítico um ponto de partida no processo de aprendizagem, em vez de uma restrição. Estudámos perturbações externas realistas e formas de tirar partido da simetria do robô para acelerar a otimização. Isto levou a uma extensão da função objetivo do PPO chamada Proximal Symmetry Loss, com a qual criámos um andar omnidirecional com capacidades de recuperação de perdas de equilíbrio. Com base neste conhecimento, criámos uma nova estrutura de aprendizagem enriquecida com simetria baseada em Skill-Set-Primitives — uma nova estrutura hierárquica que capta pontos comuns entre diferentes comportamentos, facilitando as transições. Esta estrutura permitiu simplificar a rede neural, melhorando significativamente a eficiência e estabilidade. Aplicando esta estrutura, redesenhamos do zero a nossa equipa de futebol simulado, gerando comportamentos compatíveis entre si, de alta qualidade, que garantiram a vitória no Campeonato Mundial RoboCup em 2022 e 2023. A equipa incluiu novos algoritmos de localização, planeamento de rotas, gestão da formação, comunicação entre colegas, etc. Partilhámos o código da equipa em Python com a comunidade RoboCup, oferecendo uma base robusta para novas equipas. O nosso trabalho foi reconhecido em desafios científicos, ganhando prémios pela introdução da primeira habilidade de corrida da liga, sendo pioneiros num drible ágil de controlo próximo, e desenvolvendo o algoritmo de localização mais preciso da liga. As contribuições estendem-se para lá do futebol robótico, com a Aprendizagem Adaptativa de Simetria, um método que minimiza as redundâncias da simetria, mesmo em robôs que não são perfeitamente simétricos. Uma continuação lógica seria avaliar de que maneira esta abordagem pode beneficiar robôs humanoides reais, que, por natureza, apresentam imperfeições.

Palavras-Chave: Aprendizagem por reforço; Robôs Humanoides; Simetria; Locomoção; Skill-Set-Primitives; Estruturas Hierárquicas; Redes Neuronais Superficiais; RoboCup; Futebol Robótico.

DEI TALKS | “Towards Next-Generation Explainable AI” por Wojciech Samek

“The talk will discuss Concept Relevance Propagation (CRP) and Prototypical Concept Explanation (PCX), two next-generation Explainable AI (XAI) methods, which explain individual predictions of an AI model in terms of human understandable concepts and allow to systematically investigate global model behaviors. Furthermore, the talk will present the potential of these novel methods to provide deep insights into the representation and reasoning processes of LLMs.”

 “Towards Next-Generation Explainable AI” será apresentada dia 16 de julho, às 15:50, na sala B032, com a moderação do Prof. Henrique Lopes Cardoso (DEI).

Wojciech Samek is a professor in the EECS Department at the Technical University of Berlin and is jointly heading the Department of Artificial Intelligence at Fraunhofer Heinrich Hertz Institute (HHI), Berlin, Germany. He is Fellow at the BIFOLD – Berlin Institute for the Foundation of Learning and Data as well as the ELLIS Unit Berlin. He has co-authored more than 200 peer-reviewed journal and conference papers, and has received multiple best paper awards for his work in the field of XAI.”