Candidato:
Gil Filipe da Rocha
Data, Hora e Local
2 de outubro, 14:00, Sala Professor Joaquim Sarmento (G129) do DEC, FEUP
Presidente do Júri
Doutor Rui Filipe Lima Maranhão de Abreu, Professor Catedrático da Faculdade de Engenharia da Universidade do Porto
Vogais
Doutor Hugo Ricardo Gonçalo Oliveira, Professor Associado do Departamento de Engenharia Informática da Faculdade de Ciências e Tecnologia da Universidade de Coimbra;
Doutor Bruno Emanuel da Graça Martins, Professor Associado do Departamento de Engenharia Electrotécnica e de Computadores do Instituto Superior Técnico da Universidade de Lisboa;
Doutor Eugénio da Costa Oliveira, Professor Emérito do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto;
Doutor Sérgio Sobral Nunes, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto;
Doutor Henrique Daniel de Avelar Lopes Cardoso, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto (Orientador).
Resumo
“O objetivo da prospecção de argumentos é a deteção, identificação e extração automática de argumentos a partir de texto escrito em linguagem natural. O objetivo final é obter uma representação estruturada dos argumentos (diagramas de argumentos) que pode ser automatizada e analizada de diversas formas. A argumentação é um ato retórico que tem sido estudado ao longo de vários séculos e que tem sido influenciado por diferentes áreas de estudo como a filosofia, linguística, ciência dos computadores, e inteligência artificial. De uma forma geral, argumentos são posições justificáveis onde factos (as premissas) são apresentados em suporte de uma afirmação (a conclusão). Algumas características do texto escrito em linguagem natural e, mais especificamente, da exposição de argumentos faz da prospecção de argumentos uma tarefa complexa. De fato, a ambiguidade do texto escrito em linguagem natural, a suposição de senso comum e de conhecimento implícito, diferentes estilos de escrita, e a complexidade inerente aos diagramas de argumentos são alguns dos desafios que os sistemas de prospecção de argumentos têm de superar. Abordar estes desafios, especialmente entre diferentes línguas e géneros textuais, exige sistemas de prospecção de argumentos robustos. Nesta tese, conduzimos investigação no sentido de desenvolver uma sistema computacional robusto que pode ser utilizado para detectar, identificar, e extrair conteúdo argumentativo em diferentes línguas e géneros textuais. A nossa visão é utilizar este sistema para a prospecção de argumentos em línguas com poucos recursos para o processamento de linguagem natural (como a língua portuguesa) e em géneros textuais que são caracterizados por exibir uma variabilidade considerável de perfis de exposição argumentativa (como os artigos de opinião). Para este fim, combinamos técnicas de linguística computacional e aprendizagem máquina com conhecimento das estruturas argumentativas e de teorias da retórica para identificar, de forma automática, raciocínio argumentativo expresso em textos escritos em linguagem natural. Para estudar a prospecção de argumentos numa língua com poucos recursos de processamento de linguagem natural e num género textual desafiante, realizamos um estudo de anotação para criar um corpus anotado com argumentos extraídos de artigos de opinião escritos em português. Para abordar a tarefa de prospecção de argumentos, propomos uma abordagem baseada nas relações e modelos contextuais, motivada por fundamentos da teoria de argumentação e especialmente desenhada para superar alguns dos desafios da exposição de argumentos. Para abordar esta tarefa num língua com poucos recursos de processamento de linguagem natural, investigamos como técnicas de transferência de conhecimento entre diferentes línguas podem ser aplicadas para explorar recursos anotados em diferentes línguas e melhorar o desempenho dos modelos de aprendizagem máquina numa língua alvo. Finalmente, para melhorar a robustez dos sistemas de prospecção de argumentos em diferentes géneros textuais, utilizamos avanços recentes na capacidade de modelação de linguagem e propomos uma abordagem de prospecção de argumentos que pode ser aplicada em diferentes géneros textuais.”