Provas de Doutoramento em Media Digitais: “Integration of models for linked data in cultural heritage and contributions to the FAIR principles”

Candidata:
Inês Dias Koch

Data, Hora e Local:
1 de julho de 2025, 14:30, Sala de Atos da Faculdade de Engenharia da Universidade do Porto

Título:
“Integration of models for linked data in cultural heritage and contributions to the FAIR principles”

Presidente do Júri:
Doutor João Carlos Pascoal Faria, Professor Catedrático do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto.

Vogais:
Doutora Maja Žumer, Professora Catedrática, Department of Library and Information Science of the University of Ljubljana, Slovenia;

Doutora María Poveda Villalón, Professora Associada, Departament of Artificial Intelligence of the Technical University of Madrid, Spain;

Doutor José Luís Brinquete Borbinha, Professor Catedrático, Departamento de Informática do Instituto Superior Técnico da Universidade de Lisboa;

Doutor Pedro Manuel Rangel Santos Henriques, Professor Catedrático do Departamento de Informática da Escola de Engenharia da Universidade do Minho;

Doutora Carla Alexandra Teixeira Lopes, Professora Associada do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto (Orientadora);

Doutora Mariana Curado Malta, Professora Auxiliar do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto.

A tese foi Coorientada pela Doutora Maria Cristina de Carvalho Alves Ribeiro, Professora Associada Aposentada do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto.

Resumo:

As diversas áreas do Património Cultural, como os arquivos, os museus e as bibliotecas, têm investido no desenvolvimento tecnológico e na inovação para disponibilizar os seus recursos aos utilizadores de forma mais eficiente e completa. Para tal, a descrição destes recursos é essencial para que sejam explicitados em termos do seu contexto e conteúdo, bem como para facilitar a sua inteligibilidade e acessibilidade.Neste sentido, cada área do património começou a desenvolver os seus próprios modelos e normas para descrever os objetos culturais com que lida. Isto fez com que estas normas se tornassem específicas de cada domínio e pudessem apenas atender às necessidades de informação dentro da área de conhecimento em que foram desenvolvidos, explorando apenas a informação descrita dentro do seu domínio. Como resultado, ligar recursos de diferentes fontes de informação é desafiante. Com a necessidade de tornar os padrões e modelos mais interoperáveis, surgiram modelos de dados ligados no Património Cultural. Estes modelos permitem ligar os vários conceitos das diferentes áreas do património de forma eficiente e eficaz, considerando as características da Web Semântica.
Em Portugal, o Arquivo Nacional sentiu a necessidade de desenvolver um modelo de dados interligados para descrever os seus objetos culturais, o que levou à criação do Projeto EPISA, projeto do qual surgiu esta investigação. Assim, este trabalho tem como objetivo desenvolver um modelo de dados ligados para descrever os registos de arquivo, bem como conectá-los a outros domínios do património cultural. Para além disso, pretende integrar o modelo desenvolvido com os modelos de dados ligados existentes, promovendo o acesso e a reutilização de dados de instituições patrimoniais com base na descrição especializada. Além disso, visa ligar os modelos de dados existentes a dados de outras fontes disponíveis na Web, como a Wikidata e a DBpedi.Realizamos um estudo que inclui modelos de dados existentes no Património Cultural, como o CIDOC CRM em museus, o RiC-CM em arquivos e o LRMoo em bibliotecas, juntamente com modelos que surgiram em projetos Web, como o DBpedia e o Wikidata. Ao descrever objetos de arquivo, bem como ao criar e explorar relações entre outros modelos de dados, este estudo identifica características e princípios comuns, bem como os aspetos distintivos de cada área. Além disso, identifica a possibilidade de ligar elementos dos vários modelos, garantindo que os modelos podem ser adaptados às aplicações sem perder a riqueza da conceptualização realizada em cada um dos domínios. Num contexto em que a Web promove a explicitação da semântica dos dados através da Web Semântica e disponibiliza ferramentas para a sua representação, é necessário, por um lado, criar ligações entre modelos de diferentes comunidades e, por outro, ajustar a complexidade de cada modelo para cada aplicação de acordo com as suas necessidades específicas. Os Princípios FAIR (Findable, Accessible, Interoperable, Reusable) foram, portanto, utilizados como uma das fontes para os requisitos que os dados e metadados devem cumprir para terem uma estrutura modular. Reunimos uma coleção de casos de utilização ligados a utilizadores de arquivos, incluindo perfis que vão desde gestores de coleções a promotores de património e utilizadores informais. Além disso, compilámos e avaliámos um conjunto de experiências de modelação de dados utilizando diferentes modelos. Deste trabalho resultou o ArchOnto, uma ontologia modular que descreve registos de arquivo. Foi desenvolvido considerando os padrões arquivísticos existentes e validado por especialistas na área,
nomeadamente arquivistas do Arquivo Nacional Português. O ArchOnto baseia-se no CIDOC CRM, combinado com outras quatro ontologias específicas também desenvolvidas neste trabalho. O desenvolvimento do ArchOnto levou à criação de uma plataforma protótipo concebida para explorar e manipular registos de arquivo. Além disso, oferece o potencial de aplicar esta ontologia a outros domínios, especificamente à representação de registos cinematográficos.

Palavras Chave: Património Cultural; Dados Abertos Ligados; Integração de dados; Web Semântica; Princípios FAIR; Humanidades Digitais.

Posted in Destaque, Eventos, Notícias, Provas PhD.