A geração de dados sintéticos tem ganho bastante relevância, particularmente para fornecer mais dados para modelos de aprendizagem, por exemplo com GANs (Generative Adversarial Networks), eficazes e com um método de implementação relativamente simples, tornando-as numa das metodologias mais utilizadas para gerar synthetic data. No entanto, os dados (semi-)sintéticos são também relevantes para uma tarefa ainda mais importante, que é melhorar a nossa compreensão do comportamento dos modelos e algoritmos de ML (Machine Learning).
Carlos Soares, docente do DEI e investigador nesta área, convidado pela Università degli Studi di Bari Aldo Moro (Itália) para integrar um júri de doutoramento, conduziu também nesta instituição, no passado dia 26 de março, um seminário intitulado “Synthetic data for a better understanding of models and algorithms“, onde abordou as limitações das práticas atuais de investigação em Machine Learning/IA , descrevendo algum do trabalho em curso na FEUP com o objetivo de melhorar essas práticas, no âmbito de projetos como o Center for Responsible AI e o AISym4Med.