DEI TALKS | “Projetos de investigação e oportunidades de cooperação com São Paulo – Brasil” pelo Prof. Alessandro Santiago dos Santos

Nesta apresentação, que terá lugar no dia 6 de Novembro, às 14:30, na sala I-105 (DEEC), serão abordadas as principais linhas de investigação do Instituto de Pesquisas Tecnológicas, São Paulo, Brasil, com enfoque nos projetos relacionados com Cidades Inteligentes e TICs. Serão também exploradas oportunidades de colaboração nestas áreas.

A palestra terá a moderação do Prof. Rosaldo Rossetti (DEI).

Alessandro Santiago dos Santos, Investigador sénior no Instituto de Pesquisas Tecnológicas do Estado de São Paulo (IPT), atuando na Pesquisa e Desenvolvimento Tecnológico brasileiro por mais de 20 anos, com estudos e projetos de transformação digital. Atualmente é investigador visitante no Instituto Superior Técnico da Universidade de Lisboa, investigando assuntos relacionados a cidades inteligentes, resilientes e sustentáveis. No Brasil, é Gerente de Desenvolvimento de negócios da unidade de tecnologias digitais do IPT; coordenador e professor do Mestrado Profissional em Computação aplicada no IPT, e foi membro do comitê de contingência de enfrentamento do Coronavírus em São Paulo atuando no Sistema de Monitoramento Inteligente, que apoiou o governo na condução da pandemia. Doutorado em Engenharia de Transportes e Mestre em Ciências da Computação pela Universidade de São Paulo, Bacharelado em Ciência da Computação pela Universidade Federal de Mato Grosso. Prêmios, reconhecimentos acadêmicos e empresariais fazem parte da trajetória profissional, incluindo experiências gerenciais em empresas como SENAC, IBM, IPT. Projetos, consultorias e pesquisas em áreas como: Sistemas Inteligentes de Transportes, Internet das Coisas, Indústria 4.0, Cidades Inteligentes e Sustentáveis. Cooperação internacional com a Europa em projetos de P&D em TI e Transportes, além de assessoria com o fórum econômico mundial na plataforma de política de dados no Centro da 4a revolução Industrial (C4IR Brasil).”

Maratona Inter-Universitária de Programação 2023 (MIUP)

No dia 21 de outubro de 2023, teve lugar a Maratona Inter-Universitária de Programação 2023 (MIUP), no Departamento de Engenharia Informática da Universidade de Coimbra. A MIUP é uma competição de programação destinada a estudantes universitários e realiza-se anualmente desde 2001. Proporciona uma excelente oportunidade para os estudantes testarem a sua capacidade de resolução de problemas e, para além do aspeto competitivo, a MIUP possibilita também o convívio e troca de experiências entre alunos e professores das Universidades portuguesas. Nesta competição, equipas de três elementos são desafiadas a resolver diversos problemas usando as linguagens C, C++, Java e Python.

Nesta edição, contámos com a participação de 6 alunos da Licenciatura em Engenharia Informática e Computação (L.EIC) e 1 do Mestrado em Engenharia Informática e Computação (M.EIC). Ao contrário de anos anteriores, devido à crescente colaboração entre o DEI e o DCC, as equipas da Faculdade de Engenharia (FEUP) e da Faculdade de Ciências (FCUP) concorreram como Universidade do Porto. Houve até uma equipa mista e outra que incluía um elemento de outra faculdade, o ICBAS.

Este ano, 3 equipas da Universidade do Porto tiveram o privilégio de conquistar a distinção de alcançar o top-6:
1º lugar – 2 alunos da MCC e 1 do ICBAS 🥇- medalha de ouro
4º lugar – 1 aluno de LCC, 1 de MCC e 1 de L.EIC 🥉 – medalha de bronze
6º lugar – 1 aluno de M.EIC e 2 de L.EIC 🥉 medalha de bronze

Mais informação sobre a MIUP 2023 poderá ser vista na página do evento e os resultados finais das equipas aqui.

MEDINFOR VI – A Medicina na Era da Informação

Nos dias 18, 19 e 20 de outubro de 2023, teve lugar na FLUP o Colóquio Internacional MEDINFOR VI – A Medicina na Era da Informação, um encontro científico promovido pela Universidade do Porto e a Faculdade de Medicina da Bahia (FMB), cuja organização ficou a cargo da FLUP/CITCEM, do Instituto de Ciências Biomédicas Abel Salazar (ICBAS) e da Faculdade de Medicina da Universidade do Porto (FMUP). O Colóquio contou com a participação de professores e investigadores de renome, de diversos países, das áreas da Ciência da Informação, das Ciências da Saúde, das Ciências da Computação e da Cultura.

Os 4 temas desta edição – Gestão da Informação nos Sistemas de Saúde, Inteligência Artificial na Medicina, Comunicação e Divulgação Científica e Médicos-cultural, Memória, Identidade e Património, promoveram a interdisciplinaridade entre a Medicina e a Ciência da Informação, o objetivo principal deste evento.

No segundo dia do encontro, *Eugénio da Costa Oliveira, Professor Emérito da Universidade do Porto/ Professor Catedrático do DEI/ FEUP, participou, ao lado de Mariana Pais (FMUP) e Rui Sousa e Silva (FLUP), na mesa redondaA Inteligência Artificial na Saúde: o impacto dos Large Language Models”, moderada por Ricardo Cruz Correia (FMUP).

Em discussão neste e nos outros painéis inseridos no tema II, “IA na Medicina”, procuraram responder e clarificar algumas questões sobre a promissora aplicação da IA na Medicina, tais como: “Qual é o valor do médico neste panorama de mudança do mundo informacional e da I.A.?”; “Qual é o papel da IA na Medicina e os princípios éticos na conceção dos algoritmos?”; Qual a relevância da IA na informação médica?”; Qual é a correlação das imagens com o contexto clínico e sua integração com o status dos biomarcadores, informações moleculares e outros dados informacionais biológicos e farmacológicos?”, entre outras.

A perspetiva transmitida pelo professor do DEI está incluída na sua apresentação inicial que pode ser lida aqui.

* CV resumido

Resultados do projeto THEIA validam o sucesso da parceria científica U.Porto-Bosch

A Bosch e a Universidade do Porto (U.Porto) apresentaram os resultados do projeto THEIA (Automated Perception Driving), que visa melhorar a segurança de veículos autónomos. O projeto foi apresentado no dia 26 de setembro na Alfândega do Porto e envolveu a participação da Ministra da Ciência, Tecnologia e Ensino Superior, Elvira Fortunato, e de instituições parceiras.

O trabalho de investigação desenvolvido no âmbito do THEIA focou-se em melhorar as capacidades dos sensores dos veículos autónomos, em particular dos sensores LiDAR, permitindo uma perceção do ambiente exterior dos veículos mesmo em condições adversas. Adicionalmente, o projeto abordou ainda a eficiência dos algoritmos de perceção e a segurança dos dados.

O consórcio entre a Bosch e a U.Porto representou um investimento de mais de 28 milhões de euros e envolveu colaboradores da Bosch e investigadores da Universidade do Porto na Faculdade de Engenharia (DEEC e DEI) e na Faculdade de Ciências (DCC). Os investigadores do DEI no projeto estiveram envolvidos em tarefas relacionadas com a perceção precisa e eficiente, desenvolvendo métodos baseados em visão por computador e inteligência artificial. Esta colaboração resultou ainda na publicação de vários artigos científicos e em dissertações de mestrado de estudantes do M.EIC e outros cursos em que o DEI participa.

Foto: U.Porto

Estudantes da U.Porto – os grandes vencedores do Sogrape Impact Hack

“Reinventar o sector do vinho, através da inovação, para um impacto positivo!”, foi o mote da primeira edição do Sogrape Impact Hack, um Hackaton organizado pela Sogrape que teve lugar na Casa Ferreirinha, no passado dia 21 de setembro.

Foram 12 horas de competição onde os 110 participantes foram divididos em equipas de 4 a 6 elementos e através da inteligência coletiva e da mentoria de especialistas, chegaram a “soluções concretas e criativas com o objetivo de contribuir para a construção de um mundo mais impactante e sustentável, focado na captação de novos consumidores, na criação de novos produtos e na implementação de práticas sustentáveis”.

As 3 equipas vencedoras, compostas por estudantes da Universidade do Porto, destacaram-se pelas soluções inovadoras que apresentaram, tendo sido premiadas com um prémio pecuniário em que 20% reverteu para Organizações Não Governamentais, sem fins lucrativos, selecionadas pelas próprias equipas.

A equipa “Techrocks”, composta por Francisca OsórioFilipe Ferreira, Mário Branco (L.EIC) e Silvia Rocha (Alumna M.EIC), conquistou o primeiro lugar com a ideia de uma aplicação que permite recomendações personalizadas por meio de algoritmos de IA.

A equipa “S4U” garantiu o 2.º lugar com a “Iniciativa Zero” , focada na criação de uma marca de produtos inovadores, de baixo teor alcoólico, cujo público alvo seria os consumidores mais jovens. Esta contou com Inês Arinto, João Gomes, Pedro Pinheiro e Matilde Ribeiro, antigos e atuais estudantes do Mestrado em Gestão da Faculdade de Economia.

“For the WINe”, equipa formada por Dinis Sousa (M.EIC)Gonçalo BarrosMaria Helena Matos, Miguel Tomás Rodrigues (L.EIC) e Rodrigo Sousa, alcançou o 3º lugar com uma aplicação que premeia os clientes com descontos, prémios e acesso privilegiado a novos produtos, ao partilhar informação e histórico de compras.

Com o sucesso desta primeira edição, ficou a promessa de um regresso no próximo ano.

Foto: Sogrape

Sofia Vieira Pinto na 10ª edição do Heidelberg Laureate Forum

O 10º Heidelberg Laureate Forum teve lugar de 24 a 29 de setembro na Alemanha e reuniu algumas das mentes mais brilhantes da matemática e das ciências da computação. Nesta conferência, 200 jovens investigadores nas áreas da matemática e ciências da computação, cuidadosamente selecionados, passam uma semana a interagir com os laureados destas disciplinas: galardoados com os Abel Prize, ACM A.M. Turing Award, ACM Prize in Computing, Fields Medal, IMU Abacus Medal e o Nevanlinna Prize. Criado em 2013, o HLF é organizado anualmente pela Heidelberg Laureate Forum Foundation (HLFF).

Com um programa científico e social, a plataforma do HLF foi especialmente concebida para iniciar o intercâmbio entre os participantes. Os laureados proferem palestras sobre temas da sua escolha, dirigidas principalmente aos jovens cientistas participantes. Estas conferências devem ser o ponto de partida para debates intensivos entre os laureados e os jovens investigadores durante o fórum. Isto significa que o Fórum não é uma conferência científica clássica, mas um evento de ligação em rede destinado a motivar e inspirar a próxima geração de cientistas. Proporcionar um espaço para que as ideias tomem forma e evoluam é o que define o objetivo subjacente ao Fórum.

No grupo destes jovens investigadores encontramos Sofia Vieira Pinto, estudante do 3º ano da L.EIC, selecionada para participar neste fervoroso encontro. “Foi sem dúvida das semanas mais memoráveis da minha carreira até ao momento”, diz-nos Sofia já de regresso à FEUP. “Não há como descrever em meras palavras todos os contactos, conversas e até amizades que se desenrolaram ao longo destes dias. Tive a oportunidade de contactar com inúmeros galardoados e ouvir histórias de vida de quem já tem muitas páginas para contar. Foi um período de aprendizagem, desenvolvimento e realização pessoal como nunca senti. Ainda parece um sonho tornado realidade”, conclui a nossa promissora estudante.

Provas de Doutoramento em Engenharia Informática: ”Argumentation mining from text using semantic approaches”

Candidato:
Gil Filipe da Rocha

Data, Hora e Local
2 de outubro, 14:00, Sala Professor Joaquim Sarmento (G129) do DECFEUP

Presidente do Júri
Doutor Rui Filipe Lima Maranhão de Abreu, Professor Catedrático da Faculdade de Engenharia da Universidade do Porto

Vogais
Doutor Hugo Ricardo Gonçalo Oliveira, Professor Associado do Departamento de Engenharia Informática da Faculdade de Ciências e Tecnologia da Universidade de Coimbra;
Doutor Bruno Emanuel da Graça Martins, Professor Associado do Departamento de Engenharia Electrotécnica e de Computadores do Instituto Superior Técnico da Universidade de Lisboa;
Doutor Eugénio da Costa Oliveira, Professor Emérito do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto;
Doutor Sérgio Sobral Nunes, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto;
Doutor Henrique Daniel de Avelar Lopes Cardoso, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto (Orientador).

Resumo
“O objetivo da prospecção de argumentos é a deteção, identificação e extração automática de argumentos a partir de texto escrito em linguagem natural. O objetivo final é obter uma representação estruturada dos argumentos (diagramas de argumentos) que pode ser automatizada e analizada de diversas formas. A argumentação é um ato retórico que tem sido estudado ao longo de vários séculos e que tem sido influenciado por diferentes áreas de estudo como a filosofia, linguística, ciência dos computadores, e inteligência artificial. De uma forma geral, argumentos são posições justificáveis onde factos (as premissas) são apresentados em suporte de uma afirmação (a conclusão). Algumas características do texto escrito em linguagem natural e, mais especificamente, da exposição de argumentos faz da prospecção de argumentos uma tarefa complexa. De fato, a ambiguidade do texto escrito em linguagem natural, a suposição de senso comum e de conhecimento implícito, diferentes estilos de escrita, e a complexidade inerente aos diagramas de argumentos são alguns dos desafios que os sistemas de prospecção de argumentos têm de superar. Abordar estes desafios, especialmente entre diferentes línguas e géneros textuais, exige sistemas de prospecção de argumentos robustos. Nesta tese, conduzimos investigação no sentido de desenvolver uma sistema computacional robusto que pode ser utilizado para detectar, identificar, e extrair conteúdo argumentativo em diferentes línguas e géneros textuais. A nossa visão é utilizar este sistema para a prospecção de argumentos em línguas com poucos recursos para o processamento de linguagem natural (como a língua portuguesa) e em géneros textuais que são caracterizados por exibir uma variabilidade considerável de perfis de exposição argumentativa (como os artigos de opinião). Para este fim, combinamos técnicas de linguística computacional e aprendizagem máquina com conhecimento das estruturas argumentativas e de teorias da retórica para identificar, de forma automática, raciocínio argumentativo expresso em textos escritos em linguagem natural. Para estudar a prospecção de argumentos numa língua com poucos recursos de processamento de linguagem natural e num género textual desafiante, realizamos um estudo de anotação para criar um corpus anotado com argumentos extraídos de artigos de opinião escritos em português. Para abordar a tarefa de prospecção de argumentos, propomos uma abordagem baseada nas relações e modelos contextuais, motivada por fundamentos da teoria de argumentação e especialmente desenhada para superar alguns dos desafios da exposição de argumentos. Para abordar esta tarefa num língua com poucos recursos de processamento de linguagem natural, investigamos como técnicas de transferência de conhecimento entre diferentes línguas podem ser aplicadas para explorar recursos anotados em diferentes línguas e melhorar o desempenho dos modelos de aprendizagem máquina numa língua alvo. Finalmente, para melhorar a robustez dos sistemas de prospecção de argumentos em diferentes géneros textuais, utilizamos avanços recentes na capacidade de modelação de linguagem e propomos uma abordagem de prospecção de argumentos que pode ser aplicada em diferentes géneros textuais.”

INForum 2023 – 7 e 8 setembro @FEUP

A edição de 2023 do INForum, que vai já na sua 14ª edição, decorrerá na Faculdade de Engenharia da Universidade do Porto nos dias 7 e 8 de setembro, com a organização local de Jácome Cunha, João Paulo Fernandes, João Pascoal Faria e Rui Maranhão, docentes do DEI, e João Saraiva da Universidade do Minho.

Reunindo a comunidade nacional, o INForum é um local privilegiado para a divulgação, discussão e reconhecimento de trabalhos científicos e de inovação e avanços tecnológicos em Informática. O INForum oferece assim um palco especializado para promover, por um lado, o intercâmbio de conhecimento e experiência entre a academia e a indústria e, por outro lado, a estreia de jovens investigadores que procuram a divulgação, a crítica construtiva e o encorajamento do seu trabalho. Assim, o INForum é um evento nacional de partilha e de fortalecimento do espírito de comunidade.

A Informática é uma área de Investigação e Desenvolvimento consolidada em Portugal, suportada numa rede de centros de investigação reconhecidos internacionalmente e na oferta de cursos de licenciatura e pós-graduação por praticamente todas as instituições portuguesas de ensino superior. É igualmente uma área na qual várias empresas nacionais apresentam resultados de I&D de relevância internacional.

O INForum é organizado em sessões temáticas sobre tópicos propostos pela comunidade e selecionados pela organização. Os tópicos têm comissões de programa (CP) próprias, que se articulam com os Presidentes da Comissão de Programa nos processos de organização das sessões (apelo a submissões, revisão e seleção de artigos, publicação de atas, etc.) de forma a tirar partido de uma única infraestrutura de suporte e garantir a coerência do evento.

Esta edição contará ainda com as Keynotes de *Cristina Videira Lopes (Chancellor’s Professor at University of California, Irvine ) e **Pedro Saleiro (Senior Director of AI Research at Feedzai).

* O Fim da Programação (como a conhecemos)

“Cristina (Crista) Lopes é Chancellor’s Professor na School of Information and Computer Sciences at University of California, Irvine, com interesses de investigação em Linguagens de Programação, Engenharia de Software e Ambientes Virtuais Distribuídos. É IEEE Fellow e ACM Distinguished Scientist. Ela é a vencedora do Prêmio Pizzigati de 2016 para Software de Interesse Público pelo seu trabalho na plataforma de mundo virtual OpenSimulator. O seu livro ‘Exercises in Programming Style’ recebeu críticas excelentes, incluindo ter sido escolhido como ‘Livro Notável’ pelas revisões do ACM Best of Computing.”

** Innovating from within: AI Research at Feedzai

“Pedro Saleiro is Senior Director of Research at Feedzai where he heads the AI research group. Before joining Feedzai in 2019, Pedro did a postdoc in Fair Machine Learning at the University of Chicago and he was a research data scientist at the Center for Data Science and Public Policy working with Rayid Ghani. During his time at UChicago, he co-developed Aequitas, the first open-source library to audit bias and fairness of decision-making systems. Pedro holds a PhD in Machine Learning from University of Porto.”

O programa da conferência pode ser consultado aqui.

Provas de Doutoramento em Media Digitais: ”Towards Human-in-the-Loop Computational Rhythm Analysis in Challenging Musical Conditions”

Candidato:
António Humberto e Sá Pinto

Data, Hora e Local
8 de setembro, às 14h30, na Sala de Atos da FEUP

Presidente do Júri
Doutor António Fernando Vasconcelos Cunha Castro Coelho, Professor Associado com Agregação da Faculdade de Engenharia da Universidade do Porto;

Vogais
Doutora Magdalena Fuentes, Professora Assistente da Music and Audio Research Lab (MARL) e Integrated Design & Media (IDM) da New York University (NYU);
Doutor Jason Hockman, Professor Associado da School of Computing and Digital Technology (DMT) da Birmingham City University (UK);
Doutor Matthew Edward Price Davies, Senior Scientist da SiriusXM/Pandora (USA)(Orientador);
Doutor Rui Pedro da Silva Nóbrega, Professor Auxiliar do Departamento de Informática da Faculdade de Ciências e Tecnologia da Universidade Nova de Lisboa;
Doutor Aníbal João de Sousa Ferreira, Professor Associado do Departamento de Engenharia Eletrotécnica e de Computadores da Faculdade de Engenharia da Universidade do Porto.

A tese foi coorientada pelo Prof. Rui Luís Nogueira Penha, Professor Coordenador da ESMAE, e pelo Prof. Gilberto Bernardes de Almeida, Professor Auxiliar da FEUP.

Abstract:

“Music Information Retrieval (MIR) is an interdisciplinary field focused on the extraction, analysis, and processing of information from various musical representations.
Grounded on the automatic analysis of musical facets such as rhythm, melody, harmony, and timbre, MIR enables applications in areas like music recommendation, automated music transcription, and intelligent music composition tools. Rhythm, an integral element of music, provides a foundation for decoding music’s complex relational structures and layered depth. Computational rhythm analysis is thus central to MIR research. It encompasses a wide range of tasks, such as the pivotal beat tracking, which unlocks the use of musical time across many MIR systems. However, conventional beat-tracking methods have struggled when dealing with complex musical features, such as expressive timing or intricate rhythmic patterns. While specialized approaches demonstrate some degree of adaptation, they do not generalise to diverse scenarios. Deep learning methods, while promising in addressing these issues, depend heavily on the availability of substantial annotated data. In scenarios requiring adaptation to user subjectivity, or where acquiring annotated data is challenging, the efficacy of beat-tracking methods lowers, thus leaving a gap in the applicability of computational rhythm analysis methods. This thesis investigates how user-provided information can enhance computational rhythm analysis in challenging musical conditions. It initiates the exploration of human-in-the-loop strategies with the aim of fostering adaptability of current MIR techniques. By focusing on beat tracking, due to its fundamental role in rhythm analysis, our goal is to develop streamlined solutions for cases where even the most advanced methods fall short. This is achieved by utilising both high-level and low-level user inputs —- namely, the user’s judgement regarding the expressiveness of the musical piece and annotations of a brief excerpt —- to adapt the state of the art to abstract particularly demanding signals. In an exploratory study, we validate the shared perception of rhythmic complexity among users as a proxy for musical expressiveness, and consequently as a key performance enhancer for beat tracking. Building upon this, we examine how highlevel user information can reparameterise a leading-edge beat-tracker, augmenting its performance to highly expressive music. We then propose a transfer learning method that finetunes the current state of the art, hereafter referred to as the baseline, to a concise user-annotated region. This method exhibits versatility across varied musical styles and offers potential solutions to the inherent limitations of previous approaches. Incorporating both user-guided contextualisation and transfer learning into a human-in-the-loop workflow, we undertake a comprehensive evaluation of our adaptive techniques. This includes examining the key customisation options available to users and their effect on performance enhancement. Our approach outperforms the current state of the art, particularly in the challenging musical content of the SMC dataset, with an improvement over the baseline F-measure of almost 10 percentage points (corresponding to over 16%). However, these quantitative improvements require further interpretation due to the inherent differences between our file-specific, human-in-the-loop technique and traditional dataset-wide methods, which operate without prior exposure to specific file characteristics. With the aim of advancing towards a user-centric evaluation framework for beat tracking, we introduce two novel metrics: the E-Measure and Annotation Efficiency. These metrics account for the user perspective regarding the annotation and finetuning process. The E-Measure is a variant of the F-measure focused on the annotation correction workflow and includes a shifting operation over a larger tolerance window. The Ae is defined as the relative (to the baseline) decrease in correction operations enabled by the fine-tuning process, normalised by the number of user annotations. Specifically, we probe the theoretical upper bound of beat tracking accuracy improvement over the SMC dataset. Our results show that the correct beat estimates provided by our approach surpass those of the state of the art by more than 20%. When considering the full length of the files, we can further frame this improvement in terms of gain per unit of user effort, quantifying the annotation efficiency of our approach. This is reflected in the substantial reduction of required corrections, with nearly 2/3 fewer corrections per user annotation compared to the baseline. In the final phase, we evaluate our human-in-the-loop strategy’s adaptability across a range of musical genres and instances presenting significant challenges. Our exploration extends to various rhythm tasks, including beat tracking, onset detection, and (indirectly) metre analysis. We apply this user-driven strategy to three unique genres with complex rhythm structures, such as polyrhythms, polymetres, and polytempi. Our approach exhibits swift adaptability, enabling efficient utilisation of the state-of-the-art method while bypassing the need for extensive retraining. This results in a balanced integration of data-driven and user-centric methods into a practical and streamlined solution.”

Palavras-Chave: Music Information Retrieval; User-centric; Transfer Learning; Beat Tracking.

Provas de Doutoramento em Engenharia Informática: ”Scaling-up organization of document sets to facilitate their analysis”

Candidato:
Rui Portocarrero Macedo de Morais Sarmento

Data, Hora e Local
24 de julho, às 14:00, na Sala de Atos (L202A) do DEGI, FEUP

Presidente do Júri:
Doutor Carlos Manuel Milheiro de Oliveira Pinto Soares, Professor Associado da Faculdade de Engenharia da Universidade do Porto.

Vogais
Doutor José Fernando Ferreira Mendes, Professor Catedrático do Departamento de Física da Universidade de Aveiro;
Doutor Bruno Emanuel da Graça Martins, Professor Associado do Departamento de Engenharia Electrotécnica e de Computadores do Instituto Superior Técnico da Universidade de Lisboa;
Doutor Pavel Bernard Brazdil, Professor Emérito da Faculdade de Economia da Universidade do Porto (Coorientador);
Doutor Henrique Daniel de Avelar Lopes Cardoso, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto;
Doutor Sérgio Sobral Nunes, Professor Associado do Departamento de Engenharia Informática da Faculdade de Engenharia da Universidade do Porto.

A tese foi orientada pelo Doutor João Manuel Portela da Gama, Professor Catedrático da Faculdade de Economia da Universidade do Porto.

Resumo:

“A sumarização e organização da produção de documentos de uma organização, de forma intuitiva e escalonável, para grandes quantidades de dados, é de grande importância no apoio à tomada de decisão. Esta tese pretende desenvolver um estudo teórico e prático, para resolver estes desafios.

O conteúdo desta dissertação nasceu após a construção de um protótipo de software com algoritmos estaticos, para analisar e fornecer suporte à decisão, a partir de documentos de texto e de uma rede de autores de documentação científica. Várias vantagens foram comprovadas com o uso deste protótipo mencionado. No entanto, havia algumas preocupações em relação à capacidade do protótipo de lidar com redes de dimensões superiores e também com uma grande quantidade de documentos. O estudo de caso de desenvolvimento considera a afinidade entre autores em grande escala e em constante evolução. O primeiro desafio é dimensionar os métodos de representação dos documentos dos autores. O segundo desafio é capturar o desenvolvimento temporal da organização. Considerando este contexto, desenvolvemos e implementamos técnicas de streaming para a caracterização de cada documento e outras subunidades da organização. Para caracterizar, houve interesse por integração em grupos de afinidade identificados por palavras-chave e medidas de relevância. Concluímos este trabalho testando vários algoritmos desenvolvidos, para diminuir a desvantagem do protótipo original e reunindo uma panóplia de soluções para problemas relacionados às técnicas de streaming de texto, considerando uma abordagem em larga escala para a análise correspondente. Foram utilizadas técnicas de recuperação de informação, sendo necessária a análise de redes sociais e streaming de dados. Resolvemos vários problemas associados com a análise eficiente de fluxos de texto, usando várias técnicas, desde técnicas de análise de fluxos puros até técnicas de redes complexas em evolução. Estas técnicas que serviram de base para inovação e contribuição com mais de dez novos algoritmos provaram melhorar o protótipo e resolver os problemas que nos levaram a melhorar e contribuir também para diversas áreas da análise de textos e fluxos de texto.”

Palavras-Chave: Streaming; Fluxo e Dados Evolutivos; Análise de Texto; Análise de Redes Sociais e Complexas; Visualização de Redes Sociais e Complexas.