Candidato
Tiago André Queiroz Soares da Costa
Data, Hora e Local:
16 de setembro, às 14:30, na Sala de Atos da Faculdade de Engenharia da Universidade do Porto
Presidente do Júri:
Doutor Carlos Miguel Ferraz Baquero-Moreno, Professor Catedrático da Faculdade de Engenharia da Universidade do Porto
Vogais:
Doutora Klara Nahrstedt, Full Professor do Department of Computer Science da University of Illinois at Urbana-Champaign, Estados Unidos da América;
Doutor Pedro António Amado de Assunção, Professor Coordenador Principal do Departamento de Engenharia Eletrotécnica da Escola Superior de Tecnologia e Gestão do Instituto Politécnico de Leiria;
Doutor Luís António Pereira de Meneses Corte-Real, Professor Associado do Departamento de Engenharia Eletrotécnica e de Computadores da Faculdade de Engenharia da Universidade do Porto;
Doutora Maria Teresa Magalhães da Silva Pinto de Andrade, Professora Auxiliar do Departamento de Engenharia Eletrotécnica e de Computadores da Faculdade de Engenharia da Universidade do Porto (Orientadora).
Resumo:
Esta tese propõe uma abordagem inovadora para a distribuição de experiências multimédia imersivas, baseadas em conteúdos multivista. Para que tal seja possível, modelos baseados em Inteligência Artificial são utilizados em conjunto com dados de comportamento visual, recolhidos a partir dos utilizadores durante a apresentação de conteúdos multimédia, de modo a que seja possível prever o seu foco de interesse no futuro próximo. O principal objectivo desta tese consiste em dar aos utilizadores a possibilidade de desfrutarem de uma experiência multimédia imersiva, sem o recurso a equipamentos dispendiosos e permitindo que ele/ela possam visualizar a cena a partir de qualquer ângulo, como se estivessem efectivamente no local onde essa cena foi filmada. Uma abordagem metodológica foi definida com base na revisão da literatura existente e na identificação de lacunas presentes na área de streaming imersivo, tendo resultado na conceptualização de uma nova arquitectura, denominada por Smooth Multiview (SmoothMV). Esta arquitectura é capaz de analisar os dados de comportamento visual dos utilizadores em tempo real e preparar preventivamente a entrega dos conteúdos, com base no interesse demonstrado ao longo da visualização de uma cena. A informação visual dos utilizadores é capturada e fornecida sem que haja necessidade de utilização de equipamentos intrusivos, sendo estes dados processados recorrendo a um novo conceito que esta tese descreve, a matriz Hot&Cold. Segundo este conceito, o ecrã encontra-se dividido em nove regiões distintas, estando cada uma delas ligada a uma vista adjacente que a plataforma SmoothMV poderá preparar e apresentar em qualquer instante. Filas individuais, alocadas para apresentação e preparação de futuros segmentos associados a cada uma das vistas seleccionada, foram também introduzidas nesta plataforma. A introdução destas filas permite que a experiência do utilizador não seja comprometida, fruto da entrega de conteúdos com o menor atraso possível. O número total de vistas disponíveis, bem como a abordagem utilizada para a análise do comportamento dos utilizadores durante a visualização dos conteúdos e posterior selecção da vista a ser processada, afecta o modo como essas filas são geridas. A plataforma elaborada no decurso desta tese evoluiu de uma abordagem puramente reativa para uma arquitectura bipartida baseada em Inteligência Artificial, capaz de identificar com elevado grau de precisão qual a vista que melhor se adaptará aos interesses visuais do utilizador. O desenvolvimento de um novo conjunto de dados tratou-se de uma necessidade, dado que a informação disponibilizada por opções alternativas não eram adequadas ao cenário proposto. Após 128 sessões experimentais, conduzidas para recolha de dados visuais a partir de 45 participantes durante a visualização de conteúdos multi-perspectiva, o conjunto de dados Data2MV foi criado e disponibilizado publicamente. Os conceitos fundamentais e resultados práticos desta tese são considerados de importância significativa para o corpo de conhecimento da área de investigação em causa e fornecem um conjunto de ferramentas relevantes para o aperfeiçoamento das arquitecturas de distribuição de conteúdos multimédia multivista.
Palavras-chave: Multimédia; Transmissão; Multivista; Foco de Atenção; Inteligência Artificial.