2024

Recuperação de Informação em Bases de Texto

Nome: Recuperação de Informação em Bases de Texto
Cód.: INF13259M
6 ECTS
Duração: 15 semanas/156 horas
Área Científica: Informática

Língua(s) de lecionação: Português
Língua(s) de apoio tutorial: Português

Objetivos de Desenvolvimento Sustentável

Objetivos de Aprendizagem

Identificar os principais problemas existentes em sistemas de recuperação de informação em bases de texto, bem como as principais soluções existentes.
Fornecer as competências necessárias para analisar sistemas de RI relativamente a: representação de informação; algoritmos de pesquisa; extracção de informação; agrupamento de documentos; classificação de documentos; cooperatividade.
Potenciar a avaliação crítica de sistemas de RI.
Proporcionar aos alunos o conhecimento teórico e prático de: indexação de textos; modelos booleanos, vector, probabilistico; ordenação de resultados; avaliação.

Conteúdos Programáticos

1. Introdução: principais conceitos e problemas
2. Modelos booleanos, vectoriais, probabilisticos
3. Indexação, lematização, stop-words
4. Ontologias
5. Linguagens de interrogação
6. Avaliação
7. Pesquisa na Web
8. Semantic web
9. Classificação de textos
10. Agrupamento de textos
11. Extracção de Informação
12. Sistemas de pergunta-resposta

Métodos de Ensino

Aulas teóricas com introdução de conceitos, resolução acompanhada de exercícios e esclarecimento de dúvidas.
Aulas práticas laboratoriais com proposta de problemas que acompanham a matéria teórica e esclarecimento de dúvidas durante a sua resolução. Exercícios de dificuldade gradual cobrindo os tópicos ensinados para os alunos praticarem o domínio da matéria.


Avaliação

Avaliação contínua - constituída por 2 componentes:
* trabalho individual sobre um tema específico em formato de artigo (30%)
* trabalho prático de grupo (70%)

Avaliação final - constituída por 2 componentes:
* artigo (30%)
* relatório relativo a prático de grupo (70%)

A nota final é obtida através da média ponderada das 2 componentes. O aluno tem aprovação se a nota final for igual ou superior a 10.



Bibliografia

“An introduction to information retrieval”. C. Manning, P. Raghavan and H. Schütze. Cambridge University Press. 2008.
“Modern Information Retrieval”. R. Baeza-Yates and Berthier Ribeiro-Neto. Addison Wesley. 1999.