2024

Ciência de Dados: Etapas e Visualização de Dados

Nome: Ciência de Dados: Etapas e Visualização de Dados
Cód.: INF15583O
1 ECTS
Duração: 2 semanas/26 horas
Área Científica: Informática

Língua(s) de lecionação: Português
Língua(s) de apoio tutorial: Português
Regime de Frequência: E-learning

Objetivos de Desenvolvimento Sustentável

Objetivos de Aprendizagem

Esta unidade curricular oferece uma visão geral das etapas essenciais num projeto de Ciência de Dados, bem como no desenvolvimento de visualizações de dados.
No final desta unidade curricular, os alunos deverão ser capazes de:
1. Explicar as principais etapas e desafios comuns em projetos de Ciência de Dados.
2. Aplicar bibliotecas (Python) para a limpeza, transformação e análise eficiente de dados reais.
3. Reconhecer boas práticas de visualização de dados.
4. Desenvolver gráficos e representações visuais eficazes.
5. Formular e responder a perguntas exploratórias com base nas visualizações de dados.

Conteúdos Programáticos

Apresentação das principais fases do processo de Ciência de Dados: recolha de dados, preparação, modelação, análise e comunicação de resultados.
Identificação dos tipos de perguntas a formular em projetos de Ciência de Dados.
Introdução ao pré-processamento de dados: deteção e tratamento de valores ausentes, outliers e inconsistências.
Aplicação prática de bibliotecas Python (Pandas) para a transformação e manipulação de dados reais.
Realização de Análise Exploratória de Dados (EDA): técnicas para identificar padrões e tendências.
Diferença entre correlação e causalidade em conjuntos de dados.
Boas práticas de visualização: seleção de tipos de gráficos adequados, com foco na clareza e simplicidade.
Implementação de gráficos e representações visuais eficazes utilizando bibliotecas como Matplotlib.
Análise e apresentação de resultados com base numa pergunta exploratória formulada durante o projeto.

Métodos de Ensino

A metodologia de ensino desta unidade curricular é totalmente online, com foco em atividades assíncronas e interativas, complementadas por sessões síncronas para apoio técnico e esclarecimento de dúvidas.
As aulas teórico-práticas assíncronas são compostas por vídeos curtos que introduzem os conteúdos programáticos, seguidos de atividades práticas compostas por exercícios interativos que permitem aos alunos aplicar os conceitos abordados.
As sessões síncronas são disponibilizadas para apoio técnico, esclarecimento de dúvidas (QA) e acompanhamento do projeto final, oferecendo apoio personalizado aos alunos.
A avaliação é realizada através de um mini-teste para verificar a compreensão dos conteúdos teóricos e um projeto prático no qual os alunos devem formular uma pergunta exploratória e respondê-la através de visualizações de dados, aplicando as técnicas aprendidas ao longo do curso.

Avaliação

A avaliação desta Unidade Curricular tem duas componentes:
- Mini-teste(50%) realizado individualmente;
- Um projeto (50%) realizado individualmente ou em grupo.

Bibliografia

VanderPlas, J. (2016), Python Data Science Handbook: Essential tools for working with data. O'Reilly Media. https://jakevdp.github.io/PythonDataScienceHandbook/

James, G., Witten, D., Hastie, T., Tibshirani, R., & Taylor, J. (2023). An introduction to statistical learning: With applications in python. Springer Nature. https://hastie.su.domains/ISLP/ISLP_website.pdf.download.html
Irizarry, R. A. (2024). Introduction to Data Science: Data Wrangling and Visualization with R. CRC Press. https://rafalab.dfci.harvard.edu/dsbook-part-1/

VanderPlas, J. (2016). A whirlwind tour of Python. O'Reilly Media. https://jakevdp.github.io/WhirlwindTourOfPython/