2025
Análise de Dados Categóricos
Nome: Análise de Dados Categóricos
Cód.: MAT13608M
6 ECTS
Duração: 15 semanas/156 horas
Área Científica:
Matemática
Língua(s) de lecionação: Português
Língua(s) de apoio tutorial: Português
Regime de Frequência: Presencial
Objetivos de Desenvolvimento Sustentável
Objetivos de Aprendizagem
Os objetivos de aprendizagem são:
Saber como analisar a associação e correlação envolvendo variáveis categóricas;
Conhecer os princípios de um modelo linear generalizado de modo a identificar, ajustar e interpretar um modelo deste tipo;
Conhecer e saber aplicar os princípios base de modelação com este tipo de modelos;
Saber interpretar de uma forma crítica os resultados obtidos a partir do software estatístico.
Competências:
Capacidade para, de uma forma crítica e autónoma, saber construir e analisar diferentes modelos lineares generalizados e aplicar estas metodologias na sua atividade profissional;
Adquirir os princípios fundamentais da modelação estatística e conhecer as principais fases da modelação com modelos lineares generalizados;
Capacidade de interpretar problemas para dados longitudinais;
Pesquisar e entender a literatura relacionada, de forma a saber aplicar outros modelos para dados categóricos;
Saber utilizar o R para a análise de dados categóricos.
Saber como analisar a associação e correlação envolvendo variáveis categóricas;
Conhecer os princípios de um modelo linear generalizado de modo a identificar, ajustar e interpretar um modelo deste tipo;
Conhecer e saber aplicar os princípios base de modelação com este tipo de modelos;
Saber interpretar de uma forma crítica os resultados obtidos a partir do software estatístico.
Competências:
Capacidade para, de uma forma crítica e autónoma, saber construir e analisar diferentes modelos lineares generalizados e aplicar estas metodologias na sua atividade profissional;
Adquirir os princípios fundamentais da modelação estatística e conhecer as principais fases da modelação com modelos lineares generalizados;
Capacidade de interpretar problemas para dados longitudinais;
Pesquisar e entender a literatura relacionada, de forma a saber aplicar outros modelos para dados categóricos;
Saber utilizar o R para a análise de dados categóricos.
Conteúdos Programáticos
Tabelas de contingência e medidas de associação e correlação envolvendo variáveis categóricas.
Modelos lineares generalizados: caracterização, função de ligação, fases de modelação, pressupostos, análise de resíduos, validação, inferência;
Modelos discretos: logit, probit, log-log, Ordinal, Multinomial, Poisson e Binomial-Negativo.
Modelos Aditivos Generalizados (GAM).
Equações de estimação generalizadas (GEE) e modelos lineares mistos generalizados (GLMM).
Introdução os modelos de zero inflacionados (ZIF).
Modelos lineares generalizados: caracterização, função de ligação, fases de modelação, pressupostos, análise de resíduos, validação, inferência;
Modelos discretos: logit, probit, log-log, Ordinal, Multinomial, Poisson e Binomial-Negativo.
Modelos Aditivos Generalizados (GAM).
Equações de estimação generalizadas (GEE) e modelos lineares mistos generalizados (GLMM).
Introdução os modelos de zero inflacionados (ZIF).
Métodos de Ensino
As sessões de ensino são teórico-práticas, combinando os conceitos com a sua aplicação a dados reais de diferentes áreas, sensibilizando os alunos para a importância da matéria exposta. As sessões incluem a modelação e análise de dados reais com o auxílio do software estatístico, participando os estudantes ativamente nesta etapa e respetiva discussão. Os estudantes são incentivados a resolverem sozinhos problemas práticos, de forma a desenvolver a autonomia.
Enfoque na modelação, interpretação crítica e análise de dados recorrendo a outputs do software utilizado.
Enfoque na modelação, interpretação crítica e análise de dados recorrendo a outputs do software utilizado.
Avaliação
Em avaliação contínua, os estudantes realizam duas frequências (peso na nota final 25% cada) e dois trabalhos (peso na nota final 25% cada). A nota mínima é igual a 8 valores em cada um dos momentos de avaliação e para obter aprovação o aluno deverá ter uma nota final igual ou superior a 10 valores. A nota final é o resultado da média aritmética das frequências e dos trabalhos.
O regime de avaliação final consiste na realização de um exame escrito em época normal e de um exame escrito em época de recurso.
O estudante é Aprovado no caso de obter classificação final igual ou superior a 10 valores.
O uso de ferramentas de IA é permitido nesta unidade curricular apenas na realização dos trabalhos, como apoio técnico, analítico e de aprendizagem, desde que os estudantes compreendam, validem e assumam responsabilidade total pelos resultados produzidos. A fabricação de fontes, dados ou resultados constitui infração grave à integridade académica.
O docente reserva-se o direito de convocar o aluno para defesa oral das avaliações realizadas, onde o aluno tem que ser capaz de explicar partes específicas do trabalho ou teste, escrever um código diferente que execute a mesma tarefa ou uma variante da mesma, analisar um outro conjunto, ou aplicar outra técnica estudada na disciplina. A classificação é determinada pelo desempenho nessa defesa oral.
O regime de avaliação final consiste na realização de um exame escrito em época normal e de um exame escrito em época de recurso.
O estudante é Aprovado no caso de obter classificação final igual ou superior a 10 valores.
O uso de ferramentas de IA é permitido nesta unidade curricular apenas na realização dos trabalhos, como apoio técnico, analítico e de aprendizagem, desde que os estudantes compreendam, validem e assumam responsabilidade total pelos resultados produzidos. A fabricação de fontes, dados ou resultados constitui infração grave à integridade académica.
O docente reserva-se o direito de convocar o aluno para defesa oral das avaliações realizadas, onde o aluno tem que ser capaz de explicar partes específicas do trabalho ou teste, escrever um código diferente que execute a mesma tarefa ou uma variante da mesma, analisar um outro conjunto, ou aplicar outra técnica estudada na disciplina. A classificação é determinada pelo desempenho nessa defesa oral.
Bibliografia
- Agresti, A. (2018). An Introduction to Categorical Data Analysis, 3rd Edition, Wiley.
- Bilder, C. R., Loughin, T. M. (2014). Analysis of categorical data with R. Chapman and Hall/CRC.
- Hosmer, D.; Sturdivant, r. X.; Lemeshow, S. (2013). Applied Logistic Regression, 3rd Edition, Wiley.
- McCullagh, P. & Nelder, J.A. (1989). Generalized Linear Models, second Edition Chapman & Hall.
- Sheskin, D. J. (2000). Handbook of Parametric and Nonparametric Statistical Procedures, Second Edition, Chapman & Hall/CRC.
- Turkman, M.A.A. & Silva, G.L. (2000). Modelos Lineares Generalizados, Edições SPE.
- Zuur, A. F.; Ieno, E. N.; Walker, N. J.; Saveliev, A., A.; Smith, G., M. (2009). Mixed Effect Models and Extensions in Ecology, Springer.
- Zuur, A. F.; Ieno, E. N. (2016). Beginner's Guide to Zero-Inflated Models with R, Highland Statistics.
- Bilder, C. R., Loughin, T. M. (2014). Analysis of categorical data with R. Chapman and Hall/CRC.
- Hosmer, D.; Sturdivant, r. X.; Lemeshow, S. (2013). Applied Logistic Regression, 3rd Edition, Wiley.
- McCullagh, P. & Nelder, J.A. (1989). Generalized Linear Models, second Edition Chapman & Hall.
- Sheskin, D. J. (2000). Handbook of Parametric and Nonparametric Statistical Procedures, Second Edition, Chapman & Hall/CRC.
- Turkman, M.A.A. & Silva, G.L. (2000). Modelos Lineares Generalizados, Edições SPE.
- Zuur, A. F.; Ieno, E. N.; Walker, N. J.; Saveliev, A., A.; Smith, G., M. (2009). Mixed Effect Models and Extensions in Ecology, Springer.
- Zuur, A. F.; Ieno, E. N. (2016). Beginner's Guide to Zero-Inflated Models with R, Highland Statistics.
Equipa Docente
- Anabela Cristina Cavaco Ferreira Afonso [responsável]
