2022
Análise de Dados Categóricos
Nome: Análise de Dados Categóricos
Cód.: MAT13608M
6 ECTS
Duração: 15 semanas/156 horas
Área Científica:
Matemática
Língua(s) de lecionação: Português
Língua(s) de apoio tutorial: Português
Regime de Frequência: Presencial
Objetivos de Desenvolvimento Sustentável
Objetivos de Aprendizagem
Os objetivos de aprendizagem são:
Saber como analisar a associação e correlação envolvendo variáveis categóricas;
Conhecer os princípios de um modelo linear generalizado de modo a identificar, ajustar e interpretar um modelo deste tipo;
Conhecer e saber aplicar os princípios base de modelação com este tipo de modelos;
Saber interpretar de uma forma crítica os resultados obtidos a partir do software estatístico.
Competências:
Capacidade para, de uma forma crítica e autónoma, saber construir e analisar diferentes modelos lineares generalizados e aplicar estas metodologias na sua atividade profissional;
Adquirir os princípios fundamentais da modelação estatística e conhecer as principais fases da modelação com modelos lineares generalizados;
Capacidade de interpretar problemas para dados longitudinais;
Pesquisar e entender a literatura relacionada, de forma a saber aplicar outros modelos para dados categóricos;
Saber utilizar o R para a análise de dados categóricos.
Saber como analisar a associação e correlação envolvendo variáveis categóricas;
Conhecer os princípios de um modelo linear generalizado de modo a identificar, ajustar e interpretar um modelo deste tipo;
Conhecer e saber aplicar os princípios base de modelação com este tipo de modelos;
Saber interpretar de uma forma crítica os resultados obtidos a partir do software estatístico.
Competências:
Capacidade para, de uma forma crítica e autónoma, saber construir e analisar diferentes modelos lineares generalizados e aplicar estas metodologias na sua atividade profissional;
Adquirir os princípios fundamentais da modelação estatística e conhecer as principais fases da modelação com modelos lineares generalizados;
Capacidade de interpretar problemas para dados longitudinais;
Pesquisar e entender a literatura relacionada, de forma a saber aplicar outros modelos para dados categóricos;
Saber utilizar o R para a análise de dados categóricos.
Conteúdos Programáticos
Tabelas de contingência e medidas de associação e correlação envolvendo variáveis categóricas.
Modelos lineares generalizados: caracterização, função de ligação, fases de modelação, pressupostos, análise de resíduos, validação, inferência;
Modelos discretos: logit, probit, log-log, Ordinal, Multinomial, Poisson e Binomial-Negativo.
Modelos Aditivos Generalizados (GAM).
Equações de estimação generalizadas (GEE) e modelos lineares mistos generalizados (GLMM).
Introdução os modelos de zero inflacionados (ZIF).
Modelos lineares generalizados: caracterização, função de ligação, fases de modelação, pressupostos, análise de resíduos, validação, inferência;
Modelos discretos: logit, probit, log-log, Ordinal, Multinomial, Poisson e Binomial-Negativo.
Modelos Aditivos Generalizados (GAM).
Equações de estimação generalizadas (GEE) e modelos lineares mistos generalizados (GLMM).
Introdução os modelos de zero inflacionados (ZIF).
Métodos de Ensino
As sessões de ensino são teórico-práticas, combinando os conceitos com a sua aplicação a dados reais de diferentes áreas, sensibilizando os alunos para a importância da matéria exposta. As sessões incluem a modelação e análise de dados reais com o auxílio do software estatístico, participando os estudantes ativamente nesta etapa e respetiva discussão. Os estudantes são incentivados a resolverem sozinhos problemas práticos, de forma a desenvolver a autonomia.
Enfoque na modelação, interpretação crítica e análise de dados recorrendo a outputs do software utilizado.
Enfoque na modelação, interpretação crítica e análise de dados recorrendo a outputs do software utilizado.
Bibliografia
Agresti, A. (2018). An Introduction to Categorical Data Analysis, 3rd Edition, Wiley.
Bilder, C. R., Loughin, T. M. (2014). Analysis of categorical data with R. Chapman and Hall/CRC.
Hosmer, D.; Sturdivant, r. X.; Lemeshow, S. (2013). Applied Logistic Regression, 3rd Edition, Wiley.
McCullagh, P. & Nelder, J.A. (1989). Generalized Linear Models, second Edition Chapman & Hall.
Sheskin, D. J. (2000). Handbook of Parametric and Nonparametric Statistical Procedures, Second Edition, Chapman & Hall/CRC.
Turkman, M.A.A. & Silva, G.L. (2000). Modelos Lineares Generalizados, Edições SPE.
Zuur, A. F.; Ieno, E. N.; Walker, N. J.; Saveliev, A., A.; Smith, G., M. (2009). Mixed Effect Models and Extensions in Ecology, Springer.
Zuur, A. F.; Ieno, E. N. (2016). Beginner's Guide to Zero-Inflated Models with R, Highland Statistics.
Bilder, C. R., Loughin, T. M. (2014). Analysis of categorical data with R. Chapman and Hall/CRC.
Hosmer, D.; Sturdivant, r. X.; Lemeshow, S. (2013). Applied Logistic Regression, 3rd Edition, Wiley.
McCullagh, P. & Nelder, J.A. (1989). Generalized Linear Models, second Edition Chapman & Hall.
Sheskin, D. J. (2000). Handbook of Parametric and Nonparametric Statistical Procedures, Second Edition, Chapman & Hall/CRC.
Turkman, M.A.A. & Silva, G.L. (2000). Modelos Lineares Generalizados, Edições SPE.
Zuur, A. F.; Ieno, E. N.; Walker, N. J.; Saveliev, A., A.; Smith, G., M. (2009). Mixed Effect Models and Extensions in Ecology, Springer.
Zuur, A. F.; Ieno, E. N. (2016). Beginner's Guide to Zero-Inflated Models with R, Highland Statistics.
Equipa Docente
- Paulo de Jesus Infante dos Santos [responsável]