EN | PT | TR | RO | BG | SR
;

Módulo 6. ANÁLISE QUANTITATIVA - FORMAÇÃO R


PREFÁCIO

A análise quantitativa está no centro da investigação orientada por dados, e o R é uma ferramenta versátil para implementar técnicas estatísticas. Este módulo oferece um guia abrangente sobre a utilização do R para análise quantitativa, equipando os participantes com competências que vão desde a manipulação de dados a métodos estatísticos avançados. Ao dominar estes conceitos, os participantes estarão capacitados para enfrentar os desafios de dados do mundo real de forma eficaz.

 

Parte 1: Fundamentos da Análise Quantitativa em R

Esta secção apresenta aos participantes os fundamentos da programação R e a sua aplicação na investigação quantitativa:

Introdução ao R e RStudio: Visão geral do ambiente de programação R e do seu IDE de fácil utilização, o RStudio.
Noções básicas de programação R: conceitos básicos como tipos de dados, variáveis ​​e operações básicas.
Importação e manipulação de dados: técnicas para importar e preparar dados utilizando os pacotes dplyr e tidyr.
Visualização básica de dados: criação de gráficos de dispersão, gráficos de barras e gráficos de linhas utilizando o ggplot2.


Parte 2: Fundamentos e Técnicas Estatísticas

Este segmento centra-se nos conceitos estatísticos essenciais e na sua implementação em R:

Estatística descritiva: medidas de tendência central (média, mediana, moda), variabilidade (amplitude, variância, desvio padrão) e visualização de dados (histogramas, boxplots).
Estatística inferencial: testes de hipóteses, intervalos de confiança e interpretação do valor de p.
Testes estatísticos: realização de testes t e qui-quadrado para comparar grupos e analisar dados categóricos.


Parte 3: Métodos Quantitativos Avançados

Os participantes irão aprofundar técnicas estatísticas avançadas e modelação de dados:

Análise de Regressão Linear: Construção e interpretação de modelos de regressão simples e múltipla.
Manipulação avançada de dados: utilização de pacotes especializados, como lubridate, forcats e gridExtra, para manipular séries temporais e dados categóricos.
Visualizações complexas: personalização de gráficos com ggplot2 e combinação de vários gráficos utilizando gridExtra.


Parte 4: Aplicações e Desafios na Análise Quantitativa

O módulo conclui abordando aplicações práticas e desafios comuns na investigação quantitativa:

Melhores práticas para análise estatística: garantir a fiabilidade, validade e reprodutibilidade dos resultados.
Técnicas estatísticas avançadas: explorando a análise fatorial, a análise de clusters e a análise de séries temporais.
Aplicações no mundo real: aplicação de métodos avançados a diversos campos e conjuntos de dados.
Superar desafios: dicas para lidar com dados em falta, outliers e escalabilidade em grandes conjuntos de dados.


Conclusão

Ao completar este módulo, os participantes obterão uma compreensão abrangente da análise quantitativa utilizando o R, permitindo-lhes aplicar estas competências em ambientes académicos e profissionais com confiança.


OBJECTIVOS DE APRENDIZAGEM

No mundo atual, orientado para os dados, a capacidade de extrair informações significativas dos dados é uma competência muito procurada.

Para investigadores, cientistas de dados e analistas, a linguagem de programação R e o RStudio são ferramentas indispensáveis no seu arsenal.

O R é conhecido pela sua flexibilidade na computação estatística e na análise de dados, enquanto o RStudio oferece um ambiente de desenvolvimento integrado (IDE) de fácil utilização que melhora a experiência com o R.

Este módulo serve como um ponto de partida, familiarizando os participantes com os aspectos essenciais do R, desde a sua sintaxe até às suas poderosas capacidades de manipulação de dados e técnicas básicas de visualização de dados.

Para além disso, iremos aprofundar a importância crítica da importação e gestão eficiente de dados no contexto da análise estatística. No final deste módulo, os participantes terão adquirido proficiência nas seguintes áreas (R Core Team, 2021).


CONTEÚDO DA UNIDADE






SUMÁRIO

Módulo 1: Introdução ao R e importação/manipulação de dados
Introdução à programação em R e ao RStudio.

Noções básicas de programação em R: tipos de dados, variáveis, operações básicas.

Importação e manipulação de dados em R: leitura de dados em R, manipulação de dados usando dplyr, tidyr e outros pacotes.

Gráficos básicos em R: criação de gráficos de dispersão, gráficos de barras e gráficos de linhas usando ggplot2.

 

Módulo 2: Estatística descritiva e inferencial
Estatísticas descritivas em R: medidas de tendência central, medidas de variabilidade e exibições gráficas, como histogramas e boxplots.

Estatística inferencial em R: teste de hipóteses, intervalos de confiança e valores de p.

Realização de testes t e testes de qui-quadrado em R.

Regressão linear em R: modelagem da relação entre duas variáveis e interpretação do resultado da regressão.

 

Módulo 3: Manipulação avançada de dados e gráficos
Manipulação avançada de dados usando os pacotes tidyr e dplyr.

Criação de gráficos complexos e avançados usando ggplot2, incluindo a personalização da estética do gráfico, como cores e temas.

Pacotes especializados para manipulação e visualização de dados, como lubridate, forcats e gridExtra.

 

Módulo 4: Regressão múltipla e conceitos básicos de programação
Regressão múltipla em R: modelação da relação entre múltiplas variáveis independentes e uma variável dependente.

Conceitos básicos de programação em R: loops, declarações if-else e funções.

Utilização de pacotes como o car e o stargazer para tarefas de modelação mais avançadas, como testes de diagnóstico e comparação de modelos.

 

Módulo 5: Análise estatística avançada e análise de séries temporais
Análise estatística avançada em R: análise de factores, análise de clusters e análise de séries temporais.

Introdução à análise de séries temporais: modelação e previsão de dados dependentes do tempo.

Aplicações da análise de séries temporais em vários domínios.

 

 

Autores

Assoc. Prof. PhD Dana RAD

Aurel Vlaicu University of Arad, Center of Research Development, and Innovation in Psychology


REFERÊNCIAS

 

Auguie, B. and Antonov, A. (2017). gridExtra: Miscellaneous functions for "Grid" Graphics. R package version 2.3. https://CRAN.R-project.org/package=gridExtra

Dagum, C. (2001). Advanced time series analysis for transport. Journal of the Royal Statistical Society: Series A (Statistics in Society), 164(1), 47-66.

Fox, J. (2021). Car: Companion to applied regression. R package version 3.0-9.

Fox, J., & Weisberg, S. (2019). An R companion to applied regression. Sage.

Gentleman, R., & Temple Lang, D. (2004). R: A language for data analysis and graphics. Journal of Computational and Graphical Statistics, 5(3), 299-314.

Gentleman, R., & Temple Lang, D. (2004). Statistical analyses and reproducible research. Bioconductor Project. https://bioconductor.org/help/course-materials/2003/RESOURCES/inst/doc/HowTo/curation-1.pdf

Grolemund, G., & Wickham, H. (2016). R for data science. O'Reilly Media.

Hlavac, M. (2021). Stargazer: Well-formatted regression and summary statistics tables. R package version 5.2.2.

Lévy, J. B., & Parzen, E. (2013). Smoothing and regression: Approaches, computations, and application. Academic Press.

R Core Team. (2021). Linear models. R: A language and environment for statistical computing. https://cir.nii.ac.jp/crid/1370857669939307264

R Core Team. (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing. https://www.R-project.org/

R Core Team. (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing.

Spinu, V., Grolemund, G., & Wickham, H. (2021). lubridate: Make dealing with dates a little easier. R package version 1.8

Wickham, H. (2016). ggplot2: Elegant graphics for data analysis. Springer. https://ggplot2.tidyverse.org /

Wickham, H. (2021). forecast: Tools for working with categorical variables (Factors). R package version 0.5.1.

Wickham, H., Averick, M., Bryan, J., Chang, W., McGowan, L. D., François, R., ... & R Studio. (2021). Welcome to the tidyverse. Journal of Open Source Software, 6(1), 1686.