EN | PT | TR | RO | BG | SR
;

Модул 6. КОЛИЧЕСТВЕН АНАЛИЗ: R ОБУЧЕНИЕ


РЕЗЮМЕ

Модул 1:

Въведение в R и импортиране/манипулиране на данни
Въведение в програмирането на R и RStudio.

Основи на програмирането в R: типове данни, променливи, основни операции.

Импортиране и манипулиране на данни в R: четене на данни в R, манипулиране на данни с помощта на dplyr, tidyr и други пакети.

Основни графики в R: създаване на диаграми на разсейване, стълбовидни диаграми и линейни диаграми с помощта на ggplot2.

Модул 2:

Описателна и заключителна статистика
Дескриптивна статистика в R: мерки за централна тенденция, мерки за променливост и графични изображения като хистограми и боксплотове.

Инференциална статистика в R: проверка на хипотези, доверителни интервали и p-стойности.

Провеждане на t-тестове и хи-квадрат тестове в R.

Линейна регресия в R: моделиране на връзката между две променливи и интерпретиране на резултатите от регресията.

Модул 3:

Усъвършенствана манипулация с данни и графики
Усъвършенствано манипулиране на данни с помощта на пакетите tidyr и dplyr.

Създаване на сложни и усъвършенствани графики с помощта на ggplot2, включително персонализиране на естетиката на графиките, като например цветове и теми.

Специализирани пакети за манипулиране на данни и визуализация, като lubridate, forcats и gridExtra.

Модул 4:

Множествена регресия и основни концепции за програмиране
Множествена регресия в R: моделиране на връзката между множество независими променливи и една зависима променлива.

Основни концепции за програмиране в R: цикли, if-else оператори и функции.

Използване на пакети като car и stargazer за по-напреднали задачи за моделиране, като диагностични тестове и сравняване на модели.

Модул 5:

Усъвършенстван статистически анализ и анализ на времеви редове
Усъвършенстван статистически анализ в R: факторен анализ, клъстерен анализ и анализ на времеви редове.

Въведение в анализа на времеви редове: моделиране и прогнозиране на данни, зависещи от времето.

Приложения на анализа на времеви редове в различни области.

 

Authors

Assoc. Prof. PhD Dana RAD

Aurel Vlaicu University of Arad, Center of Research Development, and Innovation in Psychology


ЦЕЛИ НА ОБУЧЕНИЕТО

В днешния свят, основан на данни, умението да се извличат значими прозрения от данните е много търсено умение.

За изследователите, специалистите по данни и анализаторите езикът за програмиране R и RStudio са незаменими инструменти в техния арсенал.

R е известен със своята гъвкавост при статистическите изчисления и анализа на данни, а RStudio предлага удобна за потребителя интегрирана среда за разработка (IDE), която подобрява работата с R.

Този модул служи като основополагащ етап, запознавайки участниците с основните аспекти на R - от синтаксиса до мощните му възможности за манипулиране на данни и основните техники за визуализация на данни.

Освен това ще се запознаем с изключителното значение на ефективното импортиране и управление на данни в контекста на статистическия анализ. В края на този модул участниците ще придобият умения в следните области (R Core Team, 2021 г.).


СЪДЪРЖАНИЕ НА МОДУЛА






СПРАВКИ

 

Auguie, B. and Antonov, A. (2017). gridExtra: Miscellaneous functions for "Grid" Graphics. R package version 2.3. https://CRAN.R-project.org/package=gridExtra

Dagum, C. (2001). Advanced time series analysis for transport. Journal of the Royal Statistical Society: Series A (Statistics in Society), 164(1), 47-66.

Fox, J. (2021). Car: Companion to applied regression. R package version 3.0-9.

Fox, J., & Weisberg, S. (2019). An R companion to applied regression. Sage.

Gentleman, R., & Temple Lang, D. (2004). R: A language for data analysis and graphics. Journal of Computational and Graphical Statistics, 5(3), 299-314.

Gentleman, R., & Temple Lang, D. (2004). Statistical analyses and reproducible research. Bioconductor Project. https://bioconductor.org/help/course-materials/2003/RESOURCES/inst/doc/HowTo/curation-1.pdf

Grolemund, G., & Wickham, H. (2016). R for data science. O'Reilly Media.

Hlavac, M. (2021). Stargazer: Well-formatted regression and summary statistics tables. R package version 5.2.2.

Lévy, J. B., & Parzen, E. (2013). Smoothing and regression: Approaches, computations, and application. Academic Press.

R Core Team. (2021). Linear models. R: A language and environment for statistical computing. https://cir.nii.ac.jp/crid/1370857669939307264

R Core Team. (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing. https://www.R-project.org/

R Core Team. (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing.

Spinu, V., Grolemund, G., & Wickham, H. (2021). lubridate: Make dealing with dates a little easier. R package version 1.8

Wickham, H. (2016). ggplot2: Elegant graphics for data analysis. Springer. https://ggplot2.tidyverse.org /

Wickham, H. (2021). forecast: Tools for working with categorical variables (Factors). R package version 0.5.1.

Wickham, H., Averick, M., Bryan, J., Chang, W., McGowan, L. D., François, R., ... & R Studio. (2021). Welcome to the tidyverse. Journal of Open Source Software, 6(1), 1686.