EN | PT | TR | RO | BG | SR
;
Marcar como lida
Marcar como não lida


NEXT TOPIC

Módulo 1: Introdução ao R e Importação/Manipulação de Dados




Importação e manipulação de dados: o poder do dplyr e do tidyr


A importação e manipulação eficientes de dados são a base de uma análise de dados eficaz. R fornece uma infinidade de pacotes e funções para ajudá-lo a ler dados de fontes externas e prepará-los para análise. Dois pacotes indispensáveis para manipulação de dados são dplyr e tidyr.

dplyr: Desenvolvido por Hadley Wickham, dplyr é um pacote que oferece uma gramática para manipulação de dados. Ele fornece um conjunto de funções para executar tarefas comuns de manipulação de dados com uma sintaxe consistente e intuitiva. As principais funções no dplyr incluem filter() (para filtrar linhas), select() (para selecionar colunas), arrange() (para classificar), mutate() (para criar novas variáveis) e summarize() (para resumir dados). Compreender e usar as funções dplyr irá capacitá-lo a manipular e transformar seus dados de forma eficiente.

tidyr: Enquanto o dplyr se concentra na manipulação de dados, o tidyr tem tudo a ver com a arrumação de dados. Os dados são considerados "arrumados" quando estão organizados de forma a facilitar o seu trabalho. Tidyr fornece funções como gather() (para converter dados amplos em dados longos) e spread() (para converter dados longos em dados amplos). Ao arrumar seus dados com o tidyr, você os torna mais passíveis de análise e visualização.