EN | PT | TR | RO | BG | SR
;


NEXT TOPIC

Modul 1: Uvod u R i uvoz/manipulacija podataka




Uvoz podataka: početak analize podataka


Inicijalni korak u svakoj analizi podataka je akvizicija podataka. R nudi ogroman niz alata i paketa za olakšavanje besprekornog uvoza podataka iz različitih spoljašnjih izvora. Bilo da se podaci nalaze u CSV fajlu, Excel tabeli, bazi podataka ili drugim formatima, R pruža mogućnosti za pristup njima. Ovaj modul će istražiti uobičajene alate i metode za uvoz podataka u R:

  • csv() i read.table(): Ove funkcije omogućavaju čitanje podatka iz CSV i tab-delimitiranih fajlova, respektivno. Nude mnoštvo opcija za prilagođavanje procesa uvoza, kao što su specificiranje delimitera i rukovanje nedostajućim vrednostima.
  • Paket readxl: Kada radite sa Excel fajlovima, paket readxl je glavni alat. Pojednostavljuje ekstrakciju podataka iz Excel radnih svezaka, listova i opsega.
  • Paket readr: Paket readr, takođe od Hadley Wickham-a, nudi set funkcija za brzo i efikasno učitavanje podataka. Poboljšava proces uvoza podataka pružajući funkcije kao što su read_csv() i read_delim() koje optimizuju čitanje tekstualnih podataka.

Konekcije na baze podataka: R može da se poveže sa bazama podataka koristeći pakete kao što su DBI i RODBC, omogućavajući vam da preuzimate podatke direktno iz sistema baza podataka. Ovo je posebno korisno kada radite sa velikim skupovima podataka koji su pohranjeni u bazama podataka.