Mostrando postagens com marcador dplyr. Mostrar todas as postagens
Mostrando postagens com marcador dplyr. Mostrar todas as postagens

terça-feira, 20 de março de 2018

segunda-feira, 12 de março de 2018

Manipulando datasets em R: dplyr e tidyr


#datascience #R #datasets #dplyr #tidyr
Aprenda a lidar com datasets em R! A extração e transformação de dados exige manipulações avançadas. Conheça as bibliotecas dplyr e tidyr.
https://github.com/cleuton/datascience/blob/master/book-R/datamanip.ipynb

quinta-feira, 8 de março de 2018

Entendendo Pipes no R

#datascience #R #dplyr #pipes
Há duas bibliotecas externas: dplyr e tidyr, ambas parte do pacote "tidyverse", que nos permitem realizar manipulações avançadas de dados. Para começar, vamos instalar o "tidyverse":

install.packages('tidyverse")


Usando PIPES %>% eu consigo montar comandos encadeados (que trabalham uns sobre o resultado dos outros) de maneira mais simples. Considere o comando:

df <- mtcars %>% select(mpg,hp,cyl) %>% arrange(desc(mpg),cyl)

Sem Pipes, ele seria escrito assim:

df <- select(mtcars,mpg,hp,dyl)
df <- arrange(df,desc(mpg),cyl)

Ao encadear os comandos, aproveito as saídas como entradas intermediárias. Basicamente, você reescreve as funções. Em vez de: função(argumento), você escreve: argumento %>% função.

E não é só isso que o Pipe permite!