quarta-feira, 13 de dezembro de 2017

Cuidados com sua vida digital

Hoje, foi noticiado amplamente a descoberta de um banco de dados na web profunda, contendo mais de 1,4 bilhão de logins, senhas e emails. 

quinta-feira, 7 de dezembro de 2017

terça-feira, 5 de dezembro de 2017

R em 5 minutos!


Eu admito! Tinha uma certa aversão à linguagem R. Talvez fosse uma alergia, sei lá… Mas eu comecei a trabalhar com ela e obtive excelentes resultados, com pouco esforço. Como tenho visto algumas pessoas reclamarem muito sobre a dificuldade em criar um ambiente para executar análises usando R, decidi escrever este guia de 5 minutos para instalar um ambiente completo para usar R em trabalhos de data science.

sexta-feira, 1 de dezembro de 2017

Aguarde meu novo livro: “Data Science para Programadores – Um Guia Completo sobre Data Science usando Python”


Um guia completo sobre data science, utilizando a linguagem Python, contemplando desde inferência estatística até big data. Nele, você verá como realizar análises profissionais, sejam de aprendizado supervisionado ou não, com visualização prática e funcional.

O universo de data science hoje abrange diversas áreas, como: estatística, mineração de dados (data mining), inteligência de negócios (business intelligence), aprendizado de máquina (machine learning) e big data. 

Para prosperar em um ambiente em rápida transformação, como o nosso, é necessário conhecer e entender os dados, de maneira rápida e precisa. 

A proliferação de técnicas, ferramentas e algoritmos, torna o aprendizado complexo, mas este guia se propõe a introduzir o assunto com uma abordagem prática, utilizando a linguagem de programação Python e as principais bibliotecas de data science, como: Numpy, Pandas, Scikit-learn, Tensorflow e PySpark. 

Veremos os tópicos:
• Estatística básica, probabilidades e inferências;
• Introdução à linguagem Python e ao ambiente Jupyter;
• Storytelling com Notebooks Jupyter;
• Regressão linear, não linear e múltipla;
• Classificação e agrupamento (clustering);
• Algoritmos: árvore de decisão, K-Means e Support Vector Machines;
• Big data com Apache Spark;
• Machine learning com Tensorflow;