terça-feira, 13 de março de 2018

NLP: Correlação entre palavras em um grupo de Tweets


#machineLearning #NLP #R Correlação entre palavras. Análise de quais palavras mais aparecem em conjunto (mesmo que não consecutivas). Peguei um monte de Tweets da semana, com o HashTag #brazil e vi quais palavras mais aparecem juntas. Há muitos tweets sobre pássaros e animais Brasileiros, em especial o "Sanhaço Escarlate" (red Neckel tanager), e por isso essas palavras foram a que mais apareceram. Eu queria saber o que os estrangeiros estão falando sobre o Brasil, logo, peguei tweets em inglês. As palavras mais fortemente correlacionadas estão ligadas à natureza, animais e pássaros. Legal, não? Veja o código-fonte: https://github.com/cleuton/datascience/blob/master/nlp/CorrelacaoPalavrasTweets.ipynb Imagine o poder disso para sua empresa... 

Nenhum comentário:

Postar um comentário