NLP: Correlação entre palavras em um grupo de Tweets
#machineLearning #NLP #R
Correlação entre palavras. Análise de quais palavras mais aparecem em conjunto (mesmo que não consecutivas). Peguei um monte de Tweets da semana, com o HashTag #brazil e vi quais palavras mais aparecem juntas. Há muitos tweets sobre pássaros e animais Brasileiros, em especial o "Sanhaço Escarlate" (red Neckel tanager), e por isso essas palavras foram a que mais apareceram. Eu queria saber o que os estrangeiros estão falando sobre o Brasil, logo, peguei tweets em inglês. As palavras mais fortemente correlacionadas estão ligadas à natureza, animais e pássaros. Legal, não? Veja o código-fonte: https://github.com/cleuton/datascience/blob/master/nlp/CorrelacaoPalavrasTweets.ipynb
Imagine o poder disso para sua empresa...
Nenhum comentário:
Postar um comentário