quinta-feira, 6 de junho de 2019

Datascience e Romantismo

#ia #NLP #R #datascience
Processar textos e informações não estruturadas é cada vez mais importante. Uma das coisas mais fundamentais é resumir e abstrair textos, classificando-os. Com R podemos fazer isto rapidamente, extraindo e pesando os termos mais importantes, como neste exemplo, no qual analiso "A Canção do Exílio", de Gonçalves Dias, escrita em 1843. Podemos notar a relevância dos termos e entender que se trata de um texto dos primeiros momentos do Romantismo Brasileiro. https://github.com/cleuton/datascience/blob/master/book-R/tidy.ipynb

Nenhum comentário:

Postar um comentário