Topic modeling

El procesamiento del lenguaje natural ofrece diversas técnicas para el análisis de textos producidos en lenguaje humano. Una de ellas es topic modeling, que cuenta con diversos modelos: LSA y LDA han sido tradicionalmente los más utilizados.

Comprobación

Con ambos modelos podemos clasificar el tuit que queramos. Para ello tenemos que pasarle a cualquiera de los modelos el mismo tuit. En ambos caso nos saldrá tantos temas como el modelo haya generado por primera vez, y a cada uno de esos temas le será asignado un valor. El más alejado de 0 en ambos casos será el tema en el que los modelos clasifican el tuit.

A tarves de los ejemplo vemos los resultados, es decir, cómo encajan dichos tuits dentro de los temas ya generados.