
Latent Semantic Allocation
LSA es el sistema de topic modeling basado en la SVD, la descomposición de valores singulares.
El procesamiento del lenguaje natural ofrece diversas técnicas para el análisis de textos producidos en lenguaje humano. Una de ellas es topic modeling, que cuenta con diversos modelos: LSA y LDA han sido tradicionalmente los más utilizados.
LSA es el sistema de topic modeling basado en la SVD, la descomposición de valores singulares.
LDA es un modelo probabilístico generativo en el que se supone que cada documento consta de una proporción diferente de temas.
Con ambos modelos podemos clasificar el tuit que queramos. Para ello tenemos que pasarle a cualquiera de los modelos el mismo tuit. En ambos caso nos saldrá tantos temas como el modelo haya generado por primera vez, y a cada uno de esos temas le será asignado un valor. El más alejado de 0 en ambos casos será el tema en el que los modelos clasifican el tuit.
A tarves de los ejemplo vemos los resultados, es decir, cómo encajan dichos tuits dentro de los temas ya generados.