Partes

El trabajo se compone de los siguientes apartados

...
Introducción

Motivación, objetivos, metodología, organización del estudio, contribuciones.

...
Estado de la cuestión: instituciones

El papel de las intituciones en el mundo digital, la labor de la Real Academia Española y la repercusión de su perfil @RAEinforma en Twiiter. La importancia de esta red social para distintos organismos.

...
Estado de la cuestión: procesos informáticos

Ofrecer una visión global sobre los métodos informáticos seleccionados para el análisis de los datos resultará de utilidad a la hora de entender tanto el proceso de análisis como el resultado de los mismos. Definiremos los términos básicos que ayuden a comprender los algoritmos, y los supuestos clave para el análisis de tuits a partir de LSA y LDA. Procedemos pues a tratar de entender de manera teórica en qué consiste el topic modeling y sus dos modelos más característicos.

...
Nuestra contribución: LSA

Una vez tenemos claro los puntos en común entre LSA y LDA, podemos proceder con el desarrollo del primero de los modelos de topic modeling. A lo largo del siguiente apartado desmembraremos los pasos que hemos seguido antes de alcanzar un resultado satisfactorio a través de nuestro código. En primer lugar, veremos las bibliotecas propias del modelo que no estaban presentes en LDA. El procesado del lenguaje natural a través de la técnica de topic modeling LSA se compone, en gran parte, de pasos similares a los vistos en apartados anteriores: preprocesado, construcción de un diccionario, aplicación del modelo y obtención de resultados de dicho modelo. Al igual que ocurría en el apartado anterior, el paso final de un análisis de este estilo es comprobar los resultados. Por ello añadiremos un breve corpus con el que veremos cómo encajan algunos de sus documentos en el modelo ya creado.

...
Nuestra contribución: LDA

Una vez hemos desglosado LSA y los elementos comunes a los dos algoritmos de topic modeling, podemos proceder con la explicación del segundo de los modelos: LDA.

Como bien se puede inferir de secciones anteriores, el código contará con varias etapas bien definidas, lo que nos ayudará a obtener los resultados asegurándonos de no habernos saltado ningún paso. Tras la aplicación del modelo, comprobaremos con los mismos ejemplos que este se ha aplicado de manera correcta y que los resultados por él ofrecidos son adecuados.

...
Trabajos afines

La aplicación de modelado de tópicos a corpus formados por grandes cantidades de datos de Twitter ha dado lugar a un variado número de estudios de naturaleza o problemática similar. Las publicaciones se dividen entre las que se basan en publicaciones de la red social mencionada para investigaciones concretas y los estudios que aplican directamente métodos de modelado de tópicos a conjuntos de datos formados por tuits.

Algunos de los más destacados se nombran a continuación dados dos motivos principales: por su relevancia en el panorama del modelado de tópicos y por la aportación de una perspectiva, afín pero diferente, a la investigación presentada en este trabajo.

...
Conclusión

En el volumen de datos, en la aplicación de los modelos, en la comparativa de los resultados, la conclusión final.