Project name
Clasificación de datos textuales provenientes de un streaming aplicando el método de representación de texto TF-IDF en una Regresión Logística.
Acronym
SUB-TESIS-UNALM-2021-001-012-FEP
Project code
114003342
Status
Active
Start Date
24 November 2021
OCDE knowledge area(s)
Ingeniería, Tecnología
OCDE activity
Investigación básica
Keyword(s)
Docentes Educación Aprendo en Casa
Resume
El estudio busca implementar un modelo de regresión logística utilizando TF-IDF en datos textuales para clasificar comentarios de docentes en streamings de Aprendo en Casa del Ministerio de Educación. Se dividió en pre-procesamiento, análisis exploratorio, aplicación de TF-IDF, estimación y evaluación del modelo, y clasificación de nuevos comentarios. Se limpiaron y estandarizaron los datos, se obtuvieron indicadores descriptivos, se aplicó Chi Cuadrado para selección de variables, se estimó el modelo final y se evaluó con TF-IDF en prueba, obteniendo una exactitud del 0.81. Se concluyó que el modelo implementado es adecuado. Se empleó Validación Cruzada K-Fold para evaluar el modelo de clasificación.
Institutional research line
Modelamiento estadístico y predicción [Línea de investigación]
Geographical scope of study or application of the project
La Molina, Lima
-12.0789
-76.9169
Sources of information: Directorio de Proyectos Universidad Nacional Agraria La Molina