- Universidad Piloto de Colombia
- Trabajos de grado - Pregrado
- Facultad de Ingenierías
- Ingeniería Financiera
- View Item
FEELDATEXT

View/ Open
Date
2025-12-04Author
Parrado Cardenas, Daniel Alfonso
Fernández Mendoza, Natalia
Torres Carvajal, María Alejandra
xmlui.dri2xhtml.METS-1.0.item-advisor
Vivas Fuentes, Leandro / Tutor
Metadata
Show full item recordAbstract
Esta investigación nace de la necesidad de que las pequeñas y medianas empresas cuenten con
mayor conocimiento sobre la salud de su empresa y a partir de esto puedan tomar decisiones más
acertadas que les permitan promover sostenibilidad en el tiempo y anticipar una alta probabilidad
de quiebra. Por ende, el documento revisa algunas técnicas de procesamiento de lenguaje natural
que, al ser aplicadas sobre informes de revisoría fiscal y notas del contador, clasifica las
empresas que tienen mayor probabilidad de quiebra.
Para esto se utilizarán tres metodologías, la primera, y más común dentro de la literatura, se
encuentra el modelo probabilístico llamado Latent Dirichlet Allocation (LDA), el cual se
caracteriza por su habilidad de identificar y clasificar textos entre un gran número de
documentos, mediante el análisis de probabilidad de que un documento pertenezca a un tema y
de que una palabra esté asociada a un tema determinado, con esto se espera lograr caracterizar el
lenguaje presente en los informes del revisor fiscal y las notas del contador de PYMES. Por otro lado, la segunda técnica pretende estimar la relación entre los sentimientos expresados
en estos informes y los ratios financieros de las PYMES mediante la API de Gemini, que permite
identificar si el contenido expresa una emoción positiva, negativa o neutra y la última
metodología, TF-IDF (Frecuencia de Término - Frecuencia Inversa de Documento), que mide la
relevancia de cada palabra dentro del texto, restando peso a aquellas que aparecen con mayor
frecuencia, para desarrollar un modelo de regresión probabilística que combine información
textual y financiera y con el fin de evaluar el desempeño de los modelos se emplean las métricas
F1-score, ROC AUC, Precision, Accuracy y Recall. Todas estas metodologías desarrolladas a lo largo de la investigación demuestran que los textos
asociados a un sentimiento positivo tienen una menor probabilidad de quiebra que otras
empresas donde se incluyen palabras dentro de los estados de revisoría fiscal tales como
procesos de auditoria o reorganización, demostrando que el análisis de los componentes
lingüísticos en la información financiera, al ser integrado con diversas ratios tradicionales, se
convierte en una herramienta eficaz para anticipar la quiebra de las empresas.
Collections
- Ingeniería Financiera [193]
The following license files are associated with this item:




