Resumen
Las organizaciones requieren sistemas de inteligencia artificial capaces de razonar sobre bases de conocimiento internas sin comprometer la seguridad. Sin embargo, los modelos de lenguaje grandes (LLM) no acceden de forma nativa a información confidencial, y su despliegue local suele ser inviable debido a los costos de hardware. En este contexto, los modelos de lenguaje pequeños (SLM, 1B–13B parámetros) emergen como una alternativa viable, aunque su capacidad para soportar pipelines de generación aumentada por recuperación (RAG) con mecanismos de auto-reflexión en entornos empresariales aún no está plenamente establecida. Este estudio analiza los componentes de la integración de RAG y auto-reflexión en SLM mediante un estudio de mapeo sistemático (SMS). Siguiendo las directrices de Kitchenham y Charters (2007) y Petersen et al. (2008), se examinaron publicaciones de arXiv, NeurIPS, IEEE Xplore y ACM entre 2020 y 2025. De un total de 510 resultados iniciales, se seleccionaron 41 estudios primarios. Los resultados evidencian un cre-ciente interés en arquitecturas que combinan recuperación densa con estrategias adaptativas basadas en incertidumbre, donde un alto porcentaje de los trabajos se construyen sobre la integración de componentes existentes. Asimismo, se identifican limitaciones en la evaluación, la eficiencia y la aplicabilidad en escenarios empresariales reales. Se concluye que estas técnicas muestran potencial para mejorar el razonamiento y la adaptación de los modelos, aunque persisten desafíos para su implementación en SLM bajo restricciones de privacidad y hardware. El estudio organiza el conocimiento existente y establece una base estructurada para futuras investigaciones.

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.
Derechos de autor 2026 Alcides Yohacín Leaños (Autor/a)
