Plataforma web con IA Generativa para la Analítica de Datos en Tableros de Control Interactivos
Una propuesta aplicada a PYMES — estudio comparativo de modelos generativos para Bogotá D. C.
Estudio comparativo descriptivo de modelos LLM (Gemini 2.5 Pro, Gemini 2.0 Flash, GPT-4o) y un baseline Random Forest, integrados con herramientas de visualización (Looker Studio, Power BI, Tableau, Pentaho CE) para democratizar la inteligencia de negocio en micro y pequeñas empresas colombianas. Validación empírica con datos reales de una ferretería bogotana piloto · banco de 40 consultas · n = 120 ejecuciones/modelo (40 consultas × 3).
Gemini 2.5 Pro (0–1)
Gemini 2.5 Pro
34/40 consultas
Gemini 2.0 Flash
más económico que 2.5 Pro
Contextualización del Problema
Las PYMES representan más del 90 % del tejido empresarial colombiano (Confecámaras, 2024), pero enfrentan barreras estructurales para adoptar BI tradicional: Power BI (US$14/usr/mes), Tableau (US$70/usr/mes), curvas de aprendizaje altas y escasez de talento especializado. Se generan 2,5 quintillones de bytes diarios a nivel global; la analítica ya no es opcional, es ventaja competitiva. La IA generativa emerge como catalizador capaz de automatizar procesos analíticos y democratizar el acceso sin infraestructura costosa.
Objetivos de la Investigación
Pregunta central: ¿cuál es la combinación de modelo generativo, plataforma cloud y herramienta de visualización que ofrece la mejor relación costo-valor para implementar tableros de control interactivos en PYMES de Bogotá D. C.?
Específicos: (1) Evaluar LLM en 5 criterios ponderados · (2) Comparar herramientas de visualización · (3) Validar con datos reales en una ferretería bogotana (TRL 6–7, Minciencias 2023).
Curvas de Rendimiento (Figs. 1–6)
Las consultas de “tendencias” —analítica predictiva sobre series de tiempo cortas— concentran el menor rendimiento en todos los modelos. La media por modelo coincide con la precisión global de la Tabla I (Flash 85 %, GPT-4o 83 %).
Propuesta Metodológica
Enfoque mixto secuencial con énfasis descriptivo-comparativo (Creswell, 2018). Usabilidad medida con la escala SUS (Brooke, 1996) y evaluación heurística (Nielsen, 1994). Puntaje compuesto P_j = Σ wᵢ · sᵢⱼ. Banco de 40 consultas conversacionales reales en 4 categorías de 10: productos más vendidos, clientes principales, totales por período y tendencias.
| Modelo | Tipo | Contexto | Multim. | Fine-tuning |
|---|---|---|---|---|
| Gemini 2.5 Pro ★ | LLM | 1M tokens | Sí | Disponible |
| Gemini 2.0 Flash | LLM | 1M tokens | Sí | Disponible |
| GPT-4o | LLM | 128k | Sí | Limitado |
| Random Forest | ML clás. | N/A | No | N/A |
Para 1.000 consultas, GPT-4o cuesta ~67× más que Gemini 2.0 Flash y ~16× más que Gemini 2.5 Pro; su escalado de latencia lo excluye como opción primaria para MIPYMES colombianas.
Gemini 2.5 Pro lidera en precisión y razonamiento; Gemini 2.0 Flash domina en costo e integración. Random Forest solo destaca en costo e interpretabilidad, pero colapsa en razonamiento.
Herramientas de Visualización (Tabla II)
Pipeline · 5 Agentes Google ADK (Fig. 7)
Beneficios para la Comunidad
Hallazgos — Comparativa de Modelos (Tabla I)
Métricas observadas · n = 120 ejecuciones por modelo · puntaje global ponderado P_j (escala 0–1)
| Modelo | Precisión | Latencia | Costo / 1k | Razon. · Integr. (1–5) | Puntaje global |
|---|---|---|---|---|---|
| Gemini 2.5 Pro ★ | 92 % | 0,68 s | US$1,25 | 4,8 · 4,3 | 0,87 |
| Gemini 2.0 Flash | 85 % | 0,46 s | US$0,075 | 4,6 · 4,8 | 0,84 |
| GPT-4o | 83 % | 1,10 s | US$5,00 | 4,7 · 4,0 | 0,79 |
| Random Forest | 62 % | 0,02 s | US$0,02 | 2,0 · 3,3 | baseline (referencia) |
| Criterio (ponderación) | Gemini 2.5 Pro | Gemini 2.0 Flash | GPT-4o |
|---|---|---|---|
| Capacidad técnica (25 %) | 0,95 | 0,86 | 0,88 |
| Integración (20 %) | 0,86 | 0,96 | 0,80 |
| Escalabilidad (20 %) | 0,88 | 0,88 | 0,80 |
| Facilidad de uso (15 %) | 0,86 | 0,70 | 0,82 |
| Costo-beneficio (20 %) | 0,79 | 0,74 | 0,62 |
| Puntaje compuesto | 0,87 | 0,84 | 0,79 |
Proyección a Futuro · Trabajo Futuro
Escalado del piloto
Replicar el piloto en una decena de empresas para validar otros sectores además de la ferretería y avanzar hacia TRL 8–9 (Minciencias, 2023).
Small Language Models
Replicar el experimento con SLM open source desplegados localmente, reduciendo la dependencia de APIs externas y el riesgo de privacidad.
Adopción institucional
Articular la plataforma con cámaras de comercio y programas de la Alcaldía de Bogotá para acelerar la adopción en microempresas distritales.
Limitaciones Identificadas
Conectividad: requiere conexión a internet estable para las APIs de los modelos generativos.
Capacidad: techo de 10.000 registros por organización en el prototipo antes de particionamiento.
Especificidad sectorial: validación solo en ferretería; generalizar requiere más pilotos en otros sectores.
Gobernanza y privacidad: persisten preocupaciones propias de la IA generativa empresarial al transmitir datos a APIs externas.