Semillero Data Core TechGrupo GIISIA & Analítica de Datos PI0320251 · Bogotá D.C. · 2026
Artículo Científico · Formato IEEE · Sustentación

Plataforma web con IA Generativa para la Analítica de Datos en Tableros de Control Interactivos

Una propuesta aplicada a PYMES — estudio comparativo de modelos generativos para Bogotá D. C.

Estudio comparativo descriptivo de modelos LLM (Gemini 2.5 Pro, Gemini 2.0 Flash, GPT-4o) y un baseline Random Forest, integrados con herramientas de visualización (Looker Studio, Power BI, Tableau, Pentaho CE) para democratizar la inteligencia de negocio en micro y pequeñas empresas colombianas. Validación empírica con datos reales de una ferretería bogotana piloto · banco de 40 consultas · n = 120 ejecuciones/modelo (40 consultas × 3).

Compensar · Fundación Universitaria Ucompensar
0,87
Puntaje global ponderado
Gemini 2.5 Pro (0–1)
92%
Precisión máxima
Gemini 2.5 Pro
85%
Aciertos en piloto real
34/40 consultas
0,46s
Latencia mínima
Gemini 2.0 Flash
16×
Gemini 2.0 Flash
más económico que 2.5 Pro
A

Contextualización del Problema

Las PYMES representan más del 90 % del tejido empresarial colombiano (Confecámaras, 2024), pero enfrentan barreras estructurales para adoptar BI tradicional: Power BI (US$14/usr/mes), Tableau (US$70/usr/mes), curvas de aprendizaje altas y escasez de talento especializado. Se generan 2,5 quintillones de bytes diarios a nivel global; la analítica ya no es opcional, es ventaja competitiva. La IA generativa emerge como catalizador capaz de automatizar procesos analíticos y democratizar el acceso sin infraestructura costosa.

B

Objetivos de la Investigación

Pregunta central: ¿cuál es la combinación de modelo generativo, plataforma cloud y herramienta de visualización que ofrece la mejor relación costo-valor para implementar tableros de control interactivos en PYMES de Bogotá D. C.?

Específicos: (1) Evaluar LLM en 5 criterios ponderados · (2) Comparar herramientas de visualización · (3) Validar con datos reales en una ferretería bogotana (TRL 6–7, Minciencias 2023).

D2

Curvas de Rendimiento (Figs. 1–6)

Fig. 6 · Accuracy (%) por categoría de consulta — 10 consultas/categoría
100 75 50 25 0 1009060 90 9050 90 8070 60 7020 PRODUCTOS CLIENTES TOTALES TENDENCIAS
GEMINI 2.0 FLASH GPT-4o RANDOM FOREST

Las consultas de “tendencias” —analítica predictiva sobre series de tiempo cortas— concentran el menor rendimiento en todos los modelos. La media por modelo coincide con la precisión global de la Tabla I (Flash 85 %, GPT-4o 83 %).

C

Propuesta Metodológica

Enfoque mixto secuencial con énfasis descriptivo-comparativo (Creswell, 2018). Usabilidad medida con la escala SUS (Brooke, 1996) y evaluación heurística (Nielsen, 1994). Puntaje compuesto P_j = Σ wᵢ · sᵢⱼ. Banco de 40 consultas conversacionales reales en 4 categorías de 10: productos más vendidos, clientes principales, totales por período y tendencias.

Criterios ponderados · evaluación AHP (Σ = 100 %)
Capacidad técnica25%
Integración20%
Escalabilidad20%
Facilidad de uso15%
Costo-beneficio20%
ModeloTipoContextoMultim.Fine-tuning
Gemini 2.5 Pro LLM1M tokensDisponible
Gemini 2.0 FlashLLM1M tokensDisponible
GPT-4oLLM128kLimitado
Random ForestML clás.N/ANoN/A
Fig. 1 · Latencia media (s) vs tamaño del prompt (tokens, escala log)
5,0 4,0 3,0 2,0 1,0 0 100 500 2000 8000
GEMINI 2.5 PRO GEMINI 2.0 FLASH GPT-4o

Para 1.000 consultas, GPT-4o cuesta ~67× más que Gemini 2.0 Flash y ~16× más que Gemini 2.5 Pro; su escalado de latencia lo excluye como opción primaria para MIPYMES colombianas.

Fig. 4 · Radar comparativo · 6 criterios × 4 alternativas (norm. 0–1)
Precisión Español nativo Bajo costo Interpretabilidad Razonamiento Integración
GEMINI 2.5 PRO GEMINI 2.0 FLASH GPT-4o RANDOM FOREST

Gemini 2.5 Pro lidera en precisión y razonamiento; Gemini 2.0 Flash domina en costo e integración. Random Forest solo destaca en costo e interpretabilidad, pero colapsa en razonamiento.

D3

Herramientas de Visualización (Tabla II)

Looker Studio Seleccionada
US$0 / mes
Integración nativa con BigQuery y Vertex AI. Auto-generación nativa. Curva de aprendizaje baja.
Power BI
US$14 / usr / mes
Ecosistema Microsoft. Aprendizaje alto. Auto-generación limitada (DAX).
Tableau
US$70 / usr / mes
Muy potente. Aprendizaje alto. Costo prohibitivo para MIPYME.
Pentaho CE
US$0 · open source
ETL potente, curva de aprendizaje muy alta, auto-generación manual.
F7

Pipeline · 5 Agentes Google ADK (Fig. 7)

1
ETL Agent
Extracción e ingestión PDF · CSV · XLSX
2
DataCleaner
Limpieza y validación · nulos · duplicados · normalización
3
DataAnalyzer
Estadística descriptiva · correlaciones · KPIs
4
InsightGenerator
Resumen en lenguaje natural (español)
5
DashboardConfig
Render del tablero interactivo + ChatAgent
Orquestación: Google ADK · SequentialAgent
E

Beneficios para la Comunidad

Academia
Marco metodológico replicable con criterios ponderados para evaluar LLMs en contextos organizacionales reales. Banco de pruebas conversacional en español colombiano.
Sector Productivo
Acceso a BI conversacional a una fracción del costo de las suites tradicionales (Looker Studio US$0 vs. Tableau US$70/usr/mes), sin necesidad de analistas especializados.
Sociedad
Democratización de la toma de decisiones basada en datos para el 90 % del tejido empresarial colombiano. Potencial de articulación con cámaras de comercio y MinTIC.
85%
Piloto real · Ferretería bogotana · Bogotá D.C.
250 registros (clientes, facturas, cotizaciones y servicios) · 34 de 40 consultas resueltas correctamente
El sistema identificó de forma autónoma a un cliente con frecuencia de compra decreciente y propuso un descuento por volumen — una recomendación no programada que evidencia razonamiento más allá del simple retrieve.
D1

Hallazgos — Comparativa de Modelos (Tabla I)

Métricas observadas · n = 120 ejecuciones por modelo · puntaje global ponderado P_j (escala 0–1)

ModeloPrecisiónLatenciaCosto / 1kRazon. · Integr. (1–5)Puntaje global
Gemini 2.5 Pro ★ 92 % 0,68 s US$1,25 4,8 · 4,3 0,87
Gemini 2.0 Flash 85 % 0,46 s US$0,075 4,6 · 4,8 0,84
GPT-4o 83 % 1,10 s US$5,00 4,7 · 4,0 0,79
Random Forest 62 % 0,02 s US$0,02 2,0 · 3,3 baseline (referencia)
Evaluación por criterios ponderados (normalizada 0–1) · P_j = Σ wᵢ·sᵢⱼ
Criterio (ponderación)Gemini 2.5 ProGemini 2.0 FlashGPT-4o
Capacidad técnica (25 %)0,950,860,88
Integración (20 %)0,860,960,80
Escalabilidad (20 %)0,880,880,80
Facilidad de uso (15 %)0,860,700,82
Costo-beneficio (20 %)0,790,740,62
Puntaje compuesto0,870,840,79
F

Proyección a Futuro · Trabajo Futuro

Fase I
Escalado del piloto

Replicar el piloto en una decena de empresas para validar otros sectores además de la ferretería y avanzar hacia TRL 8–9 (Minciencias, 2023).

Fase II
Small Language Models

Replicar el experimento con SLM open source desplegados localmente, reduciendo la dependencia de APIs externas y el riesgo de privacidad.

Fase III
Adopción institucional

Articular la plataforma con cámaras de comercio y programas de la Alcaldía de Bogotá para acelerar la adopción en microempresas distritales.

!

Limitaciones Identificadas

1

Conectividad: requiere conexión a internet estable para las APIs de los modelos generativos.

2

Capacidad: techo de 10.000 registros por organización en el prototipo antes de particionamiento.

3

Especificidad sectorial: validación solo en ferretería; generalizar requiere más pilotos en otros sectores.

4

Gobernanza y privacidad: persisten preocupaciones propias de la IA generativa empresarial al transmitir datos a APIs externas.