Semillero Data Core TechGrupo GIISIA & Analítica de Datos PI0320251 · Bogotá D.C. · 2026

Artículo Científico · Formato IEEE · Sustentación

Plataforma web con IA Generativa para la Analítica de Datos en Tableros de Control Interactivos

Una propuesta aplicada a PYMES — estudio comparativo de modelos generativos para Bogotá D. C.

Estudio comparativo descriptivo de modelos LLM (Gemini 2.5 Pro, Gemini 2.0 Flash, GPT-4o) y un baseline Random Forest, integrados con herramientas de visualización (Looker Studio, Power BI, Tableau, Pentaho CE) para democratizar la inteligencia de negocio en micro y pequeñas empresas colombianas. Validación empírica con datos reales de una ferretería bogotana piloto · banco de 40 consultas · n = 120 ejecuciones/modelo (40 consultas × 3).

Compensar · Fundación Universitaria Ucompensar

0,87

Puntaje global ponderado
Gemini 2.5 Pro (0–1)

92%

Precisión máxima
Gemini 2.5 Pro

85%

Aciertos en piloto real
34/40 consultas

0,46s

Latencia mínima
Gemini 2.0 Flash

16×

Gemini 2.0 Flash
más económico que 2.5 Pro

Contextualización del Problema

Las PYMES representan más del 90 % del tejido empresarial colombiano (Confecámaras, 2024), pero enfrentan barreras estructurales para adoptar BI tradicional: Power BI (US$14/usr/mes), Tableau (US$70/usr/mes), curvas de aprendizaje altas y escasez de talento especializado. Se generan 2,5 quintillones de bytes diarios a nivel global; la analítica ya no es opcional, es ventaja competitiva. La IA generativa emerge como catalizador capaz de automatizar procesos analíticos y democratizar el acceso sin infraestructura costosa.

Objetivos de la Investigación

Pregunta central: ¿cuál es la combinación de modelo generativo, plataforma cloud y herramienta de visualización que ofrece la mejor relación costo-valor para implementar tableros de control interactivos en PYMES de Bogotá D. C.?

Específicos: (1) Evaluar LLM en 5 criterios ponderados · (2) Comparar herramientas de visualización · (3) Validar con datos reales en una ferretería bogotana (TRL 6–7, Minciencias 2023).

Curvas de Rendimiento (Figs. 1–6)

Fig. 6 · Accuracy (%) por categoría de consulta — 10 consultas/categoría

GEMINI 2.0 FLASH GPT-4o RANDOM FOREST

Las consultas de “tendencias” —analítica predictiva sobre series de tiempo cortas— concentran el menor rendimiento en todos los modelos. La media por modelo coincide con la precisión global de la Tabla I (Flash 85 %, GPT-4o 83 %).

Propuesta Metodológica

Enfoque mixto secuencial con énfasis descriptivo-comparativo (Creswell, 2018). Usabilidad medida con la escala SUS (Brooke, 1996) y evaluación heurística (Nielsen, 1994). Puntaje compuesto P_j = Σ wᵢ · sᵢⱼ. Banco de 40 consultas conversacionales reales en 4 categorías de 10: productos más vendidos, clientes principales, totales por período y tendencias.

Criterios ponderados · evaluación AHP (Σ = 100 %)

Capacidad técnica25%

Integración20%

Escalabilidad20%

Facilidad de uso15%

Costo-beneficio20%

Modelo	Tipo	Contexto	Multim.	Fine-tuning
Gemini 2.5 Pro ★	LLM	1M tokens	Sí	Disponible
Gemini 2.0 Flash	LLM	1M tokens	Sí	Disponible
GPT-4o	LLM	128k	Sí	Limitado
Random Forest	ML clás.	N/A	No	N/A

Fig. 1 · Latencia media (s) vs tamaño del prompt (tokens, escala log)

GEMINI 2.5 PRO GEMINI 2.0 FLASH GPT-4o

Para 1.000 consultas, GPT-4o cuesta ~67× más que Gemini 2.0 Flash y ~16× más que Gemini 2.5 Pro; su escalado de latencia lo excluye como opción primaria para MIPYMES colombianas.

Fig. 4 · Radar comparativo · 6 criterios × 4 alternativas (norm. 0–1)

GEMINI 2.5 PRO GEMINI 2.0 FLASH GPT-4o RANDOM FOREST

Gemini 2.5 Pro lidera en precisión y razonamiento; Gemini 2.0 Flash domina en costo e integración. Random Forest solo destaca en costo e interpretabilidad, pero colapsa en razonamiento.

Herramientas de Visualización (Tabla II)

Looker Studio Seleccionada

US$0 / mes

Integración nativa con BigQuery y Vertex AI. Auto-generación nativa. Curva de aprendizaje baja.

Power BI

US$14 / usr / mes

Ecosistema Microsoft. Aprendizaje alto. Auto-generación limitada (DAX).

Tableau

US$70 / usr / mes

Muy potente. Aprendizaje alto. Costo prohibitivo para MIPYME.

Pentaho CE

US$0 · open source

ETL potente, curva de aprendizaje muy alta, auto-generación manual.

Pipeline · 5 Agentes Google ADK (Fig. 7)

ETL Agent

Extracción e ingestión PDF · CSV · XLSX

DataCleaner

Limpieza y validación · nulos · duplicados · normalización

DataAnalyzer

Estadística descriptiva · correlaciones · KPIs

InsightGenerator

Resumen en lenguaje natural (español)

DashboardConfig

Render del tablero interactivo + ChatAgent

Orquestación: Google ADK · SequentialAgent

Beneficios para la Comunidad

Academia

Marco metodológico replicable con criterios ponderados para evaluar LLMs en contextos organizacionales reales. Banco de pruebas conversacional en español colombiano.

Sector Productivo

Acceso a BI conversacional a una fracción del costo de las suites tradicionales (Looker Studio US$0 vs. Tableau US$70/usr/mes), sin necesidad de analistas especializados.

Sociedad

Democratización de la toma de decisiones basada en datos para el 90 % del tejido empresarial colombiano. Potencial de articulación con cámaras de comercio y MinTIC.

85%

Piloto real · Ferretería bogotana · Bogotá D.C.

250 registros (clientes, facturas, cotizaciones y servicios) · 34 de 40 consultas resueltas correctamente

El sistema identificó de forma autónoma a un cliente con frecuencia de compra decreciente y propuso un descuento por volumen — una recomendación no programada que evidencia razonamiento más allá del simple retrieve.

Hallazgos — Comparativa de Modelos (Tabla I)

Métricas observadas · n = 120 ejecuciones por modelo · puntaje global ponderado P_j (escala 0–1)

Modelo	Precisión	Latencia	Costo / 1k	Razon. · Integr. (1–5)	Puntaje global
Gemini 2.5 Pro ★	92 %	0,68 s	US$1,25	4,8 · 4,3	0,87
Gemini 2.0 Flash	85 %	0,46 s	US$0,075	4,6 · 4,8	0,84
GPT-4o	83 %	1,10 s	US$5,00	4,7 · 4,0	0,79
Random Forest	62 %	0,02 s	US$0,02	2,0 · 3,3	baseline (referencia)

Evaluación por criterios ponderados (normalizada 0–1) · P_j = Σ wᵢ·sᵢⱼ

Criterio (ponderación)	Gemini 2.5 Pro	Gemini 2.0 Flash	GPT-4o
Capacidad técnica (25 %)	0,95	0,86	0,88
Integración (20 %)	0,86	0,96	0,80
Escalabilidad (20 %)	0,88	0,88	0,80
Facilidad de uso (15 %)	0,86	0,70	0,82
Costo-beneficio (20 %)	0,79	0,74	0,62
Puntaje compuesto	0,87	0,84	0,79

Proyección a Futuro · Trabajo Futuro

Fase I

Escalado del piloto

Replicar el piloto en una decena de empresas para validar otros sectores además de la ferretería y avanzar hacia TRL 8–9 (Minciencias, 2023).

Fase II

Small Language Models

Replicar el experimento con SLM open source desplegados localmente, reduciendo la dependencia de APIs externas y el riesgo de privacidad.

Fase III

Adopción institucional

Articular la plataforma con cámaras de comercio y programas de la Alcaldía de Bogotá para acelerar la adopción en microempresas distritales.

Limitaciones Identificadas

Conectividad: requiere conexión a internet estable para las APIs de los modelos generativos.

Capacidad: techo de 10.000 registros por organización en el prototipo antes de particionamiento.

Especificidad sectorial: validación solo en ferretería; generalizar requiere más pilotos en otros sectores.

Gobernanza y privacidad: persisten preocupaciones propias de la IA generativa empresarial al transmitir datos a APIs externas.