La vigilancia tecnológica manual son unas 3 a 4 horas a la semana de lectura, clasificación y síntesis. La información llega de todas partes, en formatos diferentes y sin ninguna priorización. ¿Cómo convertirla en un recurso colectivo útil sin tener que dedicarle tanto tiempo?
Problemática elegida: ¿Cómo reconfigura la ecuación FinOps + Green IT + Soberanía de datos las decisiones de arquitectura Cloud / On-Premise / Híbrida para las empresas en 2026?
Arquitectura del sistema


Canvas del Workflow 1 en n8n — Pipeline de recolección automática cada 2 horas
Infraestructura: VM self-hosted en Proxmox
En lugar de pagar un SaaS, desplegué todas las herramientas en una VM existente:
| Componente | Versión | Rol |
|---|---|---|
| Proxmox | Hipervisor | VM on-premise |
| Debian 12 | OS | 2 vCPU · 2 GB RAM · 20 GB |
| PostgreSQL 15 | Puerto 5432 | BDD Miniflux |
| Miniflux | Puerto 8080 | Agregador RSS |
| n8n | Puerto 5678 | Orquestador de workflows |
| Nginx | Puerto 80 | Reverse proxy |
Acceso: Túnel SSH desde el equipo cliente — ningún puerto expuesto a Internet.
Costo mensual: 0€ — infraestructura ya existente, herramientas 100% open source.

Interfaz Miniflux — más de 10 feeds RSS activos organizados por temática
Los 3 workflows de n8n (pipeline ETL)
Workflow 1 — Recolección continua (cada 2h)
Schedule Trigger (2h)
→ HTTP GET /v1/entries?status=unread ← API REST Miniflux
→ Split Out ← Separar los artículos
→ Código JS: filtrado por palabras clave ← FinOps / Green IT / Soberanía
→ Código JS: construcción de Markdown ← Formato estructurado
→ Google Drive: Upload /01_Raw/ ← Almacenamiento
→ HTTP PUT /v1/entries ← Marcar como leídos
→ Slack Webhook #veille-critique ← Alertas en tiempo real

Nodo de Código n8n — Lógica de filtrado por palabras clave (FR + EN) en JavaScript
Workflow 2 — Resumen semanal (lunes 08:00)
Schedule Trigger (lunes 08h)
→ Código JS: timestamp -7d, n° de semana
→ HTTP GET /v1/entries?after=TIMESTAMP ← Artículos de los últimos 7 días
→ Código JS: agregación por temática ← FinOps / Green IT / Soberanía
→ Google Drive: Upload /02_Digest/ ← Resumen estructurado en Markdown
→ Slack Webhook #veille-hebdo ← Resumen + enlace a Drive

Canvas del Workflow 2 — Generación automática del resumen semanal
Workflow 3 — Notificación de podcast (trigger por archivo en Drive)
Google Drive Trigger ← Nuevo archivo en /03_Podcast/
→ Slack Webhook #veille-podcast ← Enlace de reproducción automática

Historial de ejecuciones de n8n — Pipeline activo las 24h, 7 días a la semana
Recolección: Miniflux
Miniflux agrega de forma automática más de 10 feeds RSS cada hora. Los artículos se guardan en PostgreSQL y se exponen mediante una API REST que es consumida por n8n.
Fuentes activas por temática:
| FinOps | Green IT | Soberanía |
|---|---|---|
| FinOps Foundation | GreenIT.fr | CNIL |
| Le Monde Informatique | The Shift Project | Numerama |
| Silicon.fr | ADEME | Next.ink |
| The New Stack | Next.ink | Silicon.fr |

Lista de artículos no leídos en Miniflux — volumen de recolección semanal
Almacenamiento estructurado: Google Drive

La información está organizada en 4 niveles de procesamiento:

Estructura de almacenamiento en Google Drive — 4 niveles de procesamiento de la información

Carpeta /01_Raw — artículos recolectados automáticamente (nomenclatura: articulo_AAAA-MM-DD_ID.md)

Resumen semanal — síntesis automática por temática con contadores de artículos
Difusión: Slack con 3 canales

#veille-critique — alertas en tiempo real sobre los artículos con alto valor temático

#veille-hebdo — resumen estructurado enviado cada lunes a las 08:00 con enlace a Google Drive

#veille-podcast — notificación automática al detectar un nuevo archivo de audio
Podcast de IA: NotebookLM
Cada semana, el resumen en Markdown se importa a NotebookLM para generar un Audio Overview de unos 15 a 20 minutos.
Prompt utilizado:
Genera un podcast de vigilancia tecnológica en francés.
Temas: FinOps, Green IT, Soberanía de datos.
Tono profesional pero accesible.
Estructura: introducción, 3 segmentos temáticos, tendencia de la semana.

NotebookLM — Notebook «Vigilancia EPSI 2026» con fuentes permanentes + resumen semanal

Interfaz de Audio Overview — generación del podcast de IA (~10 min de procesamiento)
Métricas y resultados medidos
| Indicador | Meta | Resultado semana 21 |
|---|---|---|
| Fuentes RSS activas | ≥ 10 | ✅ 10+ |
| Artículos recolectados/semana | 50–100 | ✅ 98 |
| Artículos categorizados/semana | ≥ 15 | ✅ 14 |
| Resumen generado/semana | 1 | ✅ Automático |
| Podcast producido/semana | 1 | ✅ ~4 min manuales |
| Costo mensual de infraestructura | 0€ | ✅ 0€ |
Embudo de procesamiento:
~300 artículos RSS brutos
→ 98 recolectados por Miniflux (−67%)
→ 14 categorizados por n8n (−86%)
→ 1 resumen en Markdown
→ 1 podcast de IA de 15–20 min
→ Inteligencia para la toma de decisiones
Lo que aprendimos
Este proyecto demuestra las siguientes competencias, directamente aplicables en Data Engineering:
| Competencia | Puesta en práctica en este proyecto |
|---|---|
| Pipeline de datos | 3 workflows ETL orquestados en n8n |
| Integración de API REST | Consumo de la API de Miniflux (GET/PUT/JSON) |
| Transformación de datos | JavaScript nativo: filtrado, agregación y formateo a Markdown |
| Infraestructura on-premise | VM Debian 12 en Proxmox, PostgreSQL, Nginx, systemd |
| Almacenamiento estructurado | Arquitectura de 4 niveles en Google Drive |
| Automatización | Cron, triggers de Drive, webhooks de Slack |
| Monitoreo | KPIs semanales, historial de ejecuciones en n8n |
| Open source | Stack 100% open source, cero vendor lock-in |
Código y documentación
- Repositorio GitHub: https://github.com/javiladino/veille_techno_2026
- Documentation técnica: arquitectura, workflows, KPIs, guía de despliegue
- Informe mensual: marzo 2026 disponible en
/reports/
Este proyecto se llevó a cabo en colaboración con Serge WEMBE II-ESSOUMBA y Cheik LAWANI

