La veille technologique manuelle, c’est 3–4 heures par semaine de lecture, de tri, et de synthèse. L’information arrive de partout, dans des formats différents, sans priorisation. Comment en faire une ressource collective utile, sans y consacrer autant de temps ?
Problématique choisie : Comment l’équation FinOps + Green IT + Souveraineté des données reconfigure-t-elle les choix d’architecture Cloud / On-Premise / Hybride pour les entreprises en 2026 ?
Architecture du système


Canvas du Workflow 1 dans n8n — Pipeline de collecte automatique toutes les 2 heures
Infrastructure : VM self-hosted sur Proxmox
Plutôt que de payer un SaaS, j’ai déployé l’ensemble des outils sur une VM existante :
| Composant | Version | Rôle |
|---|---|---|
| Proxmox | Hyperviseur | VM on-premise |
| Debian 12 | OS | 2 vCPU · 2 Go RAM · 20 Go |
| PostgreSQL 15 | Port 5432 | BDD Miniflux |
| Miniflux | Port 8080 | Agrégateur RSS |
| n8n | Port 5678 | Orchestrateur workflows |
| Nginx | Port 80 | Reverse proxy |
Accès : SSH tunnel depuis poste client — aucun port exposé à Internet.
Coût mensuel : 0€ — infrastructure déjà existante, outils 100% open source.

Interface Miniflux — 10+ flux RSS actifs organisés par thématique
Les 3 workflows n8n (pipeline ETL)
Workflow 1 — Collecte continue (toutes les 2h)
Schedule Trigger (2h)
→ HTTP GET /v1/entries?status=unread ← API REST Miniflux
→ Split Out ← Séparer les articles
→ Code JS : filtrage mots-clés ← FinOps / Green IT / Souveraineté
→ Code JS : construction Markdown ← Format structuré
→ Google Drive : Upload /01_Raw/ ← Stockage
→ HTTP PUT /v1/entries ← Marquer comme lus
→ Slack Webhook #veille-critique ← Alertes temps réel

Nœud Code n8n — Logique de filtrage par mots-clés (FR + EN) en JavaScript
Workflow 2 — Digest hebdomadaire (lundi 08h00)
Schedule Trigger (lundi 08h)
→ Code JS : timestamp -7j, n° semaine
→ HTTP GET /v1/entries?after=TIMESTAMP ← Articles des 7 derniers jours
→ Code JS : agrégation par thématique ← FinOps / Green IT / Souveraineté
→ Google Drive : Upload /02_Digest/ ← Digest structuré Markdown
→ Slack Webhook #veille-hebdo ← Résumé + lien Drive

Canvas Workflow 2 — Génération automatique du digest hebdomadaire
Workflow 3 — Notification podcast (trigger fichier Drive)
Google Drive Trigger ← Nouveau fichier dans /03_Podcast/
→ Slack Webhook #veille-podcast ← Lien d'écoute automatique

Historique des exécutions n8n — Pipeline actif 24h/24, 7j/7
Collecte : Miniflux
Miniflux agrège automatiquement 10+ flux RSS toutes les heures. Les articles sont stockés dans PostgreSQL et exposés via une API REST consommée par n8n.
Sources actives par thématique :
| FinOps | Green IT | Souveraineté |
|---|---|---|
| FinOps Foundation | GreenIT.fr | CNIL |
| Le Monde Informatique | The Shift Project | Numerama |
| Silicon.fr | ADEME | Next.ink |
| The New Stack | Next.ink | Silicon.fr |

Liste des articles non lus dans Miniflux — volume de collecte hebdomadaire
Stockage structuré : Google Drive

L’information est organisée selon 4 niveaux de traitement :

Structure de stockage Google Drive — 4 niveaux de traitement de l’information

Dossier /01_Raw — articles collectés automatiquement (nommage : article_AAAA-MM-JJ_ID.md)

Digest hebdomadaire — synthèse automatique par thématique avec compteurs d’articles
Diffusion : Slack 3 canaux

#veille-critique — alertes temps réel sur les articles à haute valeur thématique

#veille-hebdo — digest structuré envoyé chaque lundi à 08h00 avec lien Google Drive

#veille-podcast — notification automatique à la détection d’un nouveau fichier audio
Podcast IA : NotebookLM
Chaque semaine, le digest Markdown est importé dans NotebookLM pour générer un Audio Overview de 15–20 minutes.
Prompt utilisé :
Génère un podcast de veille technologique en français.
Thèmes : FinOps, Green IT, Souveraineté des données.
Ton professionnel mais accessible.
Structure : introduction, 3 segments thématiques, tendance de la semaine.

NotebookLM — Notebook « Veille EPSI 2026 » avec sources permanentes + digest hebdo

Interface Audio Overview — génération du podcast IA (~10 min de traitement)
Métriques & résultats mesurés
| Indicateur | Cible | Résultat semaine 21 |
|---|---|---|
| Sources RSS actives | ≥ 10 | ✅ 10+ |
| Articles collectés/semaine | 50–100 | ✅ 98 |
| Articles catégorisés/semaine | ≥ 15 | ✅ 14 |
| Digest généré/semaine | 1 | ✅ Automatique |
| Podcast produit/semaine | 1 | ✅ ~4 min manuelles |
| Coût infrastructure mensuel | 0€ | ✅ 0€ |
Entonnoir de traitement :
~300 articles RSS bruts
→ 98 collectés par Miniflux (−67%)
→ 14 catégorisés par n8n (−86%)
→ 1 digest Markdown
→ 1 podcast IA 15–20 min
→ Intelligence décisionnelle
Ce que l’on a appris
Ce projet démontre les compétences suivantes, directement applicables en Data Engineering :
| Compétence | Mise en pratique dans ce projet |
|---|---|
| Pipeline de données | 3 workflows ETL orchestrés sur n8n |
| Intégration API REST | Consommation de l’API Miniflux (GET/PUT/JSON) |
| Transformation de données | JavaScript natif : filtrage, agrégation, formatage Markdown |
| Infrastructure on-premise | VM Debian 12 sur Proxmox, PostgreSQL, Nginx, systemd |
| Stockage structuré | Architecture 4 niveaux dans Google Drive |
| Automatisation | Cron, triggers Drive, webhooks Slack |
| Monitoring | KPIs hebdomadaires, historique d’exécutions n8n |
| Open source | 100% stack open source, zéro vendor lock-in |
Code & documentation
- Dépôt GitHub : https://github.com/javiladino/veille_techno_2026
- Documentation technique : architecture, workflows, KPIs, guide déploiement
- Rapport mensuel : mars 2026 disponible dans
/reports/
Ce projet a été mené en collaboration avec Serge WEMBE II-ESSOUMBA et Cheik LAWANI

