>_DamDevOps
Accueil Blog GitHub LinkedIn

Blog

Tous (6) Crossplane (2) GCP (1) IA (2) IaC (1) Kubernetes (4) PHP (1) PostgreSQL (1) Python (1) vLLM (1)
Déployer un LLM on-premise : les décisions d'architecture qui comptent
9 juin 2026 · 9 min

Déployer un LLM on-premise : les décisions d'architecture qui comptent

Entre "faire tourner Ollama en local" et déployer une stack IA fiable en production, il y a une série de décisions d'architecture. Moteur d'inférence, interface, automation, sizing : ce qui compte vraiment.

IA Kubernetes vLLM
Lire →
Comment on a simplifié notre stack IA avec LiteLLM chez Evaneos
9 décembre 2025 · 8 min

Comment on a simplifié notre stack IA avec LiteLLM chez Evaneos

Comment Evaneos a remplacé des clés API éparpillées entre OpenAI, Anthropic, Gemini et Deepgram par un proxy LiteLLM unique déployé sur Kubernetes avec FluxCD.

IA Kubernetes
Lire →

© 2026 Damien Dagorn · GitHub · LinkedIn