En tant que Lead Machine Learning Engineer, je conçois et déploie des solutions d’intelligence artificielle de bout en bout : de l’idéation à la mise en production. Je dirige des équipes d’ingénieurs pour créer des agents et applications basés sur des modèles de langage (LLM), et j’industrialise ces solutions dans des environnements complexes. Basé à Brest, je combine expertise en MLOps, IA générative, DevOps et développement web pour livrer des produits performants et innovants.
Depuis 2025, je suis Lead Machine Learning Engineer & coordinateur de projet au Crédit Mutuel Arkéa. Je pilote une équipe d’ingénieurs en IA afin de :
- Développer des applications LLM et des agents conversationnels intégrant des fonctionnalités de recherche augmentée (RAG) et d’orchestration de tâches.
- Concrétiser des projets d’IA générative pour des cas d’usage internes, en pilotant l’intégration et l’industrialisation de modèles maison ou de modèles open‑source.
- Déployer et monitorer des API et services IA à l’échelle sur Kubernetes et Vertex AI, en assurant la scalabilité, la sécurité et la conformité.
- Évangéliser et encadrer des équipes pluridisciplinaires autour des bonnes pratiques MLOps et DevOps.
De 2023 à 2025, j’ai occupé le poste de Lead Machine Learning Engineer chez Capgemini. J’y ai industrialisé des applications basées sur des modèles de langage et l’IA générative, tout en encadrant une équipe de data scientists et d’ingénieurs.
- IA & LLM : développement d’agents intelligents, intégration de modèles de langage de grande taille (LLMs) pour des tâches de traitement du langage naturel, génération de texte et systèmes de recommandation.
- MLOps & Cloud : conception de pipelines CI/CD, orchestrations sur Kubernetes, déploiement sur Vertex AI et Azure, surveillance et traçabilité des modèles en production.
- Automation & Orchestration : utilisation de frameworks spécialisés (LiteLLM, vLLM, LangGraph, Langfuse, n8n) pour construire des workflows complexes et des agents stateful.
- Développement web : création d’applications full‑stack et de backends robustes (Python, PHP, TypeScript) pour mettre en valeur les produits IA.
Pour développer et mettre en production des applications LLM performantes, je m’appuie sur une stack IA générative moderne :
- LiteLLM : proxy open‑source qui se place entre les applications et les fournisseurs de modèles pour normaliser, contrôler et surveiller les appels aux API LLM:contentReference[oaicite:0]{index=0}. Ce composant apporte visibilité et conformité sans altérer la logique applicative.
- vLLM : moteur d’inférence et de servage haute performance pour les LLMs. Il permet de déployer une large gamme de modèles open‑source sur tout type de matériel et fournit une API compatible OpenAI pour un déploiement simple et économique:contentReference[oaicite:1]{index=1}.
- LangGraph : framework d’orchestration low‑level pour concevoir des agents conversationnels et des workflows multi‑étapes; il offre une exécution durable avec support human‑in‑the‑loop et une gestion de mémoire et de débogage avancée:contentReference[oaicite:2]{index=2}.
- Langfuse : plateforme open source d’ingénierie LLM qui capture les traces complètes d’une application, fournit des évaluations et des métriques pour améliorer et déboguer les systèmes LLM:contentReference[oaicite:3]{index=3}.
- n8n : outil visuel d’automatisation qui orchestre des processus multi‑agents via une interface no‑code, connectant plus de 500 intégrations (Slack, bases de données, API, etc.):contentReference[oaicite:4]{index=4}.
Vous cherchez à intégrer l’IA dans vos produits ou à concevoir votre propre agent conversationnel ? Je propose mes services en freelance :
- Applications LLM sur‑mesure : conception et déploiement d’agents basés sur ChatGPT, Llama ou Mistral, intégration d’outils de recherche et de mémorisation (RAG), personnalisation de prompts et fine‑tuning.
- MLOps & Industrialisation : mise en place de pipelines robustes (CI/CD, automatisation des tests, suivi et traçabilité des modèles), déploiement sur Kubernetes, Vertex AI ou Azure, sécurité et conformité.
- Développement web et API : création de backends et d’APIs REST/GraphQL pour exposer vos modèles, intégration avec des frontends modernes (Vue JS, React, TypeScript).
Pour discuter de votre projet ou obtenir un devis, contactez‑moi à killianmahe.pro@gmail.com ou visitez mon portfolio.
- GitHub : killian‑mahe
- Portfolio : killianmahe.fr
| Python |
Laravel |
Vue JS |
React |
TypeScript |
| JavaScript |
PHP |
HTML |
CSS |
Tailwind CSS |
- Docker & Kubernetes : containerisation et orchestration de microservices pour des déploiements reproductibles et scalables.
- Azure & Vertex AI : services cloud pour héberger et entraîner des modèles, exécuter des workflows MLOps et automatiser les déploiements.
- LiteLLM, vLLM, LangGraph, Langfuse, n8n : composants essentiels de ma stack IA générative pour la gestion des appels LLM, l’optimisation de l’inférence, l’orchestration d’agents et la traçabilité.
- GitHub Actions : automatisation des pipelines CI/CD.
- MLflow & LangSmith : suivi d’expériences et gestion des modèles.
- MySQL & PostgreSQL : bases de données relationnelles pour stocker les données applicatives.
- C, C++, C# : langage pour le développement d’applications et de bibliothèques performantes.
Vous souhaitez discuter d’une collaboration, d’une mission freelance ou simplement échanger ? N’hésitez pas à me contacter par e‑mail ou via mon portfolio.

