Pierre KasparianAI & Data freelancer
Freelance IA & Ingénieur Données · Étudiant ingénieur

Pierre Kasparian, consultant en intégration IA conforme RGPD

Étudiant ingénieur en 4e année à l'UTT (Université de Technologie de Troyes) en informatique et systèmes d'information, je travaille en freelance depuis 2024 sur des missions d'intégration IA et d'ingénierie des données pour des PME et startups françaises et européennes.

Après un stage de six mois chez Pretto (fintech française, crédit immobilier) et trois mois de freelance consécutifs, j'ai acquis une expérience concrète en LLM production : pipelines RAG, service d'inférence batch multi-providers, automatisation IA et évaluation de prompts avec Langfuse. J'ai également accompagné LiveSession sur un chatbot RAG multi-clients.

Mon positionnement : intégration IA avec une contrainte de conformité RGPD dès la conception. En pratique, cela signifie hébergement européen (OVH, Scaleway), modèles open source auto-hébergés (Mistral, LLaMA) pour les données sensibles, et transfert de compétences à l'issue de chaque mission.

Parcours

Formation Machine Learning & Data Science

Régression linéaire et logistique, classification SVM, clustering k-means, arbres de décision, réduction dimensionnelle (PCA). Implémentation avec scikit-learn et pandas. Projet capstone : prédiction de cours boursiers par régression sur données historiques.

Formation LLM Engineering

RAG complet (stratégies de chunking, embedding, retrieval, reranking cross-encoder), fine-tuning QLoRA sur Mistral et LLaMA, agents autonomes avec LangChain et n8n, déploiement de modèles open source via Ollama. Certification Udemy obtenue en janvier 2025.

UTT - Informatique et Systèmes d'Information

Cursus ingénieur 5 ans, formation généraliste avec spécialisation data. Modules : algorithmique, bases de données relationnelles, architectures logicielles, génie logiciel, réseaux, sécurité. Spécialisation choisie en 4e année : data engineering et IA appliquée.

Expérience

Pretto

Août 2025 – Fév 2026

Stage IA & Data

Développement de pipelines ETL Python-Airflow-dbt pour la production. Service d'inférence batch LLM multi-providers (OpenAI, Anthropic, Mistral, Vertex AI) traitant plus de 3 000 inputs par jour. Réduction des coûts d'inférence de 50% par routage dynamique des modèles selon la charge et le volume de tokens.

Freelance IA & Data

Pipeline d'auto-amélioration de prompts avec Langfuse et datasets annotés. Fiabilisation de la plateforme LLM : suppression des traitements base64, centralisation des clients tiers via pattern Factory. Refactorisation de la plateforme d'évaluation Slack-native avec réduction des régressions de 80%.

Freelance IA & Data

2024 – maintenant

10+ projets livrés depuis 2024 : chatbots RAG multi-clients, classification ML sur données métier (91% de précision), automatisations IA avec n8n, développement SaaS avec Next.js et FastAPI. Ingénierie des données (SQL, dbt, Airflow) comme fondation avant toute intégration IA.

Voir toutes mes réalisations

Junior Conseil UTT

2023 – 2025

Directeur Technique et Chef de Projet

Pilotage de missions client, encadrement des équipes projet et coordination des livrables techniques. Développement d'une application web pour une association de sécurité solaire.

Responsable Communication & Événementiel

Gestion des réseaux sociaux, communication externe et organisation des événements annuels de l'association étudiante.

Mes valeurs

RGPD by design

Chaque intégration est pensée pour la conformité dès le départ. En pratique : sélection du provider d'hébergement en première contrainte, modèles open source auto-hébergés pour les données sensibles.

Pédagogie

Je transfère les compétences. À la fin d'une mission, vous devez pouvoir maintenir et faire évoluer ce qu'on a construit ensemble. Chaque livrable est accompagné d'une documentation technique et d'une session de passation. Si l'équipe ne comprend pas comment fonctionne le système, la mission n'est pas terminée.

Pragmatisme

POC rapide, feedback loop court, livraison itérative. Pas de sur-ingénierie. Un pipeline qui fonctionne en production vaut mieux qu'une architecture parfaite sur le papier. J'utilise les outils adaptés au problème, pas les plus à la mode.