Ingénierie d'IA · 100 % local · Apple Silicon

Je conçois des écosystèmes d'IA qui tournent entièrement sur votre machine.

Infrastructure d'inférence LLM multi-modèles consciente des ressources, abstractions réutilisables, et assurance qualité spécifique aux systèmes IA — zéro cloud, zéro télémétrie.

MLXRAGAgents ReActasyncioLLMOps
klody-core · gateway :8090 ● live

Simulation : routage de requêtes, budget RAM 90 Go, éviction LRU. Cliquez un organe.

0commits
0tests au vert
0apps en prod
0chunks indexés
0dépendance cloud

La vision

L'IA doit vous appartenir. Localement.

En cinq semaines, j'ai conçu et mis en production un écosystème d'intelligence artificielle entièrement local : cinq applications spécialisées — RAG documentaire, agent de code, synthèse vocale, génération musicale, dashboard desktop — puis, surtout, le plan de contrôle qui les unifie : Klody Core.

Le constat fondateur : cinq excellents organes, mais sans système nerveux. Chacun chargeait ses propres modèles, gérait sa propre mémoire — ~208 Go de poids redondants en RAM. La décision d'architecte ne fut pas d'écrire une 6ᵉ app, mais de construire l'infrastructure qui valorise tout l'existant.

  • 01

    Souveraineté

    Zéro cloud, zéro télémétrie, bind loopback imposé. Vos données ne quittent jamais la machine.

  • 02

    Mutualisation

    Un gateway conscient de la RAM partage des modèles de dizaines de Go entre toutes les apps, sous un budget unique.

  • 03

    Maturité

    Services supervisés, éval qualité nocturne, abstractions réutilisables. De l'ingénierie, pas du prototype.

Savoir-faire

Des compétences, prouvées par le code.

Chaque signal est mappé à une compétence reconnaissable et à un niveau, étayé par l'historique réel.

Créations

Un écosystème, huit organes.

Du plan de contrôle aux applications spécialisées — tout local, tout en production ou en chantier actif.

Démo live

Le gateway, en mouvement.

Pilotez la simulation : envoyez des requêtes, réservez de la RAM pour l'audio, observez l'éviction LRU décider quel modèle décharger.

klody-core · scheduler RAM-aware ● live

Déclencher une requête

Méthodes

Comment je travaille.

Contact

Parlons d'IA locale.

Recruteur, CTO, pair curieux ? Le portfolio technique complet est téléchargeable. Dépôts privés — démo sur demande.

  • LocalisationRennes, Bretagne
  • SpécialitéInfra d'IA locale · LLMOps Apple Silicon