// IMPORTATION CONTEXTE : GLISSEZ VOS DOCUMENTS ICI //
Vous êtes connecté à une instance d'intelligence artificielle 100% souveraine.
TÉLÉCHARGEMENT0%
Préparation des synapses artificielles...
// CONFIGURATION DU CORTEX
Le modèle s'exécute à 100% sur votre carte graphique en utilisant l'API standard WebGPU. Le premier lancement téléchargera le modèle (compressé) et le stockera localement dans le cache de votre navigateur. Les lancements suivants seront instantanés et hors ligne.
Calcul de l'espace utilisé...
⚠️ Note : WebGPU nécessite un navigateur récent (Chrome, Edge ou Opera v113+, Arc, Safari v18+) et un GPU dédié ou performant.
Branchez monia.chat sur une instance Ollama qui tourne sur votre propre machine (ou votre LAN). Aucune donnée ne sort de chez vous : le navigateur cause directement avec votre serveur local via son endpoint OpenAI-compatible /v1/chat/completions.
Par défaut : http://localhost:11434. Sur LAN : http://192.168.x.x:11434.
Doit être déjà ollama pull-é. Ex. : llama3.2, qwen2.5, mistral, deepseek-r1.
⚠️ Note : Ollama doit être lancé (ollama serve) avec OLLAMA_ORIGINS="*" ou au moins https://monia.chat pour autoriser le CORS depuis le navigateur.
Si votre machine ne dispose pas d'un GPU compatible ou si vous préférez économiser votre batterie, utilisez vos clés API personnelles. Aucune donnée ne passe par nos serveurs : les appels transitent en direct de votre navigateur aux endpoints officiels.