Créez votre propre assistant de code IA en local avec Gemma 4 : guide pas à pas

Un assistant de code IA qui tourne entièrement en local, c’est possible. Voici comment installer Gemma 4 et OpenCode sur votre machine.

INSTALLER OLLAMA SUR WINDOWS OU LINUX

Pour faire tourner une intelligence artificielle en local, il faut d’abord installer un outil capable de gérer les modèles. Ollama est ce logiciel : il télécharge, exécute et sert les modèles directement sur votre ordinateur. Une fois installé, Ollama crée un serveur local que d’autres Outils comme OpenCode pourront utiliser.

Ollama agit comme un serveur personnel pour vos modèles d’IA, sans avoir besoin de passer par le cloud.

Sur Windows, trois méthodes sont possibles. La plus simple : télécharger l’installateur officiel depuis https://ollama.com/download. Une fois installé, Ollama apparaît dans le menu Démarrer et tourne en arrière-plan, visible par son icône dans la barre des tâches.

Pour les utilisateurs avancés, Ollama peut aussi s’installer via PowerShell avec la commande :

winget install Ollama.Ollama

Sur Linux, une seule ligne suffit dans le terminal :

curl ‒fsSL https://ollama.com/install.sh | sh

Une fois l’installation terminée, vérifiez que tout fonctionne en tapant :

ollama --version

Si le terminal affiche un numéro de version, Ollama est prêt à l’emploi.

TÉLÉCHARGER LE MODÈLE GEMMA 4 EN LOCAL

Gemma 4 est un modèle de langage développé par Google, sorti le 2 avril 2026. Il est spécialement conçu pour le raisonnement, la programmation, la compréhension multimodale et les tâches automatisées. Pour un usage sur ordinateur portable, Google propose des versions allégées appelées E2B et E4B, optimisées pour fonctionner avec peu de ressources.

Dans Ollama, la lettre E signifie « paramètres effectifs ». Le modèle E4B offre plus de capacités, mais demande un peu plus de puissance. Pour le télécharger, utilisez la commande suivante dans un terminal :

ollama pull gemma4:e4b

Sur mon ordinateur équipé d’un processeur Intel i7-13800H, 32 Go de RAM et une carte graphique NVIDIA RTX 2000 Ada avec 8 Go de VRAM, le téléchargement a pris environ 10 minutes. Le modèle pèse 9,6 Go une fois installé. Si votre machine est moins puissante, vous pouvez opter pour la version E2B, plus légère.

Gemma 4 E4B est un modèle quantifié sur 4 bits, au format GGUF, avec une fenêtre de contexte de 128 000 tokens.

Pour vérifier que le modèle est bien installé, tapez :

ollama list

Vous devriez voir apparaître :

gemma4:e4b    9.6 GB

Avant de passer à l’étape suivante, testez le modèle avec une question simple :

ollama run gemma4:e4b "what's the capital of France?"

Si la réponse est « Paris », alors Gemma 4 est prêt à être utilisé en local. Attention, le premier appel peut être lent car Ollama doit charger le modèle en mémoire. Une fois le modèle « réchauffé », les réponses deviennent plus rapides.

INSTALLER NODE.JS POUR UTILISER OPENCODE

OpenCode est un assistant de code qui fonctionne comme un agent capable d’analyser des fichiers, d’exécuter des commandes et d’automatiser des tâches dans un projet. Contrairement à d’autres outils, OpenCode est open source et peut se connecter à n’importe quel modèle, qu’il soit en local ou dans le cloud.

Pour installer OpenCode, il faut d’abord Node.js, un environnement d’exécution JavaScript. Sur Windows, tapez dans PowerShell :

winget install OpenJS.NodeJS.LTS

Sur Linux, utilisez les commandes suivantes :

sudo apt update
sudo apt install -y nodejs npm

Vérifiez que Node.js et npm sont bien installés :

node --version
npm --version

Une fois Node.js en place, installez OpenCode avec :

npm install -g opencode-ai

Pour confirmer que tout fonctionne, tapez :

opencode --version

OpenCode est maintenant installé. Vous pouvez le lancer depuis n’importe quel dossier de projet en tapant simplement :

opencode

CONNECTER OPENCODE À GEMMA 4 AVEC UNE FENÊTRE DE CONTEXTE ÉTENDUE

Par défaut, OpenCode ne sait pas quel modèle utiliser. Il faut donc lui indiquer où se trouve Gemma 4, hébergé par Ollama. Pour cela, il faut créer un fichier de configuration qui définit la fenêtre de contexte du modèle. Une fenêtre de contexte étendue permet à l’agent de travailler sur des projets plus complexes sans perdre le fil.

Créez un fichier nommé gemma4-e4b-128k.Modelfile dans le dossier de votre projet, avec le contenu suivant :

FROM gemma4:e4b
PARAMETER num_ctx 131072

Cette commande ne télécharge pas un nouveau modèle. Elle crée simplement un profil Ollama qui utilise le même Gemma 4 E4B, mais avec une fenêtre de contexte de 128 000 tokens au lieu de la valeur par défaut. Pour activer ce profil, tapez :

ollama create gemma4:e4b-128k -f gemma4-e4b-128k.Modelfile

Ensuite, il faut configurer OpenCode pour qu’il utilise ce modèle local. Créez un fichier opencode.json dans le même dossier, avec le contenu suivant :

{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "ollama": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "Ollama (local)",
      "options": {
        "baseURL": "http://localhost:11434/v1"
      },
      "models": {
        "gemma4:e4b-128k": {
          "name": "Gemma 4 E4B 128K"
        }
      }
    }
  },
  "model": "ollama/gemma4:e4b-128k"
}

Deux éléments clés à retenir :

OpenCode communique avec Ollama via un endpoint compatible OpenAI local : http://localhost:11434/v1.
Le nom du modèle est défini selon le format ollama/gemma4:e4b-128k, qui correspond au profil créé précédemment.

LANCER OPENCODE ET TESTER L'ASSISTANT

Une fois la configuration terminée, lancez OpenCode depuis le dossier de votre projet en tapant :

opencode

L’interface en ligne de commande (TUI) s’ouvre. Vous pouvez maintenant tester votre assistant en lui demandant d’effectuer des tâches simples ou complexes. Par exemple :

Écrire un fichier README pour un projet.
Expliquer le fonctionnement d’une fonction spécifique.
Créer des scripts de test automatisés.

Mais OpenCode ne se limite pas au code. Il peut aussi manipuler des fichiers, extraire du contenu ou automatiser des tâches dans votre espace de travail. Par exemple, pour résumer un dépôt entier, tapez :

opencode run "Summarize this repository."

OpenCode peut aussi s’utiliser en mode serveur, ce qui permet de l’intégrer à d’autres outils ou scripts. Et surtout, tout reste en local : vos données, votre code et vos échanges avec l’IA ne quittent jamais votre machine.

Avec cette configuration, vous avez un assistant de code IA entièrement local, respectueux de la vie privée et sans dépendance au cloud.

POUR ALLER PLUS LOIN : PERSONNALISER ET ÉTENDRE OPENCODE

OpenCode est conçu pour évoluer. Vous pouvez ajouter des outils supplémentaires, installer des compétences spécifiques via un fichier SKILL.md, ou même créer des agents spécialisés avec un fichier AGENTS.md. Ces fichiers permettent de définir des comportements personnalisés pour des tâches récurrentes.

Par exemple, si vous travaillez souvent sur des projets Python, vous pouvez configurer OpenCode pour qu’il exécute automatiquement les tests unitaires ou génère une documentation au format Sphinx. Tout cela reste en local, sans jamais envoyer de données vers l’extérieur.

Autre avantage : vous pouvez adapter les performances en fonction de votre matériel. Si Gemma 4 E4B est trop lent sur votre machine, essayez la version E2B, plus légère. Vous pouvez aussi ajuster la fenêtre de contexte dans le fichier .Modelfile si vous travaillez sur des projets très volumineux.

POURQUOI CHOISIR UN ASSISTANT IA LOCAL ?

Utiliser un assistant de code en local présente plusieurs avantages majeurs. D’abord, le contrôle des coûts : pas de frais d’abonnement à des services cloud, pas de facture surprise. Ensuite, la confidentialité : votre code, vos données et vos idées restent sur votre machine, sans risque de fuite ou d’espionnage industriel.

Enfin, c’est l’occasion de comprendre comment fonctionne un agent IA. En installant chaque composant soi-même, on découvre les rouages techniques : comment un modèle est téléchargé, comment il est servi par Ollama, comment OpenCode dialogue avec lui via une API locale. Une expérience éducative et pratique.

Cette configuration est idéale pour les développeurs qui veulent expérimenter, pour les entreprises soucieuses de confidentialité, ou simplement pour ceux qui préfèrent garder le contrôle sur leurs outils.

LES LIMITES À CONNAÎTRE

Même si Gemma 4 E4B est un modèle performant, il reste moins puissant que les versions cloud les plus avancées. La fenêtre de contexte de 128 000 tokens est déjà très large, mais elle peut être insuffisante pour certains projets extrêmement complexes. Dans ce cas, il faudra soit réduire la taille du projet, soit opter pour un modèle plus lourd (comme la version complète de Gemma 4), mais cela demandera une machine plus puissante.

Autre point important : la première utilisation peut être lente, surtout si votre ordinateur n’a pas de carte graphique dédiée. Ollama doit charger le modèle en mémoire, ce qui prend du temps et de la RAM. Une fois le modèle « réchauffé », les réponses deviennent plus fluides.

Enfin, OpenCode est un outil en ligne de commande. Si vous préférez une interface graphique, il faudra soit vous habituer à la TUI, soit chercher un wrapper graphique tiers (mais cela sort du cadre de ce guide).

UNE SOLUTION POUR LES DÉVELOPPEURS SOUCIEUX DE LEURS DONNÉES

En résumé, cette configuration permet de créer un assistant de code IA entièrement local, basé sur Gemma 4 et OpenCode. C’est une solution idéale pour les développeurs qui veulent garder le contrôle sur leurs outils, éviter les coûts récurrents du cloud, et protéger leurs données sensibles.

Le guide étape par étape ci-dessus couvre l’installation d’Ollama, le téléchargement du modèle Gemma 4 E4B, la configuration d’OpenCode et la connexion des deux outils. Une fois en place, l’assistant peut analyser des projets, écrire du code, générer de la documentation et automatiser des tâches, le tout sans jamais quitter votre machine.

Pour les développeurs curieux, c’est aussi une excellente façon de comprendre comment fonctionnent les agents IA et les modèles de langage en local. Et pour les autres, c’est une alternative concrète aux solutions cloud, avec tous les avantages de la confidentialité et de l’autonomie.

Votre code, vos données, votre IA : tout reste entre vos mains.

Sources :

Towards Data Science

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO