Mellum2 : le nouveau modèle IA qui va booster tes outils de code et de texte

JetBrains dévoile Mellum2, un modèle Mixture-of-Experts de 12 milliards de paramètres conçu pour accélérer les tâches de texte et de code sans sacrifier la performance.

UN MODÈLE QUI PART D'UNE BASE DE CODE POUR ALLER PLUS LOIN

JetBrains présente Mellum2, un modèle open source Mixture-of-Experts optimisé pour les charges de travail combinant texte et code. À l'origine, Mellum était conçu uniquement pour la complétion de code. Avec Mellum2, l'équipe étend ses capacités à un éventail plus large de tâches en langage naturel et en ingénierie logicielle, tout en conservant une inférence ultra-rapide et une facilité de déploiement.

POURQUOI CE MODÈLE EST UNE RÉVOLUTION POUR LES SYSTÈMES D'IA MODERNES

Les systèmes d'IA actuels enchaînent souvent plusieurs appels de modèles : routage, Recherche, résumé, planification, validation ou encore utilisation d'outils. Beaucoup de ces opérations sont sensibles au temps de réponse et n'ont pas besoin du plus grand modèle disponible. Mellum2 cible précisément ces cas d'usage où la rapidité est cruciale.

Mellum2 est conçu pour les tâches fréquentes et gourmandes en latence, là où les modèles géants sont souvent surdimensionnés.

DES PERFORMANCES QUI PARLENT D'ELLES-MÊMES

Dans son rapport technique, l'équipe évalue Mellum2 sur plusieurs benchmarks couvrant la génération de code, le raisonnement, les sciences et les mathématiques. Résultat : Mellum2 rivalise avec les modèles open source de taille similaire, tout en offrant une inférence plus de deux fois plus rapide. Cette performance le rend idéal pour les charges de travail en production à haut débit.

COMMENT FONCTIONNE CETTE ARCHITECTURE INNOVANTE ?

Mellum2 repose sur une architecture Mixture-of-Experts. Imagine un orchestre où seuls quelques musiciens jouent à la fois : c'est exactement le principe. Le modèle conserve une grande capacité totale, mais n'active qu'un sous-ensemble de ses paramètres pour chaque token (unité de texte ou de code). Cela rend l'inférence plus efficace et réduit les coûts de serveurs pour les applications en temps réel.

Contrairement à d'autres modèles, Mellum2 se concentre uniquement sur le texte et le code. Cette spécialisation le rend plus compact et efficace pour les tâches d'ingénierie logicielle.

QUATRE CAS D'USAGE CONCRETS POUR TON PROJET

Routage et orchestration : Mellum2 excelle comme modèle léger pour le routage et l'orchestration dans les systèmes multi-modèles. Il peut gérer la classification des prompts, la sélection d'outils ou les étapes intermédiaires de contrôle de flux.

Pipelines RAG : Le modèle est parfait pour les pipelines de recherche sensibles à la latence, comme la compression de contexte, la génération de résumés ou le post-traitement des résultats de recherche.

Sous-agents : Mellum2 peut être utilisé pour des sous-tâches d'agents, comme la planification, la validation, la transformation ou la préparation de contexte. Cela réduit le besoin d'invoquer des modèles plus grands pour les opérations intermédiaires.

Déploiement privé : Parce que Mellum2 est open source et efficace à servir, il peut être déployé dans des environnements auto-hébergés, même avec du code propriétaire ou des données internes.

POURQUOI LES MODÈLES BIEN CIBLÉS SONT L'AVENIR

À mesure que les systèmes d'IA mûrissent, les architectures les plus efficaces deviennent moins monolithiques. Un seul modèle géant peut être puissant, mais les systèmes de production ont souvent besoin de plusieurs composants spécialisés travaillant ensemble : des modules de recherche, des routeurs, des modèles conscients du code, des validateurs, des appelants d'outils ou encore des modèles de raisonnement avancé.

Mellum2 se positionne comme un modèle focal : rapide, bien ciblé et optimisé pour les tâches fréquentes au cœur des grands systèmes d'IA. Son objectif n'est pas de remplacer tous les modèles de la pile technologique, mais de la rendre plus rapide, moins chère et plus facile à contrôler.

Mellum2 ne cherche pas à tout faire, mais à faire mieux ce qu'il fait déjà : les tâches répétitives et critiques.

COMMENT DÉBUTER AVEC MELLUM2 ?

Si tu construis des systèmes d'IA pour l'ingénierie logicielle — que ce soit dans un IDE, dans un pipeline RAG, dans un workflow d'agent ou sur une infrastructure privée — Mellum2 est prêt à être testé dès maintenant.

EN BREF : CE QU'IL FAUT RETENIR

JetBrains dévoile Mellum2, un modèle Mixture-of-Experts de 12 milliards de paramètres optimisé pour les tâches de texte et de code. Il offre une inférence deux fois plus rapide que les modèles similaires, tout en restant compétitif en performance. Son architecture spécialisée et son approche ciblée en font un outil idéal pour les systèmes d'IA modernes, où la rapidité et l'efficacité sont essentielles.

Sources :

Hugging Face Blog

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO