Des agents IA qui prennent le contrôle de ton ordinateur, ton téléphone et tes logiciels professionnels. Le tout en local, sans internet, et deux fois plus vite qu’avant.
UNE RÉVOLUTION DANS L'AUTOMATISATION PAR IA
En mars dernier, l’entreprise Hcompany sortait Holo3, un modèle d’intelligence artificielle capable de contrôler un ordinateur comme un humain. Les développeurs, les entreprises et les partenaires l’ont adopté immédiatement. Mais après quelques mois d’utilisation, une évidence s’est imposée : la performance seule ne suffit plus. Les utilisateurs veulent des agents IA qui fonctionnent partout, sur tous les appareils, et qui s’intègrent facilement aux Outils existants. C’est pour répondre à cette demande que Holo3.1 arrive aujourd’hui.
QUATRE NOUVEAUTÉS QUI CHANGENT TOUT
Holo3.1 n’est pas une simple mise à jour. C’est une refonte complète qui améliore la robustesse du modèle sur trois points cruciaux : l’environnement (web, ordinateur, téléphone), les frameworks d’agents (les outils qui font tourner ces IA) et les cibles de déploiement (cloud, local, mobile). Pour la première fois, Holo3.1 propose des versions optimisées pour tourner en local, même sur des appareils grand public. Trois formats de quantification sont disponibles : FP8, Q4 GGUF et NVFP4.
LE CONTRÔLE DES ORDINATEURS S'ÉTEND AUX TÉLÉPHONES
Holo3 était déjà capable de naviguer sur un site web ou d’utiliser un logiciel de bureau. Mais avec Holo3.1, les agents IA peuvent aussi automatiser des tâches sur smartphone Android. Sur la plateforme AndroidWorld, le modèle de 35 milliards de paramètres passe de 67 % à 79,3 % de réussite. Les versions plus petites (4 milliards et 9 milliards de paramètres) passent de 58 % à 72 %. Autrement dit, ces agents deviennent bien plus fiables pour gérer des apps mobiles.
UNE MEILLEURE COMPATIBILITÉ AVEC LES OUTILS EXTÉRIEURS
Les entreprises utilisent souvent des frameworks d’agents tiers pour faire fonctionner leurs IA. Holo3.1 intègre désormais un support natif des protocoles d’appel de fonctions, en plus des sorties structurées en JSON déjà disponibles dans Holo3. Résultat : les performances sont quasi identiques, que l’agent tourne dans un framework maison ou dans un outil externe. Sur les benchmarks internes couvrant des tâches comme l’e-commerce, les logiciels métiers ou la collaboration, Holo3.1 dépasse même Holo3 de plus de 25 % lorsqu’il est évalué dans le produit Holotab.
DES MODÈLES PLUS LÉGERS POUR UNE UTILISATION LOCALE
Pour faciliter le déploiement en local, Hcompany propose désormais des versions plus légères de ses modèles : 0,8 milliard, 4 milliards et 9 milliards de paramètres. Ces versions sont idéales pour une utilisation privée et économique, tandis que le modèle de 35 milliards de paramètres reste la référence pour les performances maximales. Une comparaison des coûts et des performances montre que la famille Holo3.1 offre un meilleur équilibre que la famille Qwen 3.5.
L'INFÉRENCE LOCALE : 2 FOIS PLUS RAPIDE QU'AVANT
Holo3.1 marque la première sortie de Hcompany avec des poids quantifiés. Trois formats sont disponibles pour le modèle de 35 milliards de paramètres : FP8, Q4 GGUF et NVFP4. Le format NVFP4 utilise la configuration W4A16 de l’outil NVIDIA Model Optimizer. Ces versions permettent une inférence locale ultra-rapide, sans perte significative de performance. Par exemple, FP8 et NVFP4 obtiennent les mêmes scores sur OSWorld que la version complète BF16, avec seulement deux points de différence.
DES PERFORMANCES QUI FONT LA DIFFÉRENCE
Les gains de vitesse sont impressionnants. Sur un DGX Spark, le format NVFP4 W4A16 offre 1,41 fois plus de débit de tokens que FP8, et 1,74 fois plus que BF16. Autrement dit, l’agent traite les commandes deux fois plus vite. Sur un DGX Spark, le temps moyen par étape passe de 6,8 secondes à 3,3 secondes, soit une amélioration de 2 fois.
LES AGENTS QUI FONCTIONNENT SUR TON ORDINATEUR PERSONNEL
Hcompany propose aussi des versions Q4 GGUF spécialement conçues pour tourner en local sur un ordinateur Windows ou Mac. L’agent s’exécute directement sur la machine, tandis que le modèle peut tourner soit sur la même machine (y compris sur des puces Apple Silicon), soit sur un DGX Spark du même réseau. Dans les deux cas, tout reste privé et local : aucune donnée ne quitte le réseau de l’utilisateur.
UNE OPTIMISATION QUI ACCÉLÈRE ENCORE LES PERFORMANCES
Les optimisations apportées au harness (l’outil qui fait tourner l’agent) en collaboration avec NVIDIA permettent d’obtenir un gain global de 2 fois la vitesse par rapport à la version FP8. Grâce à la quantification NVFP4, le temps moyen par étape est divisé par deux, passant de 6,8 secondes à 3,3 secondes. Ces améliorations seront intégrées dans une prochaine version du harness desktop.
QUATRE TAILLES DE MODÈLES POUR TOUS LES BESOINS
La famille Holo3.1 est disponible en quatre tailles : 0,8 milliard, 4 milliards, 9 milliards et 35 milliards de paramètres. Chaque version est optimisée pour des usages spécifiques, du déploiement local économique au contrôle haute performance des logiciels professionnels.
DES VERSIONS OPTIMISÉES POUR LE LOCAL ET L'EDGE
En plus des modèles complets, Hcompany publie des versions optimisées pour le local et les appareils connectés : FP8, NVFP4 et Q4 GGUF. Ces formats permettent de faire tourner les agents IA même sur des appareils modestes, sans avoir besoin d’une connexion internet.
COMMENT DÉBUTER AVEC Holo3.1 ?
Pour tester Holo3.1, deux options s’offrent à toi. D’abord, via l’API des modèles Holo sur le site hcompany.ai. Ensuite, sur Hugging Face, où la collection Holo3.1 est disponible. Les développeurs sont invités à explorer ces ressources et à construire leurs propres applications avec cette nouvelle génération d’agents IA.
UNE NOUVELLE ÈRE POUR LES AGENTS INFORMATIQUES
Holo3.1 marque un tournant dans l’automatisation par IA. Pour la première fois, des agents IA peuvent contrôler un ordinateur, un téléphone ou un logiciel professionnel, le tout en local, sans dépendre du cloud. Avec des performances améliorées, une compatibilité élargie et des modèles optimisés pour le local, Holo3.1 ouvre la voie à une nouvelle génération d’outils intelligents. Les développeurs et les entreprises ont désormais entre leurs mains une technologie capable de s’adapter à tous leurs besoins, où qu’ils soient.
CE QUE ÇA CHANGE POUR TOI
Imagine un agent IA qui gère tes tâches répétitives sur ton ordinateur ou ton téléphone, sans avoir besoin d’internet. Imagine aussi un outil qui s’intègre parfaitement à tes logiciels existants, que ce soit pour automatiser des processus métiers ou pour simplifier ton quotidien. Holo3.1 rend tout cela possible. Et avec des versions légères et rapides, même un PC ou un Mac grand public peut faire tourner ces agents sans problème. L’automatisation par IA n’a jamais été aussi accessible.
EN BREF
Holo3.1 est une mise à jour majeure qui transforme la façon dont les agents IA contrôlent les ordinateurs. Voici ce qu’il faut retenir :
- Des performances améliorées sur mobile, avec jusqu’à 79,3 % de réussite sur AndroidWorld.
- Une compatibilité accrue avec les frameworks d’agents externes.
- Des modèles optimisés pour le local, avec des gains de vitesse de 2 fois.
- Quatre tailles de modèles pour tous les besoins, du plus léger au plus puissant.
- Des versions quantifiées (FP8, Q4 GGUF, NVFP4) pour une inférence rapide et privée.
- Hugging Face Blog
L'indépendance de CLODCO est votre garantie.
Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.
Soutenir CLODCO

