Gemini 3.5 Flash : l'IA qui va enfin rendre les agents utiles ?

Google lance Gemini 3.5 Flash, un modèle d'IA qui promet d'accélérer les agents autonomes tout en réduisant les coûts. Une révolution pour les workflows complexes ?

UNE ÉVOLUTION MAJEURE EN UNE ANNÉE

Lors de la conférence I/O de l'année dernière, Google parlait encore de la branche 2.5 de Gemini. Un an plus tard, le paysage a radicalement changé : les versions 3.0, 3.1 et désormais 3.5 se succèdent à un rythme effréné. Aujourd'hui, Google déploie Gemini 3.5 Flash dans une large gamme de ses produits, et l'entreprise clame haut et fort que ce nouveau modèle dépasse même son prédécesseur Pro en termes de performances.

Cette accélération des mises à jour n'est pas un hasard. Depuis un an, Google suit une stratégie de mises à jour régulières, mais cette version 3.5 Flash se distingue particulièrement. Selon Tulsee Doshi, directrice senior de la gestion des produits pour Gemini, les innovations de ce modèle sont intégrées dans plusieurs produits Google, et ce n'est que le début.

« Le modèle 3.5 Flash offre une intelligence de pointe tout en étant suffisamment efficace pour rendre enfin viables les tâches complexes des agents à grande échelle. »

POURQUOI L'EFFICACITÉ EST CRUCIALE POUR LES AGENTS IA

L'intelligence artificielle générative est aujourd'hui un gouffre financier : tous les acteurs majeurs du secteur cherchent désespérément des moyens d'améliorer leur efficacité. Le problème devient encore plus criant lorsqu'il s'agit de construire des expériences agentiques, ces systèmes qui doivent fonctionner sur de longues durées pour accomplir des tâches complexes. C'est précisément là que Gemini 3.5 Flash pourrait faire la différence.

Ce nouveau modèle est capable de produire près de 300 tokens par seconde, un rythme impressionnant. Pourtant, ses scores sur les benchmarks restent comparables à ceux de modèles frontaliers plus imposants, comme le 3.1 Pro, qui génèrent leurs réponses à un quart de cette vitesse. Autrement dit, Gemini 3.5 Flash combine vitesse et qualité, un duo rare dans le monde de l'IA.

Selon Doshi, l'équipe a apporté de nombreuses améliorations lors de la phase de pré-entraînement du modèle. Mais c'est surtout les retours des développeurs qui ont permis de peaufiner Gemini 3.5 Flash. « Grâce à l'entraînement postérieur, nous commençons vraiment à exploiter la valeur des feedbacks que nous recevons des utilisateurs, par exemple via Antigravity », explique-t-elle. Ces retours se traduisent directement dans les performances du modèle, notamment en Génération de code et en utilisation d'outils.

« L'objectif est de voir une progression constante où le modèle 3.5 Pro sera encore meilleur, et où le prochain modèle Flash atteindra les performances du Pro de sa série. »

GÉNÉRATION DE CODE : UNE PRIORITÉ POUR LES AGENTS

Google a placé la génération de code au cœur de ses ambitions avec ce nouveau modèle. Deux tests majeurs, Terminal Bench et SWE-Bench Pro, révèlent des améliorations substantielles. Le modèle 3.5 Flash écrase littéralement les anciennes versions Flash et affiche une légère mais mesurable progression par rapport au Gemini 3.1 Pro. Ses performances se situent dans la même fourchette que celles du GPT 5.5 d'OpenAI, un modèle pourtant bien plus lourd et coûteux.

Un autre défi majeur dans les workflows agentiques réside dans la capacité des modèles génératifs à interagir avec des interfaces conçues pour les humains. Ce n'est pas une mince affaire, comme l'admet Doshi : « Certaines actions, comme le contrôle d'une interface utilisateur, sont coûteuses car le modèle doit parcourir la page, savoir où cliquer et enchaîner plusieurs étapes. Je pense que Flash parvient à le faire grâce à cette combinaison de qualité et de coût réduit. »

Les évaluations internes de Google confirment ces progrès. Parmi les benchmarks utilisés, OSWorld-Verified teste la capacité des modèles à gérer des tâches générales dans des environnements informatiques réels. Comme pour la génération de code, Gemini 3.5 Flash surpasse largement les anciennes versions Flash et se montre même légèrement plus rapide que le Gemini 3.1 Pro. Ses performances sont globalement équivalentes à celles du GPT 5.5.

DES MÉTRIQUES INTERNES QUI PARLENT D'ELLES-MÊMES

Google a déjà déployé Gemini 3.5 Flash en interne pour tester ses performances. Doshi révèle que les résultats sont spectaculaires : « Nous avons un ensemble de métriques internes qui mesurent comment les Googlers codent, en analysant nos propres bases de code et en évaluant les performances des modèles. On observe un bond massif entre les performances du 3.1 Pro et celles du 3.5 Flash. »

L'année dernière, Google avait présenté Antigravity, un environnement de développement intégré (IDE) qui évolue aujourd'hui vers sa version 2.0 avec le support de Gemini 3.5 Flash. Cette mise à jour permettra de prendre en charge plusieurs workflows parallèles, en générant des sous-agents à partir du modèle principal. Google insiste sur le fait que cette avancée n'est possible que grâce à l'efficacité du nouveau modèle, capable de produire des tokens à un rythme soutenu.

En plus d'Antigravity, Gemini 3.5 Flash sera disponible dans l'application Gemini, via l'API, dans AI Studio, Android Studio et tous les produits enterprise de Google. Quant à la variante Pro, Google indique qu'elle est déjà en phase de test interne et devrait être prête pour une sortie le mois prochain.

LES AGENTS IA : DEVENIR LA NOUVELLE STAR DU JARGON TECH

Les entreprises abandonnent progressivement le mot « IA » comme principal argument marketing pour lui préférer le terme « agents ». Avec Gemini Spark, Google propose son premier agent dédié aux utilisateurs. Spark fonctionne 24 heures sur 24 dans le cloud de Google, ce qui signifie qu'il n'utilise aucune ressource de votre appareil et n'est pas lié à un navigateur ou un onglet spécifique. À la place, il s'intègre à l'ensemble de votre écosystème Google, utilisant Gemini Flash 3.5 pour exécuter plusieurs workflows agentiques selon vos commandes.

Mais au fait, qu'est-ce qu'un agent IA ? Tulsee Doshi l'explique simplement : « Je considère les agents comme la combinaison d'un modèle et d'une interface logicielle qui permet d'agir en votre nom. »

Avec Spark, vous pouvez donner des instructions à l'IA, et elle s'occupe de la tâche à votre place. Cela peut s'étaler dans le temps, l'agent récupérant des informations dans vos fichiers Drive, vos emails et bien plus. Vous pourriez lui demander de surveiller certains emails pour les intégrer dans des synthèses quotidiennes, ou de suivre vos réunions pour générer des comptes-rendus et des listes d'actions. Spark peut également vous envoyer des notifications ou vous poser des questions de suivi pour mieux répondre à vos besoins. Google précise qu'il est conçu pour demander votre validation avant d'entreprendre des « actions à haut risque ».

DES EXEMPLES CONCRETS D'UTILISATION DE SPARK

Doshi, qui a utilisé Gemini Spark quotidiennement lors des tests internes ces dernières semaines, partage deux exemples concrets. Avant la conférence I/O, elle a utilisé Spark pour compiler des évaluations et des statistiques sur le modèle 3.5 Flash afin de créer une présentation pour la direction de Google. « Le résultat était magnifique, bien meilleur et bien plus rapide que ce que j'aurais pu faire moi-même », confie-t-elle.

Sur le plan personnel, elle a créé un agent qui suit les étapes de développement de son nouveau-né. L'agent fournit des insights sur les données et suggère d'autres métriques à surveiller. « Je traite mon enfant comme un modèle d'IA », plaisante-t-elle. « Je m'en rends compte, mais c'est vraiment utile. »

Certains pourraient être réticents à l'idée de confier autant de données personnelles à un modèle d'IA fonctionnant dans le cloud de Google. Pourtant, les mentalités pourraient évoluer si ces outils deviennent véritablement utiles. Nombre des façons dont les gens partagent leurs données avec Google aujourd'hui auraient été impensables il y a 10 ou 15 ans.

Spark sera déployé pour les abonnés AI Ultra à partir de la semaine prochaine. Google a introduit une nouvelle tranche Ultra, offrant un accès aux dernières fonctionnalités pour 100 dollars par mois. Bien que ce tarif reste astronomique pour la plupart des outils d'IA, la tranche à 200 dollars par mois (50 dollars de moins qu'avant) existe toujours pour ceux qui souhaitent des limites de tokens plus élevées. Google prévoit à terme de déployer Spark pour tous les utilisateurs, même ceux qui ne paient pas pour Gemini.

VEO 3 : UN MODÈLE VIDÉO QUI A FAIT PARLER DE LUI

L'année dernière, lors de l'I/O, Google avait présenté Veo 3, un modèle de génération vidéo jugé exceptionnellement performant. Cette année, un nouveau venu fait son apparition : Gemini Omni Flash. Ce modèle remplacera Veo dans des applications comme l'application Gemini, YouTube et Flow. Google affirme qu'Omni a été conçu pour être véritablement multimodal, capable d'accepter n'importe quel type de données en entrée et de produire ce que vous souhaitez : images, texte, vidéo ou audio.

Pour l'instant, le modèle se concentre uniquement sur la vidéo, d'où son remplacement de Veo. Bien qu'il soit similaire aux nouveaux modèles Gemini 3.5, Omni Flash n'en fait pas explicitement partie. Il s'agit d'une initiative unique chez Google, qui pourrait représenter une nouvelle direction pour les produits d'IA de l'entreprise. « La vision pour Gemini a toujours été d'être multimodal en entrée et en sortie », explique Doshi. « Omni est une étape vers cette vision. »

VERS UN MODÈLE UNIFIÉ POUR TOUTES LES TÂCHES

Actuellement, pour obtenir un résultat spécifique, il faut se connecter au bon modèle. Pour les images, Google redirige votre requête vers Nano Banana. Pour la musique, votre entrée est envoyée à Lyria. Les développeurs doivent donc intégrer la bonne API, et tous les modèles ne sont pas disponibles dans tous les outils. L'avenir pourrait voir tout passer par un modèle unifié comme Omni, mais nous n'en sommes qu'au début, et l'équipe Gemini n'est pas encore sûre de la direction que prendra Omni.

Les prochains mois seront décisifs alors que Google envisage d'ouvrir le modèle Omni à davantage de types de sorties pour évaluer ses performances par rapport aux autres modèles de l'entreprise. « Nous pourrions découvrir que certains cas d'usage bénéficient vraiment de modèles personnalisés et spécialisés », précise Doshi. « Il n'est pas encore prouvé que dans les prochains mois, nous puissions tout regrouper dans une seule expérience. »

La première version d'Omni est un modèle Flash, donc plus léger que les modèles frontaliers Pro. Google prévoit néanmoins de sortir un modèle Omni Pro à un moment donné, bien qu'aucun calendrier ne soit encore annoncé. Si la multimodalité d'Omni se concrétise, ces modèles pourraient éventuellement servir de base aux futures versions de Gemini, simplifiant ainsi l'écosystème d'IA de Google.

« La multimodalité intégrée pourrait simplifier l'expérience utilisateur en réduisant la fragmentation des modèles. »

Sources :

Ars Technica

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO