Decart lance Oasis 3, un modèle de monde virtuel capable de simuler des heures de conduite réaliste en temps réel. Accessible via API, il cible d'abord les développeurs de voitures autonomes… mais cache quelques défauts majeurs.
UN OUTIL QUI VEUT BOULEVERSER LES SIMULATIONS DE CONDUITE
La startup Decart vient de lancer Oasis 3, un modèle de monde virtuel capable de générer des environnements de conduite ultra-réalistes en temps réel. Contrairement aux démonstrations limitées proposées par d’autres acteurs, cet outil permet aux développeurs de créer des scénarios à l’infini, une fonctionnalité idéale pour tester des situations rares dans le domaine des voitures autonomes. Mais le vrai pari de Decart ne se limite pas aux constructeurs automobiles : l’entreprise mise tout sur les développeurs, en leur offrant un accès immédiat via API, à l’image de ce qu’OpenAI a fait avec les modèles de langage.
« Ce sera le premier modèle de monde utilisable sur lequel les gens pourront vraiment programmer », déclare Dean Leitersdorf, cofondateur et PDG de Decart. « Je pense qu’une communauté entière de développeurs va émerger autour de cette technologie. »
Cette annonce intervient quelques semaines après que Decart, âgée de seulement deux ans, a levé 300 millions de dollars. Cette levée de fonds, qui porte la valorisation de l’entreprise à près de 4 milliards de dollars, a attiré des investisseurs stratégiques comme Toyota, Adobe et eBay. Nvidia, déjà actionnaire, a également participé à ce tour de table. Tous ces géants pourraient devenir des clients potentiels, selon Leitersdorf.
UNE COMMUNAUTÉ DE DÉVELOPPEURS DÉJÀ EN PLACE
Decart ne part pas de zéro : l’entreprise dispose déjà d’une communauté de plus de 100 000 développeurs. La plupart d’entre eux utilisent son modèle vidéo en temps réel Lucy, principalement dans les domaines du e-commerce et du streaming en direct. Oasis 3 s’appuie sur ce modèle de base et marque l’entrée de Decart dans le domaine de l’IA physique. L’accès à l’API coûte 0,02 dollar par seconde, tandis que les tarifs pour les entreprises dépendent des cas d’usage.
Decart évolue dans un secteur de plus en plus concurrentiel. L’année dernière, Google a lancé Genie 3 en version Recherche, World Labs (fondé par Fei-Fei Li) a commercialisé Marble, et des startups comme Luma et Runway transforment leurs modèles vidéo en modèles de monde. Oasis 3 se distingue par son réalisme photo et sa capacité à générer des environnements à l’infini.
POURQUOI OASIS 3 EST PLUS PERFORMANT QUE SES CONCURRENTS ?
Le principal avantage d’Oasis 3 réside dans son efficacité et son réalisme. Decart a développé un outil appelé DOS (Decart Optimization Stack), qui permet d’exécuter ses modèles sur du matériel Nvidia, Amazon et Google de manière optimisée. Résultat : ses modèles coûtent dix fois moins cher à faire tourner que ceux de ses concurrents.
« Tout est construit sur notre pile temps réel, que nous optimisons jusqu’au matériel », explique Leitersdorf. « Grâce à cette intégration verticale, nous sommes capables de proposer des coûts d’exécution dix fois inférieurs à ceux de l’industrie. »
Selon lui, Decart a brûlé moins de 100 millions de dollars en coûts de calcul depuis sa création, un chiffre qui témoigne de l’efficacité de sa technologie. Le modèle génère des environnements multi-caméras (une caméra avant et deux caméras latérales) pour l’entraînement et les tests, avec une précision physique remarquable.
DES ENVIRONNEMENTS RÉALISTES… MAIS QUI SE DÉGRADENT RAPIDEMENT
Malgré ses atouts, Oasis 3 présente des limites majeures. Lors des tests, le modèle parvient à créer des scènes initiales très réalistes à partir d’une simple description textuelle. Par exemple, une rue de New York le matin est générée avec un niveau de détail impressionnant. Cependant, en se déplaçant dans l’environnement, la cohérence thématique se dégrade rapidement. La rue ressemble de moins en moins à New York et de plus en plus à une ville occidentale générique.
Autre problème : en essayant de revenir à l’intersection de départ, celle-ci a disparu, remplacée par un tout nouveau paysage. Les commandes ne sont pas très réactives, et il est fréquent de perdre le contrôle du véhicule. L’expérience ressemble davantage à un flux de conscience déconnecté qu’à une simulation cohérente. Ce comportement a également été observé avec d’autres modèles de monde.
Un autre défaut récurrent concerne la physique : la voiture peut traverser d’autres véhicules sans problème, ce qui montre que le modèle ne simule pas correctement les interactions physiques dans l’environnement. Leitersdorf qualifie ce problème de « défi majeur de recherche » que son équipe est en train de résoudre. Il l’attribue au fait qu’il existe « bien plus de données sur une bonne conduite que sur des accidents ».
COMMENT FONCTIONNE OASIS 3 ? ET POURQUOI C’EST SI DIFFICILE ?
Oasis 3 est un modèle auto-régressif : il génère une image à la fois, en se basant sur ce qu’il a produit précédemment pour décider de la suite. Cette architecture, commune à de nombreux modèles de monde, est gourmande en calculs. Pour maintenir la cohérence, l’équipe de Decart travaille à améliorer la mémoire du modèle.
« Chaque image générée représente environ 8 000 jetons », explique Leitersdorf. « En générant à plusieurs dizaines d’images par seconde, cela fait des centaines de milliers de jetons par seconde. La fenêtre de contexte se remplit très vite. Nous cherchons comment stocker des millions de jetons supplémentaires et comment compresser la mémoire en moins de jetons. »
Le fondateur estime que le problème de cohérence pourrait être partiellement résolu dans la prochaine version du modèle, qui permettra aux utilisateurs de générer des mondes à partir d’une vidéo d’environnement plutôt que d’une simple image. Il reconnaît que les modèles de monde en sont encore à leurs débuts.
LE RÊVE D’UNE COMMUNAUTÉ DE DÉVELOPPEURS INNOVANTS
Plutôt que de se focaliser sur les limites actuelles de sa technologie, Leitersdorf mise sur l’avenir et sur ce que les développeurs feront avec Oasis 3. Il compare la situation aux débuts des modèles de langage, lorsque l’API d’OpenAI a permis l’émergence d’une communauté qui a fait progresser le domaine en trouvant et en construisant de nouveaux cas d’usage.
« Quand nous nous reparlerons dans trois mois, nous aurons probablement 100 développeurs qui auront chacun construit 100 applications différentes avec Oasis, et qui nous surprendront tous », prédit-il. Malgré ses défauts, Oasis 3 pourrait bien devenir l’étincelle qui lance une révolution dans le domaine des simulations pour l’IA physique.
UN SECTEUR EN PLEINE EFFERVESCENCE
Decart n’est pas le seul acteur à se lancer dans les modèles de monde. Google a dévoilé Genie 3 en version recherche, World Labs (créé par Fei-Fei Li) propose Marble pour des cas d’usage commerciaux, et des startups comme Luma et Runway transforment leurs modèles vidéo en modèles de monde. Oasis 3 se distingue par son réalisme et son accessibilité via API, mais la concurrence s’annonce féroce.
Le secteur des modèles de monde est en pleine expansion, avec des applications potentielles allant bien au-delà des voitures autonomes. Robotique, e-commerce, streaming en direct… Les possibilités sont immenses, mais les défis techniques, notamment en matière de cohérence et de physique, restent nombreux.
LES DÉFIS TECHNIQUES À RELEVER
Parmi les principaux défis d’Oasis 3, la cohérence des environnements générés est le plus critique. Le modèle doit améliorer sa mémoire à long terme pour éviter que les scènes ne se transforment en chaos après quelques minutes. La simulation correcte des interactions physiques, comme éviter les autres véhicules, est également un point clé à résoudre.
Leitersdorf souligne que le manque de données sur les accidents rend la tâche encore plus difficile. « Il y a drastically plus de données sur une bonne conduite que sur des accidents », explique-t-il. Sans ces données, le modèle peine à reproduire des situations réalistes et dangereuses.
UNE RÉVOLUTION EN MARCHE ?
Oasis 3 représente une avancée majeure dans le domaine des simulations pour l’IA physique. Son réalisme et son accessibilité via API pourraient accélérer le développement des voitures autonomes et d’autres applications robotiques. Cependant, ses limites actuelles rappellent que les modèles de monde en sont encore à leurs débuts.
Si Decart parvient à résoudre les problèmes de cohérence et de physique, Oasis 3 pourrait bien devenir un outil indispensable pour les développeurs. Pour l’instant, il reste un outil prometteur, mais perfectible, qui ouvre la voie à une nouvelle ère de simulations réalistes.
POUR QUI EST FAIT OASIS 3 ?
Oasis 3 est conçu pour les entreprises et développeurs qui ont besoin de simuler des environnements de conduite réalistes. Les principaux bénéficiaires sont les constructeurs automobiles travaillant sur des voitures autonomes, mais aussi les startups et chercheurs en robotique. L’outil pourrait également intéresser les acteurs du e-commerce et du streaming en direct, qui utilisent déjà les modèles vidéo de Decart.
Le prix de 0,02 dollar par seconde en fait un outil accessible, même si les tarifs pour les entreprises dépendent des cas d’usage. Decart mise sur une adoption massive par les développeurs pour faire évoluer son produit et combler ses lacunes actuelles.
LES CONCURRENTS DIRECTS D’OASIS 3
Decart n’est pas seul dans la course aux modèles de monde. Google avec Genie 3, World Labs avec Marble, et des startups comme Luma et Runway sont des concurrents directs. Chacun de ces acteurs propose des solutions pour générer des environnements réalistes, mais Oasis 3 se distingue par son efficacité et son intégration verticale avec le matériel Nvidia, Amazon et Google.
La bataille pour dominer le marché des modèles de monde est lancée, et Decart compte bien y jouer un rôle majeur grâce à Oasis 3 et à sa communauté de développeurs déjà bien établie.
COMMENT ACCÉDER À OASIS 3 ?
Oasis 3 est accessible via une API, ce qui permet aux développeurs de l’intégrer directement dans leurs projets. Le coût est de 0,02 dollar par seconde, mais les tarifs pour les entreprises varient selon les cas d’usage. Decart propose également des solutions sur mesure pour les grands comptes, avec des prix négociés en fonction des besoins spécifiques.
Pour commencer à utiliser Oasis 3, il suffit de s’inscrire sur la plateforme de Decart et de suivre les instructions pour intégrer l’API dans son environnement de développement. La documentation est disponible en ligne pour guider les utilisateurs.
LES PERSPECTIVES D’AVENIR
Decart prévoit d’améliorer Oasis 3 dans les mois à venir, notamment en travaillant sur la mémoire à long terme du modèle et sur la simulation des interactions physiques. La prochaine version pourrait permettre de générer des mondes à partir d’une vidéo d’environnement plutôt que d’une simple image, ce qui améliorerait la cohérence des scènes.
À plus long terme, Decart envisage d’étendre l’utilisation d’Oasis 3 à d’autres domaines que les voitures autonomes, comme la robotique ou les applications de streaming en direct. L’objectif est de créer un écosystème autour de ses modèles de monde, à l’image de ce qu’OpenAI a fait avec les modèles de langage.
LES LIMITES ACTUELLES D’OASIS 3
Malgré ses atouts, Oasis 3 présente plusieurs limites majeures. La cohérence des environnements générés se dégrade rapidement, les commandes ne sont pas toujours réactives, et le modèle ne simule pas correctement les interactions physiques entre les objets. Ces problèmes rendent l’outil moins fiable pour des simulations complexes ou des tests critiques.
Decart travaille activement à résoudre ces défis, mais pour l’instant, Oasis 3 reste un outil prometteur, mais perfectible. Les utilisateurs doivent être conscients de ses limites avant de l’intégrer dans leurs projets.
UN OUTIL PROMETTEUR, MAIS PERFECTIBLE
Oasis 3 représente une avancée majeure dans le domaine des simulations pour l’IA physique. Son réalisme et son accessibilité via API en font un outil précieux pour les développeurs et les entreprises. Cependant, ses limites actuelles rappellent que les modèles de monde en sont encore à leurs débuts.
Si Decart parvient à résoudre les problèmes de cohérence et de physique, Oasis 3 pourrait bien devenir un outil indispensable pour les simulations réalistes. Pour l’instant, il reste un outil prometteur, mais perfectible, qui ouvre la voie à une nouvelle ère de simulations pour l’IA.
CE QUE LES DÉVELOPPEURS EN PENSENT
Les premiers retours des développeurs sur Oasis 3 sont mitigés. Si le réalisme des environnements générés est salué, les problèmes de cohérence et de réactivité des commandes sont souvent pointés du doigt. Certains soulignent que l’outil est encore trop instable pour des simulations critiques, mais tous reconnaissent son potentiel.
« Oasis 3 est impressionnant par son réalisme, mais il reste des bugs majeurs qui rendent son utilisation difficile », confie un développeur anonyme. « J’espère que Decart va rapidement corriger ces problèmes. »
LES INVESTISSEURS CROIENT EN DEPART
La levée de fonds de 300 millions de dollars et la valorisation de 4 milliards de dollars de Decart témoignent de la confiance des investisseurs dans l’avenir d’Oasis 3. Des géants comme Toyota, Adobe et eBay ont rejoint Nvidia en tant qu’investisseurs stratégiques, ce qui montre l’intérêt du secteur pour cette technologie.
« Tous ces investisseurs sont des clients potentiels », explique Leitersdorf. « Ils voient le potentiel d’Oasis 3 pour leurs propres projets, que ce soit dans l’automobile, le e-commerce ou d’autres domaines. »
ET APRÈS ?
Oasis 3 est un outil prometteur, mais Decart a encore du travail pour en faire un produit mature. Les prochaines versions devront améliorer la cohérence des environnements, la réactivité des commandes et la simulation des interactions physiques. Si ces défis sont relevés, Oasis 3 pourrait bien devenir un standard dans le domaine des simulations pour l’IA physique.
Pour l’instant, Decart mise sur sa communauté de développeurs pour faire évoluer son produit. L’objectif est de créer un écosystème autour d’Oasis 3, à l’image de ce qu’OpenAI a fait avec les modèles de langage. Les prochains mois seront cruciaux pour voir si l’outil tient ses promesses.
- TechCrunch AI
L'indépendance de CLODCO est votre garantie.
Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.
Soutenir CLODCO

