OpenAI a officiellement publié GPT-5.2, et la réponse des premiers testeurs – y compris plusieurs jours avant la publication du modèle OpenAI, des semaines dans certains cas – dresse un tableau à deux tons : c’est un pas de géant pour un raisonnement et un codage approfondis et autonomes, mais une mise à jour « incrémentielle » potentiellement pour une conversation informelle.
Après la période d’accès anticipé et le déploiement plus large d’aujourd’hui, les dirigeants, les développeurs et les analystes se sont rendus sur X (anciennement Twitter) et sur le blog de l’entreprise pour partager les résultats de leurs premiers tests.
Voici un tour d’horizon des premières réactions au dernier modèle phare d’OpenAI
“L’IA en tant qu’analyste sérieux”
L’éloge le plus fort de GPT-5.2 se concentre sur sa capacité à résoudre des « problèmes difficiles » qui nécessitent un temps de réflexion prolongé.
Matt Schumer, PDG d’HyperWriteAI, n’a pas mâché ses mots Son avisGPT-5.2 Pro est appelé « le meilleur modèle au monde ».
Schumer a souligné la robustesse du modèle, notant qu ‘”il réfléchit à des problèmes difficiles pendant **plus d’une heure**. Et il réalise des tâches qu’aucun autre modèle ne peut réaliser”.
C’était le sentiment Repris par Allie Kay MillerEntrepreneur en IA et ancien cadre d’AWS. Miller décrit le modèle comme une étape vers « l’IA en tant qu’analyste sérieux » plutôt que « un compagnon amical ».
“La réflexion et la résolution de problèmes semblent nettement plus fortes”, a écrit Miller dans X. “Cela donne une explication beaucoup plus profonde que ce à quoi je suis habitué. À un moment donné, il a littéralement écrit le code pour améliorer son propre OCR au milieu d’un travail.”
Bénéfice d’entreprise : Box signale des progrès en termes de performances individuelles
Pour le secteur des entreprises, la mise à jour semble encore plus significative.
Le PDG de Box, Aaron Levy, révélé sur X Que son entreprise teste GPT-5.2 en accès anticipé. Levy rapporte que le modèle obtient « 7 points de mieux que GPT-5.1 » lors de son test de raisonnement étendu, qui se rapproche des tâches de connaissances du monde réel dans les services financiers et les sciences de la vie.
“Le modèle a réalisé la plupart des tâches plus rapidement que GPT-5.1 et GPT-5”, a noté Levy, confirmant que Box AI introduira bientôt l’intégration de GPT-5.2.
Rutuja Rajwade, responsable senior du marketing produit, Box, Développez cela dans un article de blog d’entrepriseFait référence à des améliorations spécifiques de la latence.
Les tâches d’« extraction complexe » sont passées de 46 secondes sur GPT-5 à seulement 12 secondes avec GPT-5.2.
Rajwade a également noté une augmentation de la puissance de raisonnement pour le secteur vertical des médias et du divertissement, de 76 % de précision sur GPT-5.1 à 81 % sur le nouveau modèle.
Un « grand pas » pour le codage et la simulation
Les développeurs trouvent GPT-5.2 particulièrement puissant pour la génération « one-shot » de structures de code complexes.
Pietro Schirano, PDG de MagicPath, a partagé une vidéo Un moteur graphique 3D complet de modèles générés dans un seul fichier avec des contrôles interactifs. “Il s’agit d’un sérieux pas en avant dans la logique complexe, les mathématiques, le codage et la simulation”, a déclaré Shirano. “Le rythme des progrès est irréel.”
viensDe même, Ethan Malik, professeur à la Wharton School of Business de l’Université de Pennsylvanie et utilisateur et auteur de longue date de LLM et d’IA, Démontré la capacité du modèle à créer un shader visuellement complexe-Une ville néo-gothique infinie sur une mer agitée via une seule invite.
L’ère agentique : l’autonomie à long terme
Le transfert le plus efficace est peut-être la capacité du modèle à rester concentré sur sa tâche pendant des heures sans perdre un fil.
Dan Schipper, PDG de Thoughtful AI Testing Newsletter Everya rapporté que le modèle avait effectué avec succès une analyse des profits et pertes (P&L) qui l’obligeait à fonctionner de manière autonome pendant deux heures. “Il a effectué une analyse P&L pendant 2 heures et m’a donné d’excellents résultats”, a écrit Schipper.
Cependant, Schipper a également noté que pour les tâches quotidiennes, la mise à jour semble être « principalement incrémentielle ».
Dans Un article pour tout le mondeKatie Parrott a écrit que même si GPT-5.2 excelle dans le suivi des instructions, il est « moins ingénieux » que ses concurrents comme Cloud Opus 4.5 dans certains contextes, comme la détermination de l’emplacement d’un utilisateur à partir des données de courrier électronique.
Inconvénients : Vitesse et rigidité
Malgré sa puissance de raisonnement, le « ressenti » du modèle a suscité des critiques.
Schumer a souligné une « pénalité de vitesse » importante lors de l’utilisation du mode de réflexion du modèle. “D’après mon expérience, le mode réflexion est trop lent pour la plupart des questions”, a écrit Schumer dans sa revue approfondie. “Je n’utilise presque jamais d’instantané.”
Ally Miller souligne également des problèmes liés au comportement par défaut du modèle. “L’inconvénient, c’est le ton et le format”, a-t-il souligné. “La voix par défaut semblait un peu trop rigide et le comportement longueur/démarquage était extrême : une simple question transformée en 58 points à puces et numérotés.”
jugement
Les premiers retours suggèrent que GPT-5.2 est un outil optimisé pour les utilisateurs expérimentés, les développeurs et les agents d’entreprise plutôt que pour le chat occasionnel. Comme Schumer l’a résumé dans sa critique : « Pour les tâches qui bénéficient d’une recherche approfondie, d’un raisonnement complexe et d’une réflexion approfondie, le GPT-5.2 Pro est la meilleure option disponible actuellement. »
Cependant, pour les utilisateurs à la recherche d’une écriture créative ou de réponses rapides et fluides, des modèles comme le Claude Opus 4.5 restent de sérieux prétendants. “Mon modèle préféré reste Cloud Opus 4.5”, admet Miller, “mais mon travail complexe sur ChatGPT sera un bon coup de pouce.”






