BFM Tech

OpenAI lance "agent", l'assistant multi-tâche intelligent de ChatGPT

BFM Business Théotim Raguet
placeholder video
OpenAI dévoile ChatGPT agent, une fonction qui permet au chatbot de réaliser plusieurs tâches complexes simultanées et qui inclue certaines nouveautés comme un suivi vidéo en direct de la réflexion.

Les assistants personnels IA viennent de franchir un nouveau pas. Dans un live diffusé le 17 juillet 2025, Sam Altman et une équipe d'ingénieurs d'OpenAI ont présenté la nouveauté qui intégrera ChatGPT, la fonction "agent".

Polyvalente, cette IA est capable de réaliser plusieurs tâches en même temps. Elle ressemble à une fusion entre deux fonctionnalités existantes de ChatGPT: Deep research, qui permet de réaliser des longues tâches nécessitant des recherches approfondies, et Operator, qui permet notamment de réaliser des réservations en interagissant avec les pages web.

Champion du multi-tâche

Agent trouve toute son utilité dans des requêtes longues et complexes, nécessitant plusieurs actions. Il lui faudra cependant un certain temps avant de générer une réponse complète (en général entre 5 et 15 minutes) selon la complexité de la tâche qui lui sera demandée.

Dans un exemple présenté par les employés d'OpenAI, un utilisateur sollicite l'IA pour l'aider à se préparer au mariage de ses amis. Tenue vestimentaire et accessoires conformes au "dress code", hôtels disponibles à proximité, cadeau pour les mariés, agent se charge de faire un rapport avec les meilleurs résultats selon les besoins de son interlocuteur humain.

Agent est même capable d'interagir avec d'autres applications telles que Google Drive, Gmail ou Google Calendar. L'équipe en fait la démonstration avec un diaporama généré à partir de données récupérées dans un Google Doc.

Enfin, agent intègre à sa palette de compétence la génération d'images, qu'il pourra inclure dans une réponse plus large. Dans le diaporama évoqué ci-dessus, l'IA a par exemple créé les visuels utilisés pour décorer les diapositives.

Une diapositive entièrement créée par ChatGPT agent, y compris l'illustration
Une diapositive entièrement créée par ChatGPT agent, y compris l'illustration © OpenAI

Des ajouts inédits

Soucieux de la transparence de son IA, l'équipe d'OpenAI a pensé à inclure une fonctionnalité intéressante. Via un petit moniteur, ChatGPT montre en direct l'ensemble des actions effectuées ou les sites consultés. Comme si le chatbot utilisait un navigateur internet à notre place.

L'utilisateur peut suivre en direct la progression de l'IA ou revoir certains passages de la réflexion (un peu comme un live Youtube). "Comme ces tâches sont un peu plus longues, vous pouvez aussi revenir en arrière pour voir que ce que l'IA faisait", explique Yash Kumar, ingénieur de l'équipe derrière agent.

La fenêtre de suivi vidéo de la réflexion de ChatGPT agent, ici on voit ChatGPT se rendre sur un navigateur à la recherche d'un costume
La fenêtre de suivi vidéo de la réflexion de ChatGPT agent, ici on voit ChatGPT se rendre sur un navigateur à la recherche d'un costume © OpenAI

Autre ajout pratique, l'utilisateur peut apporter des éléments à l'IA alors qu'elle est en plein milieu de sa réflexion. Il peut demander une tâche supplémentaire, amener des précisions ou demander de complètement changer certaines instructions. Dans sa réponse finale, Agent aura pris en compte ces demandes.

L'équipe derrière cette fonctionnalité a également voulu assurer un filet de sécurité au cas où l'IA ferait des erreurs. L'ingénieur Casey Chu explique ainsi qu'agent demandera systématiquement confirmation de la part de l'utilisateur avant de procéder à une action importante, comme l'envoi d'un mail par exemple.

Comme pour la plupart des modes de fonctionnalité de ChatGPT, agent sera disponible depuis l'onglet "Outils" du chatbot, aussi bien sur la version ordinateur que mobile. Sa date de sortie en France n'a pas encore été officialisée, mais il ne sera uniquement accessible qu'aux versions payantes Pro et Plus de ChatGPT.