Dans un blog post publié ce lundi 25 septembre, OpenAI annonce l’implémentation imminente de « nouvelles capacités vocales et visuelles » pour ChatGPT. Ainsi, il sera bientôt possible d’engager une discussion à l’oral avec le chatbot ou de lui présenter une image, qu’il sera capable d’identifier, d’analyser ou de commenter. Il s’agit d’une nouvelle mise à jour majeure pour ChatGPT, qui bénéficiera également de l’intégration de DALL-E d’ici le mois d’octobre.
En pratique, la fonctionnalité Voice offrira, de la même manière qu’un assistant vocal, la possibilité de « discuter [avec ChatGPT] lors d’un déplacement, de lui demander de raconter une histoire ou de régler un débat à table », détaille OpenAI. De son côté , la reconnaissance d’images pourra notamment permettre de « trouver la raison pour laquelle votre gril ne fonctionne pas, explorer le contenu de votre réfrigérateur pour planifier un repas ou analyser un graphique complexe », complète la firme. En outre, ChatGPT sera capable d’analyser et commenter un élément spécifique d’une l’image, préalablement encerclé par l’utilisateur (voir exemple plus bas).
Ces nouvelles fonctionnalités, qui décuplent les possibilités offertes par l’agent conversationnel, seront progressivement déployées au cours des deux prochaines semaines. Elles seront d’abord exclusivement réservées aux souscripteurs des offres ChatGPT Plus et Enterprise, avant d’être étendues à « d’autres groupes d’utilisateurs », précise OpenAI. La fonctionnalité Voice sera déployée sur les applications iOS et Android, tandis que la reconnaissance d’image sera également accessible sur la version desktop.
Pour initier une discussion à l’oral avec ChatGPT, il faudra procéder comme suit :
Une fois la manipulation réalisée, il suffira de cliquer sur l’icône en forme de casque « situé dans le coin supérieur droit de l’écran » , détaille OpenAI, puis choisir l’une des cinq voix proposées.
Pour demander à ChatGPT d’analyser ou commenter une image, il vous suffira de prendre une photo ou de la sélectionner dans votre bibliothèque d’images, puis de cliquer sur Confirmer pour l’intégrer à la conversation en lui associant un prompt. Comme sur l’exemple ci-dessous, il sera également possible d’ajouter des requêtes additionnelles afin d’affiner la précision de la réponse, ou d’entourer un élément spécifique grâce à l’outil Dessin.