Un an après la sortie de DALL-E, OpenAI frappe fort en dévoilant DALL-E 3, une toute nouvelle version de son générateur d’images par intelligence artificielle, qui devrait concurrencer plus sérieusement Midjourney, leader dans le domaine actuellement.
La grande nouveauté, c’est que DALL-E 3 sera intégré à ChatGPT. Concrètement, vous pourrez demander à ChatGPT de générer des images et il sera en capacité de les ajuster en fonction de vos consignes. En combinant ces deux technologies, OpenAI propose une véritable valeur ajoutée à ses utilisateurs qui pourront générer du texte et des images sur la même interface.
« DALL-E 3 comprend beaucoup plus de nuances et de détails que nos systèmes précédents, ce qui vous permet de traduire facilement vos idées en images exceptionnellement précises », explique OpenAI dans son blog post.
Sam Altman, CEO d’OpenAI, a partagé une vidéo d’un exemple d’usage dans ChatGPT (voir ci-dessous). Après un prompt, DALL-E 3 génère 4 images dans ChatGPT, il est possible ensuite de lui demander des ajustements sur une image spécifique pour gagner en précision. Il est également capable de générer du texte descriptif sur votre image si vous souhaitez obtenir plus de contexte.
OpenAI précise que des précautions ont été prises pour éviter que des contenus violents, pour adultes, ou haineux, ne soient générés par des utilisateurs mal intentionnés. Il est vrai que les dérives se sont multipliées du côté de Midjourney, notamment avec des images de célébrités générées par IA. Pour éviter cela, OpenAI indique avoir mis en place « des mesures d’atténuation pour refuser les requêtes qui demandent le nom d’un personnage public ».
Les images qui sont générées par DALL-E 3 pourront être utilisées par leurs créateurs comme ils le souhaitent selon la déclaration d’OpenAI : « Comme pour DALL-E 2, les images que vous créez avec DALL-E 3 vous appartiennent et vous n’avez pas besoin de notre autorisation pour les réimprimer, les vendre ou les commercialiser. »
Pour respecter le travail des créateurs (et esquiver les problèmes de droits d’auteur…), OpenAI indique que DALL-E 3 refusera les requêtes qui demandent une image dans le style d’un artiste vivant. Et par précaution, la firme américaine propose même aux créateurs d’exclure leurs images de la formation de leurs futurs modèles de génération d’images via un formulaire dédié.
DALL-E 3 sera disponible début octobre, mais seulement pour les abonnés à ChatGPT Plus (version payante de l’outil) et ChatGPT Enterprise (version à destination des professionnels). En attendant la sortie officielle, vous pouvez toujours tester des alternatives à DALL-E. Stay tuned !
Dans un blog post, Microsoft a annoncé que Bing prend dès à présent en charge le dernier modèle DALL-E 3. Il sera possible de générer des images plus précises qu’avant via l’interface de Bing Chat, ainsi que via Bing Image Creator. Contrairement à ChatGPT, ici, nul besoin de payer pour utiliser DALL-E 3.
DALL-E 3 constitue un grand pas en avant avec des créations plus belles et de meilleurs rendus pour des détails comme les doigts et les yeux. Il comprend également mieux ce que vous demandez, ce qui permet de fournir des images plus précises.