Google vient d’élargir l’accès à son IA de génération d’images du modèle Gemini 2.0 Flash. Cet outil permet notamment de générer et d’éditer du contenu visuel. Cette capacité est surpuissante et pourrait bien faire de l’ombre à Photoshop.
Photoshop en danger ?
Dans le détail, cette IA est disponible sur Google AI Studio et il ne s’agit pour l’heure que d’une version expérimentale. Cela dit, les premiers testeurs chanceux louent sa capacité à générer et à modifier des images à l’aide de simples prompts.
Deedy Das de Menlo Ventures, s’est ainsi réjoui sur X :
Vous pouvez désormais concevoir votre maison grâce à l’IA. J’ai demandé à Google Gemini : “Faites disparaître les meubles”, puis “Décorez-les avec une esthétique moderne et chic”. Il a réussi du premier coup.
Il a précisé qu’un architecte d’intérieur aurait pu facilement facturer cette prestation entre 5000 et 10 000 dollars aux États-Unis. Quant à l’IA, elle lui a permis de « tester un nombre infini de possibilités gratuitement ». Il en est désormais quasi certain : cette IA de retouche de Google « va tuer 99 % de Photoshop ».
Rien de certain cela dit, d’autant qu’Adobe a également décidé de miser à fond sur l’IA générative qu’elle devrait déployer à terme massivement dans ses logiciels. La société veut ainsi permettre à ses clients de supprimer ou d’agrandir facilement des éléments d’image à l’aide de simples demandes textuelles, ce qui ressemble donc à ce que propose Google avec Gemini 2.0 Flash.
Mentionnons aussi que cette ouverture de l’IA de Google a aussi fait l’objet d’une polémique. En effet, certains utilisateurs sont parvenus à supprimer les filigranes des images grâce à l’IA, ce qui fait craindre des conséquences à terme pour la protection du droit d’auteur. Le géant de la Tech a pour sa part indiqué que ces pratiques sont interdites par ses conditions d’utilisation.
De belles marges de progression
Quoi qu’il en soit, et, comme l’explique ArsTechnica, « il y a une grande marge d’amélioration à l’avenir pour incorporer plus de “connaissances” visuelles au fur et à mesure que les techniques d’apprentissage progressent et que le coût du calcul diminue. Si le processus ressemble à ce que nous avons vu avec les générateurs d’images IA basés sur la diffusion, comme Stable Diffusion, Midjourney et Flux, la qualité des images multimodales produites pourrait s’améliorer rapidement sur une courte période de temps. »
Il sera en tout cas important de voir ce que donnera l’implémentation plus massive de ces IA (si elle se produit). De nombreux artistes et professionnels concernés s’inquiètent d’ailleurs à juste titre des conséquences de ces technologies pour leurs métiers.
📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.
