Passer au contenu

OpenAI annonce GPT-4o, la voix en temps réel (et pleins de nouveautés gratuites)

OpenAI tenait aujourd’hui une conférence en ligne sur les nouveautés qui arrivent dès aujourd’hui dans ChatGPT, y compris pour les utilisateurs gratuits.

Alors que le modèle GPT-5 se fait encore attendre, OpenAI présentait quelques nouveautés qui arrivent dans ChatGPT, dont beaucoup de choses jusqu’ici réservées aux abonnés ChatGPT Plus et qui deviennent gratuites. La première annonce concerne le modèle LLM star de la firme, qui passe à la version GPT-4o. Oui, il y a de quoi être confus, étant donné que le dernier modèle se nommait GPT-4.5 Turbo.

Toutefois ce qui suit le 4 est cette fois-ci une lettre qui signifie “Omni”, et cela change tout. Surtout lorsque vous interagissez non pas avec le clavier… mais à la voix.

GPT-4o délivre pour la première fois des interactions en temps réel

C’est sans doute la nouveauté la plus magique de ce nouveau modèle LLM : par on ne sait quel tour de magie, OpenAI parvient désormais à délivrer des réponses instantanées aux prompts, même complexes – ou tirant partie, nous allons le voir, de la vidéo.

Cet exploit autorise de totalement repenser les interactions avec l’IA, et par la même occasion les assistants vocaux. OpenAI propose déjà depuis quelque temps des interactions à la voix. Mais si vous essayez avec le modèle GPT-4.5 Turbo le temps qu’il reste disponible, vous en constaterez vite la limite.

Il y a en effet un délai assez long entre le moment où vous terminez votre question et celui où ChatGPT vous délivre une réponse. Ce qui peut s’avérer très frustrant et rend des produits comme le AI Pin de Humane si imparfaits. Pour le pin, en particulier, qui dépend de OpenAI, l’arrivée du modèle GPT-4o a des airs de game changer

GPT-4o est “omni”, ce qui comprend le texte, la voix, les photos, et les vidéos en direct

GPT-4o est un LLM couvrant le même dataset que le modèle précédent. Mais la firme a su mieux imbriquer ses “sens” – à savoir les entrées textuelles, voix, photo et vidéo . Ce que cela permet : ChatGPT peut désormais beaucoup mieux comprendre le monde autour de lui.

Le plus bluffant est sans conteste l’arrivée de ce qui semble être de la reconnaissance IA sur la vidéo en direct de capteurs de votre smartphone. Très concrètement si vous pointez quelque chose et demandez quelque chose de lié à ce que l’app voit, ChatGPT peut désormais répondre du tac au tac.

Le tout dans un vrai temps réel qu’il nous faudra bien évidemment tester lorsque tout cela sera bel et bien disponible.

Une application arrive sur ordinateur

Chatgpt App
© OpenAI

OpenAI a également fait la démonstration d’une application qui arrive sur ordinateur. On a pu voir la version Mac qui délivre entre autres la fonction vocale de ChatGPT en temps réel – et un mode permettant à ChatGPT de voir tout simplement votre écran.

La démo des intervenants était centrée sur du code, puis sur de l’interprétation de courbes. L’ensemble, assez impressionnant, devrait délivrer de nouvelles possibilités pour se faire aider par l’IA dans le cadre de n’importe quelle activité – professionnelle ou non.

L’app est disponible sur Mac dès aujourd’hui. La version Windows arrive “plus tard dans l’année”.

Beaucoup de choses réservées à ChatGPT Plus deviennent gratuites

D’autres bonnes nouvelles ont été annoncées, surtout pour les utilisateurs gratuits. La première, c’est que le modèle GPT-4 est disponible auprès des utilisateurs gratuits – avec en plus la connexion au web. Le modèle permet entre autres, sans payer ChatGPT Plus, d’analyser des données et de créer des graphiques.

Il est également possible de soumettre des photos au modèle 4 et de demander à ChatGPT de les analyser. Uploader des fichiers pour vous aider à les résumer, à écrire ou les analyser devient possible sans frais. Les utilisateurs gratuits peuvent désormais accéder aux GPT et au GPT Store. Ainsi que Memory, la fonction qui permet de mobiliser l’historique de vos conversations.

La fonction voix en temps réel, elle, reste exclusive aux utilisateurs payants de GPT Plus et abonnements plus chers.

L’arrivée de ces nouveautés sera progressive

ChatGPT-4o est en cours de déploiement dès maintenant auprès des utilisateurs ChatGPT Plus et Teams – avec une arrivée constatée dans votre compte “d’ici quelques semaines”. Le nouveau Voice Mode en temps réel arrive lui aussi d’ici quelques semaines “en version alpha”.

Le nouveau modèle arrive également selon le même calendrier auprès des utilisateurs gratuits mais avec des limites inférieures. Celle-ci reste pour le moment évanescente : on sait simplement que les utilisateurs payants auront une limite de prompts jusqu’à 5 fois plus élevée que sur les comptes gratuits. Les abonnés Team et Entreprise bénéficieront de limites “encore plus élevées” selon OpenAI.

  • OpenAI déploie en ce moment le modèle GPT-4o permettant des interactions en temps réel.
  • Le modèle permet également des interactions bluffantes à la voix, sans le moindre délai.
  • De nombreuses choses qui étaient réservées aux abonnés Plus deviennent gratuites.

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Opera One - Navigateur web boosté à l’IA
Opera One - Navigateur web boosté à l’IA
Par : Opera