La révolution de l'intelligence artificielle (IA) ne montre aucun signe de ralentissement. Lundi 13 mai 2024, OpenAI, l'éditeur derrière ChatGPT, a révélé son tout nouveau modèle d'IA générative : GPT-4o. Cette annonce marque une étape majeure dans l'évolution de l'interaction homme-machine, promettant des avancées significatives en matière de production et compréhension de texte, d'images, de sons et de voix.
Mira Murati, directrice technologique de la start-up californienne, a présenté GPT-4o lors d'une vidéo en direct. "Nous sommes vraiment ravis d'apporter GPT-4o à tous nos utilisateurs gratuits. Les utilisateurs payants continueront à bénéficier de limites en termes d'utilisation cinq fois plus élevées que les utilisateurs gratuits", a-t-elle déclaré. Cette démarche vise à démocratiser l'accès aux technologies d'IA les plus avancées, rendant les interactions avec les machines plus naturelles et accessibles.
GPT-4o, où le "o" signifie "omni", est conçu pour "raisonner" en temps réel à travers plusieurs modes de communication : l'audio, la vision et le texte. Les utilisateurs pourront ainsi interagir avec ChatGPT de manière plus fluide et intuitive. Les capacités de ce nouveau modèle seront progressivement intégrées à ChatGPT, en commençant par le texte et l'image. La nouvelle version du "Voice Mode" (mode vocal) sera disponible dans les prochaines semaines pour les abonnés.
Durant la démonstration, Murati et ses collègues ont illustré comment GPT-4o permet des conversations naturelles et fluides, proches des interactions humaines. En mode vocal, ChatGPT peut analyser les expressions faciales des utilisateurs via la caméra d'un smartphone, les aider à faire des exercices de respiration, leur raconter des histoires ou encore les aider à résoudre des problèmes mathématiques. Cette fonctionnalité avancée permet également aux utilisateurs d'interrompre l'IA à tout moment, renforçant l'aspect conversationnel.
Lors de la démonstration, un ingénieur d'OpenAI a montré au public comment GPT-4o peut lire les émotions et réagir en conséquence. Par exemple, en détectant la joie sur le visage d'un utilisateur, l'IA a demandé : "Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?" Cette interaction montre à quel point l'IA peut être intuitive et engageante.
Depuis le lancement de ChatGPT fin 2022, OpenAI a continuellement repoussé les limites de l'IA générative, surprenant même les géants technologiques. Avec GPT-4o, la start-up continue d'innover, ouvrant la voie à de nouvelles possibilités dans le domaine de l'intelligence artificielle.
En conclusion, la présentation de GPT-4o par OpenAI souligne l'engagement de l'entreprise à rendre les technologies d'IA avancées accessibles à tous, tout en améliorant continuellement l'interaction entre les humains et les machines. Les prochaines semaines et mois s'annoncent passionnants pour les utilisateurs de ChatGPT, qui pourront bientôt explorer ces nouvelles capacités révolutionnaires.
Jonathan
CEO - AI Strategist
jonathan.delmas@strat37.com