ChatGPT se dote d'un pouvoir de vision en temps réel

Publié

IAChatGPT se dote d'un pouvoir de vision en temps réel

Le mode vocal du célèbre chatbot d'OpenAI s'enrichit d'une capacité de reconnaissance visuelle instantanée, promise il y a plus de sept mois par l'entreprise américaine.

ChatGPT se dote de la reconnaissance visuelle en temps réel.

ChatGPT se dote de la reconnaissance visuelle en temps réel.

OpenAI

Dans le cadre de son calendrier de l'avent numérique, «douze jours d'OpenAI», qui a notamment dévoilé un nouvel abonnement et le déploiement du générateur de vidéos Sora pour le grand public, l'entreprise américaine a annoncé, jeudi, une évolution majeure pour ChatGPT. Le célèbre chatbot s'enrichit en effet de la vision en temps réel, une compétence promise depuis plus de sept mois. Intégrée au mode voix avancée, cette fonctionnalité permet à l'IA générative d'analyser visuellement l'environnement et les objets qui s'y trouvent via la caméra d'un smartphone. Elle peut ainsi répondre à des questions à leur sujet.

Vidéo et partage d'écran

En plus de la vidéo, le mode voix avancée, qui se dote par ailleurs de la voix du père Noël, prend également en charge le partage d'écran. Lors de ses échanges naturels avec le chatbot, l'utilisateur peut montrer les applications présentes sur l'écran de son appareil pour demander de l'assistance ou résoudre des problèmes, par exemple.

Cette nouveauté, alimentée par le modèle de langage multimodal 4o d'OpenAI, est déployée dans l'application mobile ChatGPT pour les abonnés ChatGPT Teams, Plus et Pro. Les utilisateurs basés en Europe n'y ont toutefois pas encore droit, mais OpenAI prévoit déjà de l'étendre aux abonnés Plus et Pro des pays de l'UE, de la Suisse, du Liechtenstein, de l'Islande et de la Norvège. Quant aux utilisateurs des offres Enterprise et Edu, ils devront attendre le mois de janvier, pour pouvoir accéder à cette fonctionnalité.

Ton opinion

0 commentaires
L'espace commentaires a été desactivé