Voir tous les articles de presse sur l'IA

Projet Hush-Hush d'OpenAI : un moteur vocal avec un murmure de Jarvis

March 23, 2024
Vous pensez que votre haut-parleur intelligent est plein d'esprit ? Préparez-vous, OpenAI prépare quelque chose qui pourrait donner à Siri une leçon de charme.

Sommaire :

OpenAI, le cerveau à l'origine de certaines des astuces d'IA les plus cool dans la manche de la technologie, semble entrer sur la pointe des pied sur la scène de la technologie vocale. Voici le point sur leur projet plus si secret, qui bourdonne dans le domaine de la technologie.

  • Qu'est-ce que le Buzz ? Jetez un coup d'œil à l'aventure d'OpenAI dans la technologie vocale.
  • La chasse aux indice : Un cas curieux de la marque de commerce nouvellement repérée.
  • Lecture entre les lignes Que signifie réellement la marque de commerce de ce soi-disant « moteur vocal » ?
  • Repérer dans la boule de cristal : Imaginer un monde où l'IA parle plus en douceur qu'un animateur d'émission de fin de soirée.
  • Aya: un aperçu de ce que le moteur vocal pourrait faire, mais bien mieux.

Les points de vue les plus indéniables :

Discuter avec Voice Engine d'OpenAI fait que ma cafetière semble moins un bavardeur et plus un vieil homme grognon coincé dans ses habitudes.

Sur les traces des ragots technologiques

Donc, OpenAI nous a laissé quelques miettes de pain, menant directement à leur prochain grand projet : un projet de moteur vocal. C'est comme trouver une carte secrète dans un roman policier, sauf que le trésor ici pourrait changer la façon dont nous discutons avec nos gadgets. Le buzz a commencé par une marque de commerce qui criait « technologie vocale », faisant bouger les langues sur la suite des magiciens de l'IA.

Décoder le mystère de la marque de commerce

Plonger dans les détails de la marque de commerce donne l'impression de décrocher un code secret qui fait allusion à une technologie vocale si avancée qu'elle pourrait donner l'impression que les assistants d'IA actuels sont de l'âge de pierre. Nous parlons d'un système qui bascule entre la parole et le texte avec la facilité de retourner des crêpes, promettant un avenir où votre copain numérique pourrait vous dépasser en plaisanteries.

Discution future : Au-delà du babble technologique d'aujourd'hui

Le moteur vocal d'OpenAI a promis de révolutionner ma vie ; maintenant, c'est juste mon chat et le frigo qui ne prennent pas les commandes de ma part.

Imaginez ceci : un assistant IA qui ne comprend pas seulement vos marmements, mais qui peut vous parler avec l'avidité d'un commérage chevronné. Avec un clin d'oreille au légendaire Jarvis d'Iron Man, l'entreprise d'OpenAI murmure un avenir où les commandes vocales pourraient vous faciliter la vie plus facilement que le beurre sur des toasts chauds. C'est comme le colocataire cool et inaperçu dont vous ne saviez pas avoir besoin, prêt à gérer vos gadgets en votre nom.

L'effet Ripple : une vague de spéculations

Cette initiative d'OpenAI n'est pas simplement une nouvelle mise à jour dans le monde de la technologie ; elle pourrait changer la donne dans la façon dont nous interagissons avec notre environnement numérique. Il fait allusion à un avenir pas si lointain où la technologie est non seulement utile, mais carrément indispensable, évoluant d'un outil utile à un compagnon plein d'esprit qui se démarque.

Conclusion :

J'ai dit à Voice Engine d'OpenAI de me surprendre, et il a commencé à réciter des poèmes d'amour. Je suppose que c'est moins cher que les rencontres en ligne, avec presque le même taux de réussite.

Le Whisper d'OpenAI, qui fait partie de sa suite technologique, est une étape vers l'avenir de la reconnaissance vocale. Mais le véritable truc réside dans la création d'un assistant vocal IA convivial. Il s'agit de trouver le point idéal où l'IA sait quand tromper et non couper les humains à mi-phrase. Il devrait parler en phrases rapides et rapides — pensez 3 secondes maximum. De plus, il doit se rappeler qui vous êtes, jongler avec les recherches en temps réel sur Internet et ne pas brûler un trou dans votre portefeuille. C'est un défi de taille puisque la conversion vocale et textuelle en temps réel n'est pas bon marché.

Nous avons utilisé cette idée chez Stork, fusionnant Whisper avec GPT 3.5 d'OpenAI et un peu de la technologie de Google, créant Aya - quelque chose d'amusant mais qui manque d'accès Web en temps réel ou de mémoire personnelle. Regarder l'avenir, imaginez Aya amélioré avec Gemini 1.5 Vision de Google, ce qui lui permet non seulement de converser, mais aussi d'interpréter visuellement le monde en temps réel.

Articles récents

Voir tous les articles