View all AI news articles

Проект OpenAI Hush-Hush: голосовой движок с шепотом Джарвиса

March 23, 2024
Думаете, ваш умный динамик остроумный? Приготовьтесь: OpenAI готовит что-то, что может преподать Siri урок шарма.

Резюме:

Похоже, что OpenAI, изобретатель самых крутых хитростей в области искусственного интеллекта в рукаве, на цыпочках выходит на сцену голосовых технологий. Вот краткая информация об их уже не столь секретном проекте, который активно развивается в сфере технологий.

  • Что за жужжание? Ознакомьтесь с проектом OpenAI в области голосовых технологий.
  • Охота за подсказками: Любопытный случай с недавно обнаруженной торговой маркой.
  • Чтение между строк: Что на самом деле означает товарный знак этого так называемого «голосового движка»?
  • Вглядываясь в хрустальный шар: Представьте себе мир, в котором искусственный интеллект говорит более гладко, чем ведущий ночного шоу.
  • Айя: представление о том, что может в конечном итоге сделать голосовой движок, но намного лучше.

Мелочи:

В чате с помощью голосового движка OpenAI моя кофеварка выглядит не столько собеседником, сколько ворчущим стариком, застрявшим на своем пути.

По следам технических сплетен

Таким образом, OpenAI оставила нам некоторые хлебные крошки и сразу же положила начало их следующему крупному проекту — проекту голосового движка. Это все равно, что найти секретную карту в детективном романе, за исключением того, что найденное здесь сокровище может изменить то, как мы общаемся с нашими гаджетами. Ажиотаж начался с торговой марки с надписью «голосовые технологии» и заставляющей вилять языками о том, что ждет в будущем искусственных мастеров.

Разгадка тайны товарного знака

Погрузиться в детали торговой марки — все равно что взломать секретный код, намекающий на то, что голосовые технологии настолько продвинуты, что нынешние помощники искусственного интеллекта могут выглядеть так, будто они родом из каменного века. Мы говорим о системе, которая позволяет переключаться между речью и текстом так же легко, как и блины. Она обещает будущее, в котором ваш собеседник по цифровым технологиям может просто перехитрить вас в шутку.

Беседа о будущем: за рамками сегодняшней технической болтовни

Voice Engine от OpenAI обещал революционизировать мою жизнь; теперь команды от меня не принимают только моя кошка и холодильник.

Представьте себе: помощник с искусственным интеллектом, который не только понимает ваше бормотание, но и может переговорить с вами, используя опыт опытного сплетника. Отдавая дань уважения легендарному Джарвису из «Железного человека», компания OpenAI рассказывает о будущем, в котором голосовые команды смогут управлять вашей жизнью намного удобнее, чем горячий тост с маслом. Это как классный, невидимый сосед по комнате, о котором вы даже не подозревали, что вам нужен, готовый распоряжаться вашими гаджетами от вашего имени.

Волновой эффект: волна спекуляций

Это предприятие OpenAI — это не просто очередное обновление мира технологий; это потенциальное изменение нашего взаимодействия с цифровой средой. Это намекает на недалекое будущее, в котором технологии не только полезны, но и просто незаменимы. Они превращаются из полезного инструмента в остроумного компаньона, который поймет ваши причуды.

Подведение итогов:

Сказал мне сюрприз от Voice Engine от OpenAI, и он начал читать любовные стихи. Думаю, это дешевле, чем онлайн-знакомства, и почти такой же процент успеха.

Whisper от OpenAI, входящий в их технологический пакет, — это шаг в будущее распознавания речи. Но настоящая хитрость заключается в создании удобного голосового помощника с искусственным интеллектом. Суть в том, чтобы найти золотую середину, в которой искусственный интеллект будет знать, когда нужно трудиться, а не отключать людей в полусловах. Он должен говорить быстрыми и резкими предложениями — не более 3 секунд. Кроме того, оно должно помнить, кто вы есть, совмещать поиск в Интернете в реальном времени и не пробивать дыру в кошельке. Это непростая задача, поскольку преобразование голоса и текста в реальном времени обходится недешево.

Мы поэкспериментировали с этой идеей в Stork, объединив Whisper с GPT 3.5 от OpenAI и немного технологий Google, создав Айя - что-то интересное, но не имеющее доступа в Интернет в реальном времени или личной памяти. Заглядывая в будущее, представьте Айя усовершенствованная с помощью Google Gemini 1.5 Vision, позволяющая ему не только общаться, но и визуально интерпретировать мир в режиме реального времени.

Recent articles

View all articles