Думаете, ваш умный динамик остроумный? Приготовьтесь: OpenAI готовит что-то, что может преподать Siri урок шарма.
Резюме:
Похоже, что OpenAI, изобретатель самых крутых хитростей в области искусственного интеллекта в рукаве, на цыпочках выходит на сцену голосовых технологий. Вот краткая информация об их уже не столь секретном проекте, который активно развивается в сфере технологий.
- Что за жужжание? Ознакомьтесь с проектом OpenAI в области голосовых технологий.
- Охота за подсказками: Любопытный случай с недавно обнаруженной торговой маркой.
- Чтение между строк: Что на самом деле означает товарный знак этого так называемого «голосового движка»?
- Вглядываясь в хрустальный шар: Представьте себе мир, в котором искусственный интеллект говорит более гладко, чем ведущий ночного шоу.
- Айя: представление о том, что может в конечном итоге сделать голосовой движок, но намного лучше.
Мелочи:
По следам технических сплетен
Таким образом, OpenAI оставила нам некоторые хлебные крошки и сразу же положила начало их следующему крупному проекту — проекту голосового движка. Это все равно, что найти секретную карту в детективном романе, за исключением того, что найденное здесь сокровище может изменить то, как мы общаемся с нашими гаджетами. Ажиотаж начался с торговой марки с надписью «голосовые технологии» и заставляющей вилять языками о том, что ждет в будущем искусственных мастеров.
Разгадка тайны товарного знака
Погрузиться в детали торговой марки — все равно что взломать секретный код, намекающий на то, что голосовые технологии настолько продвинуты, что нынешние помощники искусственного интеллекта могут выглядеть так, будто они родом из каменного века. Мы говорим о системе, которая позволяет переключаться между речью и текстом так же легко, как и блины. Она обещает будущее, в котором ваш собеседник по цифровым технологиям может просто перехитрить вас в шутку.
Беседа о будущем: за рамками сегодняшней технической болтовни
Представьте себе: помощник с искусственным интеллектом, который не только понимает ваше бормотание, но и может переговорить с вами, используя опыт опытного сплетника. Отдавая дань уважения легендарному Джарвису из «Железного человека», компания OpenAI рассказывает о будущем, в котором голосовые команды смогут управлять вашей жизнью намного удобнее, чем горячий тост с маслом. Это как классный, невидимый сосед по комнате, о котором вы даже не подозревали, что вам нужен, готовый распоряжаться вашими гаджетами от вашего имени.
Волновой эффект: волна спекуляций
Это предприятие OpenAI — это не просто очередное обновление мира технологий; это потенциальное изменение нашего взаимодействия с цифровой средой. Это намекает на недалекое будущее, в котором технологии не только полезны, но и просто незаменимы. Они превращаются из полезного инструмента в остроумного компаньона, который поймет ваши причуды.
Подведение итогов:
Whisper от OpenAI, входящий в их технологический пакет, — это шаг в будущее распознавания речи. Но настоящая хитрость заключается в создании удобного голосового помощника с искусственным интеллектом. Суть в том, чтобы найти золотую середину, в которой искусственный интеллект будет знать, когда нужно трудиться, а не отключать людей в полусловах. Он должен говорить быстрыми и резкими предложениями — не более 3 секунд. Кроме того, оно должно помнить, кто вы есть, совмещать поиск в Интернете в реальном времени и не пробивать дыру в кошельке. Это непростая задача, поскольку преобразование голоса и текста в реальном времени обходится недешево.
Мы поэкспериментировали с этой идеей в Stork, объединив Whisper с GPT 3.5 от OpenAI и немного технологий Google, создав Айя - что-то интересное, но не имеющее доступа в Интернет в реальном времени или личной памяти. Заглядывая в будущее, представьте Айя усовершенствованная с помощью Google Gemini 1.5 Vision, позволяющая ему не только общаться, но и визуально интерпретировать мир в режиме реального времени.