OpenAI консолидировала свои усилия в области аудио-ИИ, объединив инженерные, продуктовые и исследовательские команды за последние два месяца для переработки своих аудиомоделей. Этот шаг, о котором первоначально сообщило издание The Information, сигнализирует о подготовке компании к выпуску персонального устройства с приоритетом аудио, которое, как ожидается, будет запущено в течение следующего года.
Консолидация отражает более широкую отраслевую тенденцию к приоритезации аудио-опыта, при этом экраны потенциально становятся менее важными. Умные колонки уже внедрили голосовых помощников более чем в трети домохозяйств США, что свидетельствует о растущем признании взаимодействия на основе аудио.
Meta недавно представила функцию для своих умных очков Ray-Ban, в которой используется массив из пяти микрофонов для повышения четкости речи в шумной обстановке. Эта технология эффективно превращает лицо пользователя в направленное устройство прослушивания. Google начала экспериментировать с Audio Overviews в июне, преобразуя результаты поиска в разговорные сводки. Tesla интегрирует чат-бота Grok от xAI в свои автомобили, стремясь создать разговорного голосового помощника, способного управлять навигацией и климат-контролем с помощью естественного языка.
Помимо этих технологических гигантов, многочисленные стартапы также инвестируют в аудио-ИИ. Эти коллективные усилия указывают на значительный сдвиг в том, как пользователи будут взаимодействовать с технологиями, что потенциально приведет к более бесшовным и интуитивно понятным возможностям. Последствия этого сдвига распространяются на различные аспекты повседневной жизни, от доступа к информации до коммуникации и развлечений. По мере того как аудио-технологии на базе ИИ становятся все более совершенными, они могут изменить то, как люди учатся, работают и общаются друг с другом.
Discussion
Join the conversation
Be the first to comment