OpenAI консолидировала несколько инженерных, продуктовых и исследовательских команд за последние два месяца, чтобы обновить свои аудиомодели, сигнализируя о значительном продвижении в области аудио-ИИ. Эта реструктуризация проводится в преддверии запланированного персонального устройства с приоритетом аудио, которое, как ожидается, будет запущено примерно через год, согласно сообщениям The Information.
Этот шаг OpenAI отражает более широкую тенденцию в технологическом секторе, где аудио должно стать основным интерфейсом, потенциально затмевающим доминирование экранов. Растущая распространенность умных колонок, которые сейчас есть более чем в трети домохозяйств США, демонстрирует растущее признание голосового взаимодействия.
Meta недавно представила функцию для своих умных очков Ray-Ban, которая использует массив из пяти микрофонов для повышения четкости разговора в шумной обстановке, эффективно превращая лицо пользователя в направленное устройство прослушивания. Google в июне начал эксперименты с Audio Overviews, преобразуя результаты поиска в разговорные сводки. Tesla интегрирует чат-бота Grok от xAI в свои автомобили, стремясь создать разговорного голосового помощника, способного управлять навигацией и климат-контролем посредством естественного языка.
Помимо этих признанных технологических гигантов, многочисленные стартапы также инвестируют в аудио-ИИ. Эти коллективные усилия предполагают будущее, в котором голосовые помощники и аудиоинтерфейсы будут все больше интегрироваться в повседневную жизнь. Последствия этого сдвига включают потенциальные изменения в том, как люди потребляют информацию, взаимодействуют с технологиями и управляют своими повседневными задачами. Разработка более сложного аудио-ИИ поднимает вопросы о конфиденциальности данных, доступности для людей с ограниченными возможностями и потенциале для новых форм цифрового взаимодействия.
Discussion
Join the conversation
Be the first to comment