Прогресс в области искусственного интеллекта значительно улучшил технологию приложений для диктовки, что привело к резкому росту их популярности к 2025 году. Исторически сложилось так, что приложения для диктовки испытывали трудности с точностью и скоростью, часто требуя от пользователей говорить с определенным акцентом и четкой дикцией. Однако недавние прорывы в больших языковых моделях (LLM) и моделях преобразования речи в текст позволили этим системам лучше расшифровывать речь, сохраняя при этом контекстное понимание для улучшения форматирования текста.
Разработчики интегрировали функции, которые автоматически форматируют текст, удаляют слова-паразиты и игнорируют запинки, что приводит к более чистому и отшлифованному результату, требующему меньшего редактирования. Повышенная доступность и эффективность этих инструментов на базе искусственного интеллекта привели к распространению приложений для диктовки на рынке.
Одним из заметных примеров является Wispr Flow, хорошо финансируемое приложение для диктовки с использованием искусственного интеллекта, разработанное для того, чтобы пользователи могли добавлять собственные слова и инструкции. Wispr Flow предлагает собственные приложения для MacOS, Windows и iOS, а версия для Android в настоящее время находится в разработке. Приложение позволяет пользователям настраивать транскрипции, выбирая из формального, неформального и очень неформального стилей, адаптированных к различным потребностям письма, таким как личные сообщения, деловая переписка и составление электронных писем. Компания также рекламирует свою совместимость с инструментами vibe coding, такими как Cursor.
Discussion
Join the conversation
Be the first to comment