Modelos de reconhecimento de fala impulsionados por IA estão progredindo, com novas implementações surgindo tanto para aplicações nativas quanto baseadas em navegador. Simultaneamente, uma startup sediada em Londres está aproveitando a IA para revolucionar as transações de energia, garantindo financiamento significativo para expansão. Esses desenvolvimentos destacam os rápidos avanços e as diversas aplicações da inteligência artificial em vários setores.
Uma implementação pura em Rust do modelo Voxtral Mini 4B Realtime da Mistral, chamada "voxtral-mini-realtime-rs", foi lançada no GitHub, permitindo o reconhecimento de fala em streaming nativamente e no navegador. Essa implementação, usando o framework Burn ML, permite que o caminho quantizado Q4 GGUF (2,5 GB) seja executado inteiramente no lado do cliente em uma aba do navegador via WASM WebGPU. Os usuários podem experimentá-lo ao vivo, de acordo com o Hacker News (Fonte 1). O projeto oferece um guia de início rápido para uso nativo da CLI, incluindo o download de pesos de modelo e a transcrição de arquivos de áudio.
Outro desenvolvimento, uma implementação pura em C do modelo Voxtral Realtime 4B da Mistral AI, também foi disponibilizada no GitHub (Fonte 2). Essa implementação não possui dependências externas além da biblioteca padrão C e inclui inferência MPS. O processamento de áudio utiliza um codificador em blocos com janelas sobrepostas, gerenciando o uso de memória independentemente do comprimento da entrada. A implementação em C também permite a entrada de áudio de stdin ou captura de microfone ao vivo, facilitando a transcodificação e transcrição de vários formatos. Uma API C de streaming (voxstreamt) está incluída, permitindo a entrada incremental de áudio e a saída de strings de tokens.
No setor de energia, a startup londrina Tem garantiu uma rodada de financiamento Série B de $75 milhões, avaliando a empresa em mais de $300 milhões, de acordo com a TechCrunch (Fonte 5). A Tem usa IA para otimizar as transações de energia e atualmente atende mais de 2.600 empresas no Reino Unido, oferecendo potenciais economias nas contas de energia. A empresa planeja expandir para os EUA e Austrália, começando pelo Texas, com o objetivo final de abrir o capital.
Esses desenvolvimentos ocorrem em meio a um cenário mais amplo de avanços em IA. Outras notícias incluem a implantação global de verificação de idade do Discord, o lançamento de trailers de entretenimento e o uso de apitos impressos em 3D (Fonte 4). Esses exemplos demonstram o impacto de amplo alcance da IA e tecnologias relacionadas.
Discussion
AI Experts & Community
Be the first to comment