Los modelos de reconocimiento de voz impulsados por IA están avanzando, con nuevas implementaciones que surgen tanto para aplicaciones nativas como basadas en navegador. Simultáneamente, una startup con sede en Londres está aprovechando la IA para revolucionar las transacciones energéticas, asegurando una financiación significativa para su expansión. Estos desarrollos resaltan los rápidos avances y las diversas aplicaciones de la inteligencia artificial en varios sectores.
Una implementación pura en Rust del modelo Voxtral Mini 4B Realtime de Mistral, llamada "voxtral-mini-realtime-rs", fue lanzada en GitHub, permitiendo el reconocimiento de voz en streaming de forma nativa y en el navegador. Esta implementación, que utiliza el framework Burn ML, permite que la ruta cuantificada Q4 GGUF (2.5 GB) se ejecute completamente en el lado del cliente en una pestaña del navegador a través de WASM WebGPU. Los usuarios pueden probarlo en vivo, según Hacker News (Fuente 1). El proyecto ofrece una guía de inicio rápido para el uso nativo de la CLI, incluyendo la descarga de los pesos del modelo y la transcripción de archivos de audio.
Otro desarrollo, una implementación pura en C del modelo Voxtral Realtime 4B de Mistral AI, también fue puesto a disposición en GitHub (Fuente 2). Esta implementación no tiene dependencias externas más allá de la biblioteca estándar de C e incluye inferencia MPS. El procesamiento de audio utiliza un codificador en trozos con ventanas superpuestas, gestionando el uso de la memoria independientemente de la longitud de la entrada. La implementación en C también permite la entrada de audio desde stdin o la captura de micrófono en vivo, facilitando la transcodificación y transcripción de varios formatos. Se incluye una API de streaming en C (voxstreamt), que permite la entrada incremental de audio y la salida de cadenas de tokens.
En el sector energético, la startup londinense Tem aseguró una ronda de financiación Serie B de 75 millones de dólares, valorando la empresa en más de 300 millones de dólares, según TechCrunch (Fuente 5). Tem utiliza la IA para optimizar las transacciones energéticas y actualmente presta servicio a más de 2.600 empresas del Reino Unido, ofreciendo posibles ahorros en las facturas de energía. La empresa planea expandirse a Estados Unidos y Australia, comenzando por Texas, con el objetivo final de salir a bolsa.
Estos desarrollos se producen en medio de un panorama más amplio de avances en IA. Otras noticias incluyen el despliegue global de la verificación de edad de Discord, el lanzamiento de tráilers de entretenimiento y el uso de silbatos impresos en 3D (Fuente 4). Estos ejemplos demuestran el amplio impacto de la IA y las tecnologías relacionadas.
Discussion
AI Experts & Community
Be the first to comment