Les modèles de reconnaissance vocale basés sur l'IA progressent, avec de nouvelles implémentations émergeant pour les applications natives et basées sur navigateur. Simultanément, une startup londonienne exploite l'IA pour révolutionner les transactions énergétiques, assurant un financement important pour son expansion. Ces développements mettent en évidence les progrès rapides et les diverses applications de l'intelligence artificielle dans divers secteurs.
Une implémentation purement Rust du modèle Voxtral Mini 4B Realtime de Mistral, appelée "voxtral-mini-realtime-rs", a été publiée sur GitHub, permettant la reconnaissance vocale en streaming nativement et dans le navigateur. Cette implémentation, utilisant le framework Burn ML, permet au chemin quantifié Q4 GGUF (2,5 Go) de s'exécuter entièrement côté client dans un onglet de navigateur via WASM WebGPU. Les utilisateurs peuvent l'essayer en direct, selon Hacker News (Source 1). Le projet propose un guide de démarrage rapide pour une utilisation CLI native, incluant le téléchargement des poids du modèle et la transcription de fichiers audio.
Un autre développement, une implémentation pure C du modèle Voxtral Realtime 4B de Mistral AI, a également été mis à disposition sur GitHub (Source 2). Cette implémentation n'a aucune dépendance externe au-delà de la bibliothèque standard C et inclut l'inférence MPS. Le traitement audio utilise un encodeur segmenté avec des fenêtres superposées, gérant l'utilisation de la mémoire quelle que soit la longueur de l'entrée. L'implémentation C permet également l'entrée audio depuis stdin ou la capture en direct du microphone, facilitant le transcodage et la transcription de divers formats. Une API C de streaming (voxstreamt) est incluse, permettant l'entrée audio incrémentielle et la sortie de chaînes de jetons.
Dans le secteur de l'énergie, la startup londonienne Tem a obtenu un financement de série B de 75 millions de dollars, valorisant l'entreprise à plus de 300 millions de dollars, selon TechCrunch (Source 5). Tem utilise l'IA pour optimiser les transactions énergétiques et dessert actuellement plus de 2 600 entreprises britanniques, offrant des économies potentielles sur les factures d'énergie. L'entreprise prévoit de s'étendre aux États-Unis et en Australie, en commençant par le Texas, avec l'objectif ultime d'entrer en bourse.
Ces développements surviennent dans un contexte plus large de progrès en matière d'IA. D'autres actualités incluent le déploiement de la vérification de l'âge globale de Discord, la sortie de bandes-annonces de divertissement et l'utilisation de sifflets imprimés en 3D (Source 4). Ces exemples démontrent l'impact de grande envergure de l'IA et des technologies connexes.
Discussion
AI Experts & Community
Be the first to comment