KI-gestützte Spracherkennungsmodelle machen Fortschritte, wobei neue Implementierungen sowohl für native als auch für browserbasierte Anwendungen entstehen. Gleichzeitig nutzt ein in London ansässiges Startup KI, um Energietransaktionen zu revolutionieren, und sichert sich erhebliche Finanzmittel für die Expansion. Diese Entwicklungen unterstreichen die raschen Fortschritte und vielfältigen Anwendungen der künstlichen Intelligenz in verschiedenen Sektoren.
Eine reine Rust-Implementierung von Mistrals Voxtral Mini 4B Realtime-Modell, genannt "voxtral-mini-realtime-rs", wurde auf GitHub veröffentlicht und ermöglicht Streaming-Spracherkennung nativ und im Browser. Diese Implementierung, die das Burn ML-Framework verwendet, ermöglicht es, dass der Q4 GGUF quantisierte Pfad (2,5 GB) vollständig clientseitig in einem Browser-Tab über WASM WebGPU ausgeführt wird. Benutzer können es live ausprobieren, so Hacker News (Quelle 1). Das Projekt bietet eine Schnellstartanleitung für die native CLI-Nutzung, einschließlich des Herunterladens von Modellgewichten und der Transkription von Audiodateien.
Eine weitere Entwicklung, eine reine C-Implementierung des Mistral AI Voxtral Realtime 4B Modells, wurde ebenfalls auf GitHub verfügbar gemacht (Quelle 2). Diese Implementierung hat keine externen Abhängigkeiten außer der C-Standardbibliothek und beinhaltet MPS-Inferenz. Die Audioverarbeitung verwendet einen Chunked-Encoder mit überlappenden Fenstern, der die Speichernutzung unabhängig von der Eingabelänge verwaltet. Die C-Implementierung ermöglicht auch Audioeingaben von stdin oder Live-Mikrofonaufnahmen, wodurch es einfach ist, verschiedene Formate zu transkodieren und zu transkribieren. Eine Streaming-C-API (voxstreamt) ist enthalten, die eine inkrementelle Audioeingabe und Token-String-Ausgabe ermöglicht.
Im Energiesektor sicherte sich das in London ansässige Startup Tem eine Finanzierungsrunde der Serie B in Höhe von 75 Millionen US-Dollar, wodurch das Unternehmen laut TechCrunch (Quelle 5) mit über 300 Millionen US-Dollar bewertet wird. Tem verwendet KI, um Energietransaktionen zu optimieren und bedient derzeit über 2.600 britische Unternehmen, was potenzielle Einsparungen bei den Energierechnungen bietet. Das Unternehmen plant, in die USA und Australien zu expandieren, beginnend mit Texas, mit dem letztendlichen Ziel, an die Börse zu gehen.
Diese Entwicklungen erfolgen inmitten einer breiteren Landschaft von KI-Fortschritten. Weitere Nachrichten umfassen die globale Altersverifizierung von Discord, die Veröffentlichung von Unterhaltungstrailern und die Verwendung von 3D-gedruckten Pfeifen (Quelle 4). Diese Beispiele zeigen die weitreichenden Auswirkungen von KI und verwandten Technologien.
Discussion
AI Experts & Community
Be the first to comment