महत्वपूर्ण नियम:
1. मूल स्वर, शैली और अर्थ को बनाए रखें
2. किसी भी HTML टैग या मार्कडाउन स्वरूपण को ठीक वैसे ही संरक्षित करें जैसे वे हैं
3. तकनीकी शब्दों को सटीक रखें
4. हिन्दी भाषी लोगों के लिए सांस्कृतिक उपयुक्तता सुनिश्चित करें
5. केवल अनुवाद लौटाएँ - कोई स्पष्टीकरण नहीं, कोई उपसर्ग नहीं, कोई उद्धरण नहीं
6. "यहाँ अनुवाद है:" या "अनुवाद:" जैसे वाक्यांश न जोड़ें
7. अनुवाद को उद्धरण चिह्नों में न लपेटें
AI-संचालित भाषण पहचान मॉडल प्रगति कर रहे हैं, देशी और ब्राउज़र-आधारित दोनों अनुप्रयोगों के लिए नए कार्यान्वयन सामने आ रहे हैं। साथ ही, लंदन स्थित एक स्टार्टअप ऊर्जा लेनदेन में क्रांति लाने के लिए AI का लाभ उठा रहा है, जो विस्तार के लिए महत्वपूर्ण धन सुरक्षित कर रहा है। ये घटनाक्रम विभिन्न क्षेत्रों में कृत्रिम बुद्धिमत्ता की तेजी से प्रगति और विविध अनुप्रयोगों को उजागर करते हैं।
मिस्ट्रल के Voxtral Mini 4B रियलटाइम मॉडल का एक शुद्ध रस्ट कार्यान्वयन, जिसे "voxtral-mini-realtime-rs" कहा जाता है, GitHub पर जारी किया गया था, जो देशी और ब्राउज़र में स्ट्रीमिंग भाषण पहचान की अनुमति देता है। यह कार्यान्वयन, बर्न एमएल फ्रेमवर्क का उपयोग करते हुए, Q4 GGUF क्वांटाइज्ड पथ (2.5 GB) को WASM WebGPU के माध्यम से पूरी तरह से क्लाइंट-साइड में ब्राउज़र टैब में चलाने में सक्षम बनाता है। उपयोगकर्ता इसे लाइव आज़मा सकते हैं, जैसा कि हैकर न्यूज़ (स्रोत 1) के अनुसार बताया गया है। परियोजना देशी CLI उपयोग के लिए एक त्वरित आरंभ मार्गदर्शिका प्रदान करती है, जिसमें मॉडल वेट डाउनलोड करना और ऑडियो फ़ाइलों को ट्रांसक्राइब करना शामिल है।
एक अन्य विकास, मिस्ट्रल AI के Voxtral Realtime 4B मॉडल का एक शुद्ध C कार्यान्वयन भी GitHub पर उपलब्ध कराया गया था (स्रोत 2)। इस कार्यान्वयन में C मानक लाइब्रेरी के अलावा शून्य बाहरी निर्भरताएँ हैं और इसमें MPS अनुमान शामिल है। ऑडियो प्रोसेसिंग ओवरलैपिंग विंडोज़ के साथ एक चंक्ड एन्कोडर का उपयोग करता है, जो इनपुट लंबाई की परवाह किए बिना मेमोरी उपयोग का प्रबंधन करता है। C कार्यान्वयन stdin से या लाइव माइक्रोफ़ोन कैप्चर से ऑडियो इनपुट की भी अनुमति देता है, जिससे विभिन्न स्वरूपों को ट्रांसकोड और ट्रांसक्राइब करना आसान हो जाता है। एक स्ट्रीमिंग C API (voxstreamt) शामिल है, जो वृद्धिशील ऑडियो इनपुट और टोकन स्ट्रिंग आउटपुट की अनुमति देता है।
ऊर्जा क्षेत्र में, लंदन स्थित स्टार्टअप टेम ने $75 मिलियन की सीरीज बी फंडिंग राउंड हासिल की, जिससे कंपनी का मूल्यांकन $300 मिलियन से अधिक हो गया, जैसा कि टेकक्रंच (स्रोत 5) के अनुसार बताया गया है। टेम ऊर्जा लेनदेन को अनुकूलित करने के लिए AI का उपयोग करता है और वर्तमान में 2,600 से अधिक यूके व्यवसायों को सेवा प्रदान करता है, जो संभावित ऊर्जा बिल बचत प्रदान करता है। कंपनी टेक्सास से शुरुआत करते हुए, अमेरिका और ऑस्ट्रेलिया में विस्तार करने की योजना बना रही है, जिसका अंतिम लक्ष्य सार्वजनिक होना है।
ये घटनाक्रम AI की प्रगति के व्यापक परिदृश्य के बीच आए हैं। अन्य समाचारों में डिस्कॉर्ड का वैश्विक आयु सत्यापन रोलआउट, मनोरंजन ट्रेलरों का रिलीज़ और 3D-मुद्रित सीटी का उपयोग शामिल है (स्रोत 4)। ये उदाहरण AI और संबंधित तकनीकों के व्यापक प्रभाव को दर्शाते हैं।
Discussion
AI Experts & Community
Be the first to comment