माइक्रोसॉफ्ट ने नए एआई मॉडल जारी किए हैं जो चित्र, ऑडियो उत्पन्न कर सकते हैं और टेक्स्ट को ट्रांसक्राइब कर सकते हैं

Published on

Posted by

Categories:


माइक्रोसॉफ्ट ने गुरुवार को तीन विशेष कृत्रिम बुद्धिमत्ता (एआई) मॉडल जारी किए, जो छवि निर्माण, आवाज निर्माण और भाषण-से-पाठ प्रतिलेखन पर ध्यान केंद्रित करते हैं। रेडमंड स्थित तकनीकी दिग्गज का दावा है कि ये मॉडल Google, OpenAI और अन्य जैसी प्रतिद्वंद्वी कंपनियों के विशेष मॉडलों से बेहतर प्रदर्शन करते हैं।

कहा जाता है कि मॉडल, एमएआई-ट्रांसक्राइब-1, एमएआई-वॉयस-1 और एमएआई-इमेज-2 भी तेज पीढ़ी और प्रतिस्पर्धी मूल्य निर्धारण पर ध्यान केंद्रित करते हैं। ये वर्तमान में माइक्रोसॉफ्ट फाउंड्री के माध्यम से उपलब्ध हैं, और इन्हें विभिन्न उपभोक्ता उत्पादों के लिए भी पेश किया जा रहा है।

माइक्रोसॉफ्ट तीन नए एआई मॉडल लेकर आया है एक न्यूज रूम पोस्ट में, टेक दिग्गज ने तीन नए बड़े भाषा मॉडल (एलएलएम) पेश किए हैं। ये सभी वर्तमान में माइक्रोसॉफ्ट फाउंड्री और एमएआई प्लेग्राउंड के माध्यम से उपलब्ध हैं।

सबसे बड़ा आकर्षण MAI-Transcribe-1 है, जिसके बारे में कंपनी का दावा है कि यह 25 सबसे अधिक इस्तेमाल की जाने वाली भाषाओं में अत्याधुनिक (SOTA) स्पीच-टू-टेक्स्ट ट्रांसक्रिप्शन प्रदान करता है। ये दावे FLEURS बेंचमार्क पर Microsoft के आंतरिक परीक्षण पर आधारित हैं।

ऐसा कहा जाता है कि त्रुटि दर में यह जेमिनी 3.1 फ्लैश और जीपीटी-ट्रांसक्राइब से बेहतर प्रदर्शन करता है। इसके अतिरिक्त, कंपनी का कहना है कि फाउंड्री उपयोगकर्ता इसे “किसी भी बड़े क्लाउड प्रदाता का सर्वोत्तम मूल्य-प्रदर्शन” मानेंगे।

एमएआई-वॉयस-1 की बात करें तो, एलएलएम के बारे में कहा जाता है कि यह “प्राकृतिक, यथार्थवादी भाषण, बारीकियों, भावनात्मक सीमा और अभिव्यक्ति से समृद्ध है।” यह भी कहा जाता है कि मॉडल लंबे समय तक सामग्री निर्माण के दौरान लगातार भाषण और आवाज की पहचान प्रदान करता है। फाउंड्री के अंदर, मॉडल उपयोगकर्ताओं को कुछ सेकंड के ऑडियो के साथ एक कस्टम आवाज बनाने की भी अनुमति देगा।

माइक्रोसॉफ्ट का दावा है कि यह प्रक्रिया सुरक्षित है. ऐसा कहा जाता है कि यह एक सेकंड में 60 सेकंड का ऑडियो जेनरेट करता है।

विशेष रूप से, एआई मॉडल कोपायलट ऑडियो एक्सप्रेशंस और कोपायलट पॉडकास्ट को भी पावर देगा। अंत में, MAI-Image-2 मॉडल अपने पूर्ववर्ती की क्षमताओं पर आधारित है और कहा जाता है कि यह तेज गति से बेहतर आउटपुट गुणवत्ता प्रदान करता है। माइक्रोसॉफ्ट ने खुलासा किया कि मॉडल फोटोग्राफरों, डिजाइनरों और दृश्य कथाकारों के सहयोग से बनाया गया था, और यह प्राकृतिक प्रकाश व्यवस्था, सटीक बनावट और स्पष्ट इन-इमेज टेक्स्ट पर केंद्रित है।

विशेष रूप से, WPP AI मॉडल को अपनाने वाले पहले उद्यम भागीदारों में से एक है। मॉडल, अन्य दो के समान, माइक्रोसॉफ्ट फाउंड्री और एमएआई प्लेग्राउंड के माध्यम से उपलब्ध होगा। इसके अतिरिक्त, इसे कोपायलट, बिंग और पॉवरपॉइंट पर भी जारी किया जा रहा है।