मायक्रोसॉफ्ट नवीन एआय मॉडेल्स रिलीझ करते जे प्रतिमा, ऑडिओ आणि मजकूर लिप्यंतरण करू शकतात

Published on

Posted by

Categories:


मायक्रोसॉफ्टने गुरुवारी तीन स्पेशलाइज्ड आर्टिफिशियल इंटेलिजन्स (एआय) मॉडेल जारी केले, ज्यामध्ये प्रतिमा निर्मिती, आवाज निर्मिती आणि स्पीच-टू-टेक्स्ट ट्रान्सक्रिप्शनवर लक्ष केंद्रित केले. रेडमंड-आधारित टेक जायंटचा दावा आहे की ही मॉडेल्स Google, OpenAI आणि इतर सारख्या प्रतिस्पर्धी कंपन्यांच्या विशेष मॉडेल्सपेक्षा जास्त कामगिरी करतात.

MAI-Transcribe-1, MAI-Voice-1, आणि MAI-Image-2 हे मॉडेल जलद जनरेशन आणि स्पर्धात्मक किंमतीवर लक्ष केंद्रित करतात. हे सध्या मायक्रोसॉफ्ट फाउंड्री द्वारे उपलब्ध आहेत आणि ते विविध ग्राहक उत्पादनांसाठी देखील आणले जात आहेत.

मायक्रोसॉफ्ट आणले तीन नवीन AI मॉडेल्स न्यूजरूम पोस्टमध्ये, टेक जायंटने तीन नवीन मोठ्या भाषा मॉडेल्स (LLMs) सादर केल्या. ते सर्व सध्या मायक्रोसॉफ्ट फाउंड्री आणि एमएआय प्लेग्राउंडद्वारे उपलब्ध आहेत.

सर्वात मोठे वैशिष्ट्य म्हणजे MAI-Transcribe-1, ज्याचा कंपनीचा दावा आहे की 25 सर्वाधिक वापरल्या जाणाऱ्या भाषांमध्ये अत्याधुनिक (SOTA) स्पीच-टू-टेक्स्ट ट्रान्सक्रिप्शन वितरित करते. हे दावे FLEURS बेंचमार्कवर मायक्रोसॉफ्टच्या अंतर्गत चाचणीवर आधारित आहेत.

हे मिथुन 3. 1 फ्लॅश आणि GPT-ट्रान्सक्राइब इन एरर रेटला मागे टाकते असे म्हटले जाते. याव्यतिरिक्त, कंपनी म्हणते की फाउंड्री वापरकर्त्यांना ते “कोणत्याही मोठ्या क्लाउड प्रदात्याचे सर्वोत्तम किंमत-कार्यप्रदर्शन असेल.

” MAI-Voice-1 वर येत असताना, LLM ने “नैसर्गिक, वास्तववादी भाषण, सूक्ष्मता, भावनिक श्रेणी आणि अभिव्यक्ती समृद्ध असल्याचे म्हटले आहे. ” मॉडेल लाँग-फॉर्म कंटेंट निर्मिती दरम्यान सुसंगत भाषण आणि आवाज ओळख प्रदान करते असे म्हटले जाते. फाउंड्रीमध्ये, मॉडेल वापरकर्त्यांना काही सेकंदांच्या ऑडिओसह सानुकूल आवाज तयार करण्यास देखील अनुमती देईल.

मायक्रोसॉफ्टचा दावा आहे की ही प्रक्रिया सुरक्षित आणि सुरक्षित आहे. एका सेकंदात ६० सेकंदांचा ऑडिओ जनरेट करतो असे म्हटले जाते.

विशेष म्हणजे, AI मॉडेल कॉपायलट ऑडिओ एक्स्प्रेशन्स आणि कॉपायलट पॉडकास्टला देखील पॉवर करेल. शेवटी, MAI-Image-2 मॉडेल त्याच्या पूर्ववर्तीच्या क्षमतेवर आधारित आहे आणि सुधारित आउटपुट गुणवत्ता जलद गतीने वितरीत करेल असे म्हटले जाते. मायक्रोसॉफ्टने उघड केले की मॉडेल छायाचित्रकार, डिझाइनर आणि व्हिज्युअल कथाकारांच्या सहकार्याने तयार केले गेले आहे आणि ते नैसर्गिक प्रकाश, अचूक पोत आणि स्पष्ट इन-इमेज मजकूर यावर लक्ष केंद्रित करते.

विशेष म्हणजे, AI मॉडेलचा अवलंब करणाऱ्या पहिल्या एंटरप्राइझ भागीदारांपैकी WPP आहे. मॉडेल, इतर दोन प्रमाणेच, मायक्रोसॉफ्ट फाउंड्री आणि MAI प्लेग्राउंडद्वारे उपलब्ध असेल. याव्यतिरिक्त, ते Copilot, Bing आणि PowerPoint वर देखील आणले जात आहे.