మైక్రోసాఫ్ట్ గురువారం మూడు ప్రత్యేక కృత్రిమ మేధస్సు (AI) మోడళ్లను విడుదల చేసింది, ఇమేజ్ ఉత్పత్తి, వాయిస్ ఉత్పత్తి మరియు స్పీచ్-టు-టెక్స్ట్ ట్రాన్స్క్రిప్షన్పై దృష్టి సారించింది. Redmond-ఆధారిత టెక్ దిగ్గజం ఈ మోడల్లు Google, OpenAI మరియు ఇతర ప్రత్యర్థి కంపెనీల నుండి ప్రత్యేక మోడల్లను అధిగమిస్తాయని పేర్కొంది.
మోడల్స్, MAI-Transcribe-1, MAI-Voice-1, మరియు MAI-Image-2 కూడా ఫాస్ట్ జనరేషన్ మరియు పోటీ ధరలపై దృష్టి సారించాయి. ఇవి ప్రస్తుతం మైక్రోసాఫ్ట్ ఫౌండ్రీ ద్వారా అందుబాటులో ఉన్నాయి మరియు అవి వివిధ వినియోగదారు ఉత్పత్తులకు కూడా విస్తరించబడుతున్నాయి.
మైక్రోసాఫ్ట్ మూడు కొత్త AI మోడల్లను తీసుకువస్తుంది ఒక న్యూస్రూమ్ పోస్ట్లో, టెక్ దిగ్గజం మూడు కొత్త పెద్ద భాషా నమూనాలను (LLMలు) పరిచయం చేసింది. అవన్నీ ప్రస్తుతం మైక్రోసాఫ్ట్ ఫౌండ్రీ మరియు MAI ప్లేగ్రౌండ్ ద్వారా అందుబాటులో ఉన్నాయి.
అతిపెద్ద హైలైట్ MAI-Transcribe-1, ఇది అత్యధికంగా ఉపయోగించే 25 భాషల్లో స్టేట్-ఆఫ్-ది-ఆర్ట్ (SOTA) స్పీచ్-టు-టెక్స్ట్ ట్రాన్స్క్రిప్షన్ను అందజేస్తుందని కంపెనీ పేర్కొంది. క్లెయిమ్లు FLEURS బెంచ్మార్క్పై Microsoft యొక్క అంతర్గత పరీక్షపై ఆధారపడి ఉంటాయి.
ఇది జెమిని 3. 1 ఫ్లాష్ మరియు GPT-ట్రాన్స్క్రైబ్ను ఎర్రర్ రేట్లో అధిగమించిందని చెప్పబడింది. అదనంగా, కంపెనీ ఫౌండ్రీ వినియోగదారులు దీనిని “ఏదైనా పెద్ద క్లౌడ్ ప్రొవైడర్ యొక్క ఉత్తమ ధర-పనితీరు”గా కనుగొంటారు.
“MAI-వాయిస్-1కి వస్తున్నప్పుడు, LLM “సహజమైన, వాస్తవిక ప్రసంగం, సూక్ష్మభేదం, భావోద్వేగ పరిధి మరియు వ్యక్తీకరణతో సమృద్ధిగా ఉంటుంది. ” మోడల్ లాంగ్-ఫారమ్ కంటెంట్ జనరేషన్ సమయంలో స్థిరమైన ప్రసంగం మరియు వాయిస్ గుర్తింపును అందజేస్తుందని కూడా చెప్పబడింది.ఫౌండ్రీ లోపల, మోడల్ కొన్ని సెకన్ల ఆడియోతో అనుకూల వాయిస్ని సృష్టించడానికి వినియోగదారులను అనుమతిస్తుంది.
ఈ ప్రక్రియ సురక్షితమైనది మరియు సురక్షితమైనదని Microsoft పేర్కొంది. ఇది ఒక్క సెకనులో 60 సెకన్ల ఆడియోను ఉత్పత్తి చేస్తుందని చెప్పారు.
ముఖ్యంగా, AI మోడల్ కోపిలట్ ఆడియో ఎక్స్ప్రెషన్స్ మరియు కోపైలట్ పాడ్క్యాస్ట్లను కూడా పవర్ చేస్తుంది. చివరగా, MAI-Image-2 మోడల్ దాని పూర్వీకుల సామర్థ్యాలపై రూపొందించబడింది మరియు మెరుగైన అవుట్పుట్ నాణ్యతను వేగవంతమైన వేగంతో అందజేస్తుందని చెప్పబడింది. ఫోటోగ్రాఫర్లు, డిజైనర్లు మరియు విజువల్ స్టోరీటెల్లర్ల సహకారంతో ఈ మోడల్ రూపొందించబడిందని మైక్రోసాఫ్ట్ వెల్లడించింది మరియు ఇది సహజమైన లైటింగ్, ఖచ్చితమైన అల్లికలు మరియు స్పష్టమైన ఇన్-ఇమేజ్ టెక్స్ట్పై దృష్టి పెడుతుంది.
ముఖ్యంగా, AI మోడల్ను స్వీకరించిన మొదటి ఎంటర్ప్రైజ్ భాగస్వాములలో WPP ఒకటి. ఈ మోడల్, ఇతర రెండు మాదిరిగానే, మైక్రోసాఫ్ట్ ఫౌండ్రీ మరియు MAI ప్లేగ్రౌండ్ ద్వారా అందుబాటులో ఉంటుంది. అదనంగా, ఇది Copilot, Bing మరియు PowerPointకి కూడా విడుదల చేయబడుతోంది.


