மைக்ரோசாப்ட் புதிய AI மாதிரிகளை வெளியிடுகிறது, அவை படங்கள், ஆடியோ மற்றும் உரையை எழுதலாம்

Published on

Posted by

Categories:


மைக்ரோசாப்ட் வியாழக்கிழமை மூன்று சிறப்பு செயற்கை நுண்ணறிவு (AI) மாதிரிகளை வெளியிட்டது, இது படத்தை உருவாக்குதல், குரல் உருவாக்கம் மற்றும் பேச்சு-க்கு-உரை டிரான்ஸ்கிரிப்ஷன் ஆகியவற்றில் கவனம் செலுத்துகிறது. Redmond-ஐ அடிப்படையாகக் கொண்ட தொழில்நுட்ப நிறுவனமான இந்த மாதிரிகள் Google, OpenAI மற்றும் பிற போட்டி நிறுவனங்களின் சிறப்பு மாடல்களை விட சிறப்பாக செயல்படுகின்றன என்று கூறுகிறது.

MAI-Transcribe-1, MAI-Voice-1 மற்றும் MAI-Image-2 ஆகிய மாடல்கள், வேகமான உற்பத்தி மற்றும் போட்டி விலை நிர்ணயம் ஆகியவற்றில் கவனம் செலுத்துவதாகவும் கூறப்படுகிறது. இவை தற்போது மைக்ரோசாஃப்ட் ஃபவுண்டரி வழியாகக் கிடைக்கின்றன, மேலும் அவை பல்வேறு நுகர்வோர் தயாரிப்புகளுக்கும் வெளியிடப்படுகின்றன.

மைக்ரோசாப்ட் மூன்று புதிய AI மாடல்களைக் கொண்டுவருகிறது. அவை அனைத்தும் தற்போது மைக்ரோசாஃப்ட் ஃபவுண்டரி மற்றும் MAI விளையாட்டு மைதானம் வழியாகக் கிடைக்கின்றன.

MAI-Transcribe-1 என்பது மிகப்பெரிய சிறப்பம்சமாகும், இது 25 அதிகம் பயன்படுத்தப்படும் மொழிகளில் அதிநவீன (SOTA) பேச்சு-க்கு-உரை டிரான்ஸ்கிரிப்ஷனை வழங்குவதாக நிறுவனம் கூறுகிறது. உரிமைகோரல்கள் FLEURS அளவுகோலில் மைக்ரோசாப்ட் இன் உள் சோதனையை அடிப்படையாகக் கொண்டவை.

இது ஜெமினி 3. 1 ஃப்ளாஷ் மற்றும் GPT-டிரான்ஸ்கிரிப் ஆகியவற்றை பிழை விகிதத்தில் மிஞ்சும் என்று கூறப்படுகிறது. கூடுதலாக, ஃபவுண்டரி பயனர்கள் இதை “எந்தவொரு பெரிய கிளவுட் வழங்குநரின் சிறந்த விலை-செயல்திறன்” என்று கண்டுபிடிப்பார்கள் என்று நிறுவனம் கூறுகிறது.

” MAI-Voice-1 க்கு வரும்போது, ​​LLM ஆனது “இயற்கையான, யதார்த்தமான பேச்சு, நுணுக்கம், உணர்ச்சி வீச்சு மற்றும் வெளிப்பாடு ஆகியவற்றால் நிறைந்தது. ” இந்த மாடல் நீண்ட வடிவ உள்ளடக்கத்தை உருவாக்கும் போது நிலையான பேச்சு மற்றும் குரல் அடையாளத்தை வழங்குவதாகவும் கூறப்படுகிறது. ஃபவுண்டரியின் உள்ளே, சில வினாடிகள் ஆடியோவுடன் தனிப்பயன் குரலை உருவாக்க பயனர்களை மாடல் அனுமதிக்கும்.

இந்த செயல்முறை பாதுகாப்பானது மற்றும் பாதுகாப்பானது என்று மைக்ரோசாப்ட் கூறுகிறது. இது ஒரு நொடியில் 60 வினாடிகள் ஆடியோவை உருவாக்கும் என்று கூறப்படுகிறது.

குறிப்பாக, AI மாடல் Copilot ஆடியோ எக்ஸ்பிரஷன்கள் மற்றும் Copilot பாட்காஸ்ட்களையும் ஆற்றும். இறுதியாக, MAI-Image-2 மாடல் அதன் முன்னோடிகளின் திறன்களை உருவாக்குகிறது மற்றும் வேகமான வேகத்தில் மேம்படுத்தப்பட்ட வெளியீட்டு தரத்தை வழங்கும் என்று கூறப்படுகிறது. புகைப்படக் கலைஞர்கள், வடிவமைப்பாளர்கள் மற்றும் காட்சிக் கதைசொல்லிகள் ஆகியோருடன் இணைந்து இந்த மாடல் உருவாக்கப்பட்டதாக மைக்ரோசாப்ட் வெளிப்படுத்தியது, மேலும் இது இயற்கையான விளக்குகள், துல்லியமான கட்டமைப்புகள் மற்றும் தெளிவான படத்தில் உள்ள உரை ஆகியவற்றில் கவனம் செலுத்துகிறது.

AI மாதிரியை ஏற்றுக்கொண்ட முதல் நிறுவன கூட்டாளர்களில் WPP என்பது குறிப்பிடத்தக்கது. மற்ற இரண்டைப் போலவே இந்த மாடல் மைக்ரோசாஃப்ட் ஃபவுண்டரி மற்றும் MAI பிளேகிரவுண்ட் வழியாகக் கிடைக்கும். கூடுதலாக, இது Copilot, Bing மற்றும் PowerPoint ஆகியவற்றிலும் வெளிவருகிறது.