मेटा का नया एमएमएस मॉडल एआई के साथ दुनिया की भाषाओं को बचाना चाहता है

[ad_1]

अधिकांश अन्य बड़ी तकनीकी कंपनियों की तरह, मेटा आर्टिफिशियल इंटेलिजेंस (एआई) पर बड़ा दांव लगा रहा है। कंपनी का दृष्टिकोण की पसंद से थोड़ा अलग रहा है गूगल और माइक्रोसॉफ्ट. मेटा ने दुनिया की भाषाओं को संरक्षित करने के उद्देश्य से एक नए बड़े भाषा मॉडल (एलएलएम) का अनावरण किया। व्यापक रूप से बहुभाषी भाषण कहा जाता है (एमएमएस), मॉडल “टेक्स्ट-टू-स्पीच और स्पीच-टू-टेक्स्ट तकनीक को लगभग 100 भाषाओं से 1,100 से अधिक तक विस्तारित करता है – पहले की तुलना में 10 गुना अधिक – और 4,000 से अधिक बोली जाने वाली भाषाओं की पहचान भी कर सकता है, 40 गुना अधिक पहले।”
मॉडल का इस्तेमाल कैसे होगा?
मेटा द्वारा एक ब्लॉग पोस्ट के अनुसार, दुनिया की कई भाषाएँ लुप्त होने के खतरे में हैं, और वर्तमान वाक् पहचान और पीढ़ी तकनीक की सीमाएँ इस प्रवृत्ति को और तेज़ करेंगी। कंपनी ने ब्लॉग में कहा, “हम लोगों के लिए अपनी पसंदीदा भाषा में सूचनाओं तक पहुंच और उपकरणों का उपयोग करना आसान बनाना चाहते हैं और आज हम आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल की एक श्रृंखला की घोषणा कर रहे हैं जो उन्हें ऐसा करने में मदद कर सकती है।” डाक।
मॉडल कैसे काम करेगा
मेटा ने कहा कि सबसे बड़ी चुनौती हजारों भाषाओं के लिए ऑडियो डेटा एकत्र करना था। सबसे बड़ा मौजूदा भाषण डेटासेट अधिकतम 100 भाषाओं को कवर करता है, मेटा समझाया गया। उदाहरण के लिए, बाइबिल जैसे धार्मिक ग्रंथों का कई अलग-अलग भाषाओं में अनुवाद किया गया है और जिनके अनुवादों का पाठ-आधारित भाषा अनुवाद अनुसंधान के लिए व्यापक रूप से अध्ययन किया गया है। मेटा में इन अनुवादों में विभिन्न भाषाओं में इन ग्रंथों को पढ़ने वाले लोगों की ऑडियो रिकॉर्डिंग सार्वजनिक रूप से उपलब्ध थी। कंपनी ने कहा, “एमएमएस प्रोजेक्ट के हिस्से के रूप में, हमने 1,100 से अधिक भाषाओं में न्यू टेस्टामेंट के रीडिंग का डेटासेट बनाया, जो प्रति भाषा औसतन 32 घंटे डेटा प्रदान करता है।”
मेटा ने तब कई अन्य ईसाई धार्मिक रीडिंग के लेबल रहित रिकॉर्डिंग पर विचार किया और 4,000 से अधिक उपलब्ध भाषाओं की संख्या में वृद्धि की। “हालांकि यह डेटा एक विशिष्ट डोमेन से है और अक्सर पुरुष वक्ताओं द्वारा पढ़ा जाता है, हमारे विश्लेषण से पता चलता है कि हमारे मॉडल पुरुष और महिला आवाजों के लिए समान रूप से अच्छा प्रदर्शन करते हैं। और जबकि ऑडियो रिकॉर्डिंग की सामग्री धार्मिक है, हमारे विश्लेषण से पता चलता है कि यह मॉडल को और अधिक धार्मिक भाषा बनाने के लिए पक्षपात नहीं करता है,” कंपनी ने कहा।



[ad_2]

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *