[ad_1]
माइक्रोसॉफ्ट का प्रोजेक्ट एलोरा
‘दुर्लभ’ भारतीय भाषाओं को ऑनलाइन लाने के लिए, माइक्रोसॉफ्ट 2015 में परियोजना एलोरा या कम संसाधन भाषाओं को सक्षम करना शुरू किया। परियोजना के तहत, शोधकर्ता भाषाओं के डिजिटल संसाधनों का निर्माण कर रहे हैं। वे कहते हैं कि उनका उद्देश्य आने वाली पीढ़ियों के लिए एक भाषा को संरक्षित करना है ताकि इन भाषाओं के उपयोगकर्ता “डिजिटल दुनिया में भाग ले सकें और बातचीत कर सकें।”
एलोरा भाषा डेटासेट कैसे बना रहा है?
शोधकर्ता अपने एआई मॉडल को प्रशिक्षित करने के लिए डेटासेट बनाने के लिए मुद्रित साहित्य सहित संसाधनों की मैपिंग कर रहे हैं। टीम इन समुदायों के साथ परियोजना पर भी काम कर रही है, माइक्रोसॉफ्ट ने कहा।
“डेटा संग्रह प्रक्रिया में समुदाय को शामिल करके, वे [researchers] एक ऐसा डेटासेट बनाने की उम्मीद है जो सटीक और सांस्कृतिक रूप से प्रासंगिक हो,” कंपनी ने कहा।
माइक्रोसॉफ्ट मुंडास के साथ काम कर रहा है
Microsoft वर्तमान में झारखंड, उड़ीसा और पश्चिम बंगाल के पूर्वी भारतीय राज्यों में फैले लगभग दस लाख लोगों के मुंडा समुदाय के साथ काम कर रहा है।
समुदाय मुंदरी बोलता है, हालांकि, माइक्रोसॉफ्ट के शोधकर्ताओं के अनुसार, समुदाय अपनी भाषा की लंबी उम्र के बारे में चिंतित है क्योंकि स्कूलों में बच्चों को केवल बंगाली, हिंदी और उड़िया जैसी प्रमुख भाषाएं सिखाई जाती हैं।
भारत में MSR लैब के मुट्ठी भर शोधकर्ता मुंडारी जैसी भाषाओं के लिए डिजिटल इकोसिस्टम बनाने की दिशा में काम कर रहे हैं, जिनकी एक लिखित स्क्रिप्ट है लेकिन डिजिटल दुनिया में पर्याप्त उपस्थिति नहीं है।
इंटरनेट की भाषा अंग्रेजी है
अंग्रेजी अपने शुरुआती वर्षों से ही इंटरनेट की भाषा रही है। हालात में सुधार हुआ और अब दुनिया भर में लगभग 6,000 भाषाओं में से आठ ऐसी हैं जिन्हें ऑनलाइन पसंद किया जाता है। इसका मतलब है कि दुनिया की 88% भाषाओं की इंटरनेट पर पर्याप्त उपस्थिति नहीं है। इसका मतलब यह भी है कि 1.2 अरब लोग, जो दुनिया की आबादी का 20% है, डिजिटल दुनिया को नेविगेट करने के लिए अपनी भाषा का उपयोग नहीं कर सकते हैं।
हिन्दी से मुंडारी : कार्य प्रगति पर है
माइक्रोसॉफ्ट का कहना है कि उसकी शोध टीम वर्तमान में हिंदी से मुंडारी पाठ अनुवाद के साथ-साथ एक वाक् पहचान मॉडल पर काम कर रही है जो समुदाय को मुंडारी में अधिक सामग्री तक पहुंच प्रदान करेगा।
Microsoft ने कहा कि उसके शोधकर्ताओं ने 2018 में IIT खड़गपुर के साथ सहयोग किया “और यह पता लगाने के लिए एक अध्ययन प्रायोजित किया कि भाषा को जीवित रखने के लिए समुदाय को क्या चाहिए।”
वे एक टेक्स्ट-टू-स्पीच मॉडल भी बना रहे हैं जिसमें मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए महत्वपूर्ण डिजिटल सामग्री नहीं है। IIT खड़गपुर के प्रोफेसरों ने शुरू में समुदाय के सदस्यों के साथ काम किया ताकि उन्हें हिंदी से मुंडारी में मैन्युअल रूप से वाक्यों का अनुवाद करने में मदद मिल सके। भाषण संग्रह कार्य ऐप का उपयोग कर स्मार्टफोन पर किया जाता है।
शोधकर्ताओं ने इंटरन्यूरल मशीन ट्रांसलेशन (आईएनएमटी) नामक नई तकनीक भी विकसित की है, जो अगले शब्द की भविष्यवाणी करने में मदद करती है जब कोई भाषा के बीच अनुवाद कर रहा होता है और अनुवाद प्रक्रिया को गति देता है।
के अलावा मुंडा भाषाMicrosoft अरुणाचल प्रदेश में गोंडी भाषी और इडु मिश्मी समुदाय के साथ भी काम कर रहा है।
मेटा का भाषा अनुवाद एआई टूल
फेसबुक पैरेंट-मेटा भी कुछ इसी तरह काम कर रहा है। पिछले साल, कंपनी ने घोषणा की कि उसने एक एआई अनुवाद उपकरण विकसित किया है जो एक अलिखित (या मौखिक) भाषा को बोली जाने वाली अंग्रेजी में बदल सकता है। एक अलिखित भाषा वह है जिसमें व्यापक रूप से प्रयुक्त लेखन प्रणाली नहीं होती है और मुख्य रूप से बोली जाती है।
कंपनी ने कहा कि उसका एआई होक्किन – एक मौखिक भाषा को अंग्रेजी में बदलने में सक्षम था। होक्किन उन 3,500 भाषाओं में से एक है जो बोली जाती हैं और इनमें कोई लिखित प्रणाली नहीं है (या कम से कम एआई मॉडल को प्रशिक्षित करने के लिए पर्याप्त नहीं है।)
क्या चैटजीपीटी गूगल का हत्यारा है? | ओपनएआई चैटजीपीटी
[ad_2]
Source link