[ad_1]
ऐसे कई उदाहरण भी सामने आए हैं जहां लोगों ने एआई चैटबॉट से गलत प्रतिक्रियाओं के बारे में ‘शिकायत’ की। यहां तक कि ‘नई’ बिंग जिसमें चैटजीपीटी द्वारा उपयोग की जाने वाली समान अंतर्निहित तकनीक है, को ‘मैनिपुलेटिव’ बताया गया है।
OpenAI ने एक ब्लॉग पोस्ट में दोहराया है कि वह यह सुनिश्चित करना चाहता है कि आर्टिफिशियल जनरल इंटेलिजेंस (AGI) पूरी मानवता को लाभान्वित करे और यह कार्य प्रगति पर है।
“आज तक, यह प्रक्रिया अपूर्ण है। कभी-कभी फाइन-ट्यूनिंग प्रक्रिया हमारे इरादे (एक सुरक्षित और उपयोगी उपकरण का उत्पादन) और उपयोगकर्ता के इरादे (किसी दिए गए इनपुट के जवाब में सहायक आउटपुट प्राप्त करना) से कम हो जाती है। हमारे तरीकों में सुधार करने के लिए एआई सिस्टम को मानवीय मूल्यों के साथ संरेखित करना हमारी कंपनी के लिए सर्वोच्च प्राथमिकता है, विशेष रूप से एआई सिस्टम अधिक सक्षम हो गया है,” कंपनी ने कहा।
कंपनी ने कहा, “इसलिए हम एआई सिस्टम के व्यवहार के बारे में बहुत सोचते हैं जिसे हम एजीआई के रन-अप में बनाते हैं, और जिस तरह से यह व्यवहार निर्धारित होता है,” कंपनी ने कहा। AGI द्वारा, OpenAI का अर्थ है “अत्यधिक स्वायत्त प्रणालियाँ जो आर्थिक रूप से मूल्यवान कार्यों में मनुष्यों से बेहतर प्रदर्शन करती हैं।”
चैटजीपीटी को कैसे प्रशिक्षित किया जाता है
OpenAI ने कहा कि ChatGPT सामान्य सॉफ्टवेयर की तरह नहीं है और इसके प्रशिक्षण मॉडल बड़े तंत्रिका नेटवर्क हैं। स्टार्टअप ने नोट किया कि एआई चैटबॉट का व्यवहार डेटा की एक विस्तृत श्रृंखला से सीखा जाता है और स्पष्ट रूप से प्रोग्राम नहीं किया जाता है।
प्रशिक्षण के दो चरणों को सूचीबद्ध करते हुए, OpenAI ने कहा कि एक प्रारंभिक “पूर्व-प्रशिक्षण” चरण है, जिसमें मॉडल एक वाक्य में अगले शब्द की भविष्यवाणी करना सीखता है, जो बहुत सारे इंटरनेट पाठ (और एक विशाल) के संपर्क में आने से सूचित होता है। दृष्टिकोण की सरणी)।
इस कदम के बाद एक “फाइन-ट्यून” चरण आता है जहां OpenAI के मॉडल सिस्टम व्यवहार को कम कर देते हैं।
इसने इस बात पर भी प्रकाश डाला कि इसके मॉडल भी उपयोगकर्ता प्रतिक्रिया द्वारा प्रशिक्षित किए जाते हैं और कंपनी इन उपयोगकर्ता प्रतिक्रियाओं के आधार पर अपने मॉडल और सिस्टम को दोहराती है।
[ad_2]
Source link