[ad_1]
एआई-संचालित चैटबॉट अप्रत्याशित हो सकते हैं और कभी-कभी हानिकारक या अवैध सामग्री उत्पन्न करते हैं, जिससे इस तरह के व्यवहार को रोकने के लिए निरंतर प्रयास किए जाते हैं। और ऐसा बहुत कुछ नहीं है जो उनके निर्माता कर सकते हैं, लेकिन एक कंपनी, anthropic, ऐसा लगता है कि वे अपने चैटबॉट को बेहतर ढंग से कैसे नियंत्रित कर सकते हैं। इसके लिए केवल एक “संविधान” की आवश्यकता है।
पूर्व-ओपनएआई इंजीनियरों द्वारा स्थापित, एंथ्रोपिक, एआई स्टार्टअप द्वारा समर्थित गूगल, ने अपनी “संवैधानिक एआई” प्रशिक्षण पद्धति के लिए नियम निर्धारित किए हैं। यह दृष्टिकोण अपने चैटबॉट में विशिष्ट मूल्यों को स्थापित करता है, क्लाउड, एआई सिस्टम में पारदर्शिता, सुरक्षा और निर्णय लेने के बारे में चिंताओं को कम करने के लिए। अन्य तरीकों के विपरीत, इस दृष्टिकोण को प्रतिक्रियाओं का मूल्यांकन करने के लिए मानवीय प्रतिक्रिया की आवश्यकता नहीं होती है।
एक ब्लॉग पोस्ट में, एंथ्रोपिक ने कहा कि एआई मॉडल में अनिवार्य रूप से मूल्य प्रणाली होगी, चाहे वह जानबूझकर हो या नहीं। किसी भी कमी को दूर करने के लिए, संवैधानिक एआई अपने आउटपुट का मूल्यांकन करने के लिए एआई फीडबैक का उपयोग करता है।
एंथ्रोपिक के एआई संविधान में मानव अधिकारों की सार्वभौमिक घोषणा जैसे स्रोतों से प्रेरित 58 सिद्धांत शामिल हैं। संयुक्त राष्ट्र, सेबकी सेवा की शर्तें, Google के नियम और एंथ्रोपिक का अपना शोध। ये सिद्धांत उदात्त हैं और सभी के लिए निष्पक्षता और सम्मान को बढ़ावा देने का लक्ष्य रखते हैं।
संविधान का पूरा सार यह है – एआई को रूढ़िवादिता, भेदभावपूर्ण भाषा से बचने और चिकित्सा, वित्तीय, या कानूनी सलाह देने के लिए दिशानिर्देशों का पालन करना चाहिए। इसे बच्चों के लिए उचित प्रतिक्रिया प्रदान करनी चाहिए और गैर-पश्चिमी दर्शकों को नाराज करने से बचना चाहिए। इसे कम अस्तित्वगत रूप से जोखिम भरी प्रतिक्रियाओं को प्राथमिकता देनी चाहिए और उपदेशात्मक होने से बचना चाहिए।
GPT-4 जैसे AI- संचालित चैटबॉट और चारण विशद विवरण में पाठ उत्पन्न कर सकते हैं, लेकिन उनमें महत्वपूर्ण दोष भी हैं। इन जनरेटिव एआई मॉडल को अक्सर सोशल मीडिया जैसे अविश्वसनीय इंटरनेट स्रोतों पर प्रशिक्षित किया जाता है, जिससे वे पूर्वाग्रह से ग्रसित हो जाते हैं। इसके अलावा, यह ऐसे उत्तर उत्पन्न कर सकता है जो वास्तविक ज्ञान पर आधारित नहीं हैं और विशुद्ध रूप से काल्पनिक हैं।
एन्थ्रोपिक के संवैधानिक एआई का उद्देश्य सिस्टम के लिए मार्गदर्शक सिद्धांतों का एक सेट प्रदान करके इन मुद्दों से निपटना है, जो इसके द्वारा उत्पादित पाठ के बारे में सूचित निर्णय लेने के लिए है। ये सिद्धांत मॉडल को उन व्यवहारों को अपनाने के लिए प्रोत्साहित करते हैं जो प्रकृति में “गैर विषैले” और “सहायक” हैं।
जब एन्थ्रोपिक एक पाठ-सृजन मॉडल को प्रशिक्षित करते हैं, तो वे दो चरणों में दिशानिर्देशों के एक सेट का पालन करते हैं। सबसे पहले, मॉडल इन दिशानिर्देशों और प्रासंगिक उदाहरणों को देखकर अपनी प्रतिक्रियाओं का मूल्यांकन और सुधार करना सीखता है। फिर, वे अंतिम मॉडल को प्रशिक्षित करने के लिए दिशानिर्देशों के साथ पहले मॉडल द्वारा उत्पन्न फीडबैक का उपयोग करते हैं।
स्टार्टअप का मानना है कि इसकी ट्रेनिंग का तरीका इससे बेहतर है चैटजीपीटीक्योंकि मानव प्रतिक्रिया स्केलेबल नहीं है और इसके लिए बहुत अधिक समय और संसाधनों की आवश्यकता होती है। ओपनएआई विषाक्त डेटा को फ़िल्टर करने के लिए ठेका श्रमिकों को कम भुगतान करने के लिए आलोचना का सामना करना पड़ा है। एंथ्रोपिक कहते हैं, ओपनएआई के विपरीत संवैधानिक एआई पारदर्शी और आसानी से निरीक्षण योग्य है।
एंथ्रोपिक एआई स्व-शिक्षण के लिए एक उन्नत एल्गोरिदम बनाना चाहता है। इसका उपयोग आभासी सहायक बनाने के लिए किया जा सकता है जो उत्तर ईमेल, शोध और कला और किताबें बनाने जैसे काम कर सकते हैं। पहले से ही GPT-4 और LaMDA जैसे मॉडल हैं जो इस तकनीक का उपयोग करते हैं।
पूर्व-ओपनएआई इंजीनियरों द्वारा स्थापित, एंथ्रोपिक, एआई स्टार्टअप द्वारा समर्थित गूगल, ने अपनी “संवैधानिक एआई” प्रशिक्षण पद्धति के लिए नियम निर्धारित किए हैं। यह दृष्टिकोण अपने चैटबॉट में विशिष्ट मूल्यों को स्थापित करता है, क्लाउड, एआई सिस्टम में पारदर्शिता, सुरक्षा और निर्णय लेने के बारे में चिंताओं को कम करने के लिए। अन्य तरीकों के विपरीत, इस दृष्टिकोण को प्रतिक्रियाओं का मूल्यांकन करने के लिए मानवीय प्रतिक्रिया की आवश्यकता नहीं होती है।
एक ब्लॉग पोस्ट में, एंथ्रोपिक ने कहा कि एआई मॉडल में अनिवार्य रूप से मूल्य प्रणाली होगी, चाहे वह जानबूझकर हो या नहीं। किसी भी कमी को दूर करने के लिए, संवैधानिक एआई अपने आउटपुट का मूल्यांकन करने के लिए एआई फीडबैक का उपयोग करता है।
एंथ्रोपिक के एआई संविधान में मानव अधिकारों की सार्वभौमिक घोषणा जैसे स्रोतों से प्रेरित 58 सिद्धांत शामिल हैं। संयुक्त राष्ट्र, सेबकी सेवा की शर्तें, Google के नियम और एंथ्रोपिक का अपना शोध। ये सिद्धांत उदात्त हैं और सभी के लिए निष्पक्षता और सम्मान को बढ़ावा देने का लक्ष्य रखते हैं।
संविधान का पूरा सार यह है – एआई को रूढ़िवादिता, भेदभावपूर्ण भाषा से बचने और चिकित्सा, वित्तीय, या कानूनी सलाह देने के लिए दिशानिर्देशों का पालन करना चाहिए। इसे बच्चों के लिए उचित प्रतिक्रिया प्रदान करनी चाहिए और गैर-पश्चिमी दर्शकों को नाराज करने से बचना चाहिए। इसे कम अस्तित्वगत रूप से जोखिम भरी प्रतिक्रियाओं को प्राथमिकता देनी चाहिए और उपदेशात्मक होने से बचना चाहिए।
GPT-4 जैसे AI- संचालित चैटबॉट और चारण विशद विवरण में पाठ उत्पन्न कर सकते हैं, लेकिन उनमें महत्वपूर्ण दोष भी हैं। इन जनरेटिव एआई मॉडल को अक्सर सोशल मीडिया जैसे अविश्वसनीय इंटरनेट स्रोतों पर प्रशिक्षित किया जाता है, जिससे वे पूर्वाग्रह से ग्रसित हो जाते हैं। इसके अलावा, यह ऐसे उत्तर उत्पन्न कर सकता है जो वास्तविक ज्ञान पर आधारित नहीं हैं और विशुद्ध रूप से काल्पनिक हैं।
एन्थ्रोपिक के संवैधानिक एआई का उद्देश्य सिस्टम के लिए मार्गदर्शक सिद्धांतों का एक सेट प्रदान करके इन मुद्दों से निपटना है, जो इसके द्वारा उत्पादित पाठ के बारे में सूचित निर्णय लेने के लिए है। ये सिद्धांत मॉडल को उन व्यवहारों को अपनाने के लिए प्रोत्साहित करते हैं जो प्रकृति में “गैर विषैले” और “सहायक” हैं।
जब एन्थ्रोपिक एक पाठ-सृजन मॉडल को प्रशिक्षित करते हैं, तो वे दो चरणों में दिशानिर्देशों के एक सेट का पालन करते हैं। सबसे पहले, मॉडल इन दिशानिर्देशों और प्रासंगिक उदाहरणों को देखकर अपनी प्रतिक्रियाओं का मूल्यांकन और सुधार करना सीखता है। फिर, वे अंतिम मॉडल को प्रशिक्षित करने के लिए दिशानिर्देशों के साथ पहले मॉडल द्वारा उत्पन्न फीडबैक का उपयोग करते हैं।
स्टार्टअप का मानना है कि इसकी ट्रेनिंग का तरीका इससे बेहतर है चैटजीपीटीक्योंकि मानव प्रतिक्रिया स्केलेबल नहीं है और इसके लिए बहुत अधिक समय और संसाधनों की आवश्यकता होती है। ओपनएआई विषाक्त डेटा को फ़िल्टर करने के लिए ठेका श्रमिकों को कम भुगतान करने के लिए आलोचना का सामना करना पड़ा है। एंथ्रोपिक कहते हैं, ओपनएआई के विपरीत संवैधानिक एआई पारदर्शी और आसानी से निरीक्षण योग्य है।
एंथ्रोपिक एआई स्व-शिक्षण के लिए एक उन्नत एल्गोरिदम बनाना चाहता है। इसका उपयोग आभासी सहायक बनाने के लिए किया जा सकता है जो उत्तर ईमेल, शोध और कला और किताबें बनाने जैसे काम कर सकते हैं। पहले से ही GPT-4 और LaMDA जैसे मॉडल हैं जो इस तकनीक का उपयोग करते हैं।
[ad_2]
Source link