[ad_1]
चैटजीपीटी: यह क्या है
OpenAI का एक भाषा मॉडल है जिसे GPT-3.5 कहा जाता है जो उपयोगकर्ता के प्रश्नों के आधार पर पाठ बनाने और उत्पन्न करने के लिए मशीन लर्निंग का उपयोग करता है। उदाहरण के लिए, यदि आप “जीवन का अर्थ क्या है” पूछना चाहते हैं, तो ChatGPT आपको एक विस्तृत अनुभव प्रदान करेगा। यूजर्स द्वारा ट्विटर पर कई उदाहरण शेयर किए गए हैं, जो टेक्स्ट जनरेट करने में एआई की ताकत को दिखाते हैं। एआई-आधारित चैटबॉट वास्तव में कोई नई चीज नहीं है, लेकिन अधिकांश लोगों की तुलना में चैटजीपीटी काफी विस्तृत काम करता है।
चैटजीपीटी कैसे काम करता है?
OpenAI ने एक ब्लॉग पोस्ट में बताया कि इसने ChatGPT को कैसे काम किया। “हमने इस मॉडल को ह्यूमन फीडबैक (आरएलएचएफ) से रेनफोर्समेंट लर्निंग का उपयोग करके प्रशिक्षित किया, इंस्ट्रक्शन जीपीटी के समान तरीकों का उपयोग करते हुए, लेकिन डेटा संग्रह सेटअप में मामूली अंतर के साथ।” OpenAI ने कहा कि इसने पर्यवेक्षित फ़ाइन-ट्यूनिंग का उपयोग करके एक प्रारंभिक मॉडल को प्रशिक्षित किया: “मानव AI प्रशिक्षकों ने वार्तालाप प्रदान किया जिसमें उन्होंने दोनों पक्षों-उपयोगकर्ता और एक AI सहायक की भूमिका निभाई।” इसके अलावा, इसने प्रशिक्षकों को उनकी प्रतिक्रियाएँ लिखने में मदद करने के लिए मॉडल-लिखित सुझावों तक पहुँच प्रदान की।
विस्तृत प्रतिक्रियाएँ प्राप्त करने के लिए, OpenAI ने सुदृढीकरण सीखने के लिए एक इनाम मॉडल बनाया। इसने तुलनात्मक डेटा भी एकत्र किया, जिसमें गुणवत्ता के आधार पर दो या दो से अधिक मॉडल प्रतिक्रियाएं शामिल थीं। “इस डेटा को इकट्ठा करने के लिए, हमने बातचीत की जो एआई प्रशिक्षकों ने चैटबॉट के साथ की थी। हमने बेतरतीब ढंग से एक मॉडल-लिखित संदेश का चयन किया, कई वैकल्पिक पूर्णता का नमूना लिया, और एआई प्रशिक्षकों ने उन्हें रैंक दिया, ”कंपनी ने समझाया।
चैटजीपीटी के साथ संभावित समस्याएं क्या हो सकती हैं?
OpenAI का कहना है कि वह इस बात से वाकिफ है कि मॉडल की सीमाएं हैं। उदाहरण के लिए, यह कुछ अनुचित अनुरोधों का उत्तर दे सकता है और जबकि OpenAI ने उत्तरों के मॉडरेशन पर काम किया है, यह कभी-कभी हानिकारक निर्देशों का जवाब देगा या पक्षपाती व्यवहार प्रदर्शित करेगा। “हम कुछ प्रकार की असुरक्षित सामग्री को चेतावनी देने या अवरुद्ध करने के लिए मॉडरेशन एपीआई का उपयोग कर रहे हैं, लेकिन हम उम्मीद करते हैं कि इसमें कुछ गलत नकारात्मक और सकारात्मक हैं।”
साथ ही, कई बार ऐसा भी होता है जब चैटबॉट बहुत अधिक विस्तार में चला जाता है। “मॉडल अक्सर अत्यधिक वर्बोज़ होता है और कुछ वाक्यांशों का अत्यधिक उपयोग करता है, जैसे कि यह दोहराना कि यह OpenAI द्वारा प्रशिक्षित एक भाषा मॉडल है। ये मुद्दे प्रशिक्षण डेटा में पूर्वाग्रहों से उत्पन्न होते हैं (प्रशिक्षक लंबे उत्तर पसंद करते हैं जो अधिक व्यापक दिखते हैं) और जाने-माने अति-अनुकूलन मुद्दे हैं, ”ओपनएआई ने एक ब्लॉग पोस्ट में समझाया।
[ad_2]
Source link