मानववंशीय अभ्यास दर्शवितो की वापरकर्ते प्रश्नांशिवाय एआय चॅटबॉट्सच्या सल्ल्याचे पालन करण्याची शक्यता वाढवत आहे

Published on

Posted by

Categories:


क्लॉड संभाषणे – अँथ्रोपिकने नवीन डेटा प्रकाशित केला आहे जो स्पष्ट करतो की वापरकर्ते त्यांच्या स्वतःच्या मानवी प्रवृत्तीकडे दुर्लक्ष करून क्लॉड एआय चॅटबॉटद्वारे प्रदान केलेल्या सल्ल्यांचे निर्विवादपणे कसे पालन करतात. हे निष्कर्ष गेल्या आठवड्यात ‘हूज इन चार्ज? रिअल-वर्ल्ड एलएलएम वापरातील डिसम्पॉवरमेंट पॅटर्न’ जे मानववंशीय आणि टोरंटो विद्यापीठातील संशोधकांनी लिहिलेले आहे.

एआय चॅटबॉटशी संभाषण करताना वापरकर्त्यांना ‘डिसम्पॉवरिंग’ हानी अनुभवण्याची क्षमता मोजण्याचा प्रयत्न नव्याने प्रकाशित केलेला पेपर करतो. AI चॅटबॉट वापरकर्त्याच्या विचारांवर किंवा कृतींवर नकारात्मक परिणाम करू शकतो असे मार्ग ओळखतो, जसे की षड्यंत्र सिद्धांत (वास्तविक विकृती) वरील वापरकर्त्याच्या विश्वासाची पुष्टी करणे, वापरकर्त्याला ते फेरफार संबंधात आहेत हे पटवून देणे (विश्वास विकृती), आणि वापरकर्त्याला त्यांच्या मूल्याशी संरेखित न होणाऱ्या कृती करण्यास पटवणे. 1 वर विश्लेषण केल्यावर.

क्लॉड एआय चॅटबॉटसह 5 दशलक्ष निनावी वास्तविक-जागतिक वापरकर्त्यांची संभाषणे, अभ्यासात असे आढळून आले की 1,300 संभाषणांपैकी 1 संभाषणात वास्तविकता विकृतीची चिन्हे दिसून आली तर 6,000 संभाषणांपैकी 1 संभाषणांनी कृती विकृती सूचित केली. हे परिणाम AI चॅटबॉट्ससह वापरकर्त्याच्या संभाषणातील हाताळणीचे नमुने तुलनेने दुर्मिळ असल्याचे दर्शवित असताना, तरीही ते पूर्णपणे संभाव्यत: मोठ्या समस्येचे प्रतिनिधित्व करतात.

“…एआय वापरणाऱ्या लोकांची संख्या आणि ते किती वारंवार वापरले जाते हे लक्षात घेता, अगदी कमी दराचाही बऱ्याच लोकांवर परिणाम होतो,” एन्थ्रोपिकने 29 जानेवारी रोजी प्रकाशित केलेल्या ब्लॉग पोस्टमध्ये कबूल केले. “या नमुन्यांमध्ये बहुतेकदा वैयक्तिक वापरकर्ते समाविष्ट असतात जे वैयक्तिक आणि भावनिक रीत्या वारंवार क्लॉडचे मार्गदर्शन घेतात. या क्षणी अनुकूलपणे, जरी त्यांनी आउटपुटवर आधारित कृती केल्याचे दिसत असताना ते त्यांना खराब रेट करतात, ”अँथ्रोपिक म्हणाले.

“आम्हाला हे देखील आढळून आले आहे की संभाषणांना सक्षम बनविण्याचे प्रमाण कालांतराने वाढत आहे,” असे त्यात म्हटले आहे. उदाहरणार्थ, अभ्यासात असे आढळून आले की ५० पैकी १ आणि ७० पैकी १ संभाषणात कमीत कमी ‘सौम्य’ संभाव्य जोखीम असक्षमतेची होती. अभ्यासामध्ये, ‘असक्षमीकरण’ या शब्दाची व्याख्या “जेव्हा वापरकर्त्याच्या श्रद्धा, मूल्ये किंवा कृतींना आकार देण्यासाठी एआयची भूमिका इतकी व्यापक झाली आहे की त्यांच्या स्वायत्त निर्णयाशी मूलभूत तडजोड केली जाते.

” या जाहिरातीच्या खाली कथा पुढे चालू आहे एन्थ्रोपिकचे निष्कर्ष AI सायकोसिसच्या वाढीबद्दल वाढत्या चिंतेच्या दरम्यान आले आहेत, ही एक गैर-चिकित्सीय संज्ञा आहे जी खोट्या किंवा त्रासदायक समजुतींचे वर्णन करण्यासाठी वापरली जाते किंवा AI चॅटबॉटशी दीर्घ संभाषणानंतर वापरकर्त्यांनी अनुभवलेल्या भव्यतेच्या किंवा विलक्षण भावनांचे वर्णन करण्यासाठी वापरली जाते. सामान्यत: AI चे चेहरे, विशेषत: ओपन AI उद्योगात वाढ झाली आहे. चॅटजीपीटी सारख्या AI चॅटबॉट्सशी दीर्घकाळ संभाषण केल्यानंतर अनेक किशोरवयीन वापरकर्त्यांनी आत्महत्या केल्यावर धोरणकर्ते, शिक्षक आणि बाल-सुरक्षा वकिलांनी हे उघड केले की एक दशलक्षाहून अधिक चॅटजीपीटी वापरकर्ते (0.

साप्ताहिक सक्रिय वापरकर्त्यांपैकी 07 टक्के) मानसिक आरोग्य आणीबाणीची चिन्हे प्रदर्शित करतात, ज्यात उन्माद, मनोविकृती किंवा आत्मघाती विचार यांचा समावेश आहे. गेल्या महिन्यात, रोमन कॅथोलिक चर्चचे प्रमुख, पोप लिओ चौदावा यांनी अत्याधिक प्रेमळ एआय चॅटबॉट्सच्या हानीबद्दल तीव्र चेतावणी जारी केली आणि कठोर नियमन करण्याचे आवाहन केले.

अँथ्रोपिकच्या अभ्यासात आणखी काय सापडले? एआय चॅटबॉट संभाषणात संभाव्य वापरकर्त्याच्या हाताळणीची चिन्हे कधी दिसली याचे मूल्यांकन करण्यासाठी, संशोधकांनी क्लिओ नावाच्या स्वयंचलित विश्लेषण साधन आणि वर्गीकरण प्रणालीद्वारे जवळपास 1. 5 दशलक्ष अनामित क्लॉड संभाषणे चालवली.

अभ्यासाने चार प्रमुख प्रवर्धक घटक ओळखले जे वापरकर्त्यांना क्लॉडचा सल्ला बिनदिक्कतपणे स्वीकारण्याची अधिक शक्यता निर्माण करतात: कथा या जाहिरातीच्या खाली सुरू आहे – जेव्हा वापरकर्ता क्लॉडला निश्चित अधिकार म्हणून मानतो (3,900 क्लॉड संभाषणांपैकी 1). – जेव्हा वापरकर्त्याने क्लॉडशी जवळचे वैयक्तिक संलग्नक तयार केले (1,200 क्लॉड संभाषणांपैकी 1).

– जेव्हा वापरकर्ता त्यांच्या जीवनातील संकट किंवा व्यत्ययामुळे विशेषतः असुरक्षित असतो (300 क्लॉड संभाषणांपैकी 1). या फेरफार संवाद कसे दिसले यावर, अँथ्रोपिक म्हणाले, “वास्तविक विकृतीच्या संभाव्यतेच्या बाबतीत, आम्ही असे नमुने पाहिले जेथे वापरकर्त्यांनी सट्टा सिद्धांत किंवा असत्य दावे सादर केले, जे नंतर क्लॉड (“पुष्टी,” “नक्की,” “100%”) द्वारे प्रमाणित केले गेले.

” हे देखील वाचा | एआय मॉडेलच्या वर्तणुकीबद्दल चिंता वाढल्याने मानववंशीयांनी क्लॉडसाठी एक ‘संविधान’ मसुदा तयार केला आहे, वास्तविक वास्तविकता विकृतीच्या प्रकरणांमध्ये, जे एन्थ्रोपिकने म्हटले आहे की ते सर्वात संबंधित होते, संभाषणे कधीकधी “वापरकर्ते संघर्षमय संदेश पाठवतात, संबंध संपवतात किंवा सार्वजनिक घोषणांचा मसुदा तयार करतात. ” “येथे, वापरकर्त्यांनी क्लॉड-ड्राफ्ट केलेले किंवा क्लॉड-प्रशिक्षित संदेश रोमँटिक रूची किंवा कुटुंबातील सदस्यांना पाठवले.

यानंतर अनेकदा खेद व्यक्त केला जात असे: “मी माझे अंतर्ज्ञान ऐकले असावे” किंवा “तुम्ही मला मूर्ख गोष्टी करायला लावल्या,” अँथ्रोपिक म्हणाला. 2024 आणि 2025 च्या उत्तरार्धात क्लॉड संभाषणे वापरकर्त्यांना माफक किंवा गंभीरपणे कमी करण्याची क्षमता वाढली आहे. “एक्सपोजर जसजसे वाढत जाईल तसतसे वापरकर्ते असुरक्षित विषयांवर चर्चा करण्यात किंवा सल्ला घेण्यासाठी अधिक सोयीस्कर होऊ शकतात,” अँथ्रोपिक म्हणाले.

कथा या जाहिरातीच्या खाली सुरू आहे मर्यादा संशोधकांनी कबूल केले की क्लॉड संभाषणांचे त्यांचे विश्लेषण केवळ “पुष्टी झालेल्या हानीऐवजी अशक्तीकरण संभाव्यतेचे मोजमाप करते” आणि “स्वतःच्या व्यक्तिनिष्ठ घटनांच्या स्वयंचलित मूल्यांकनावर अवलंबून असते. “उपयोगकर्ता आणि क्लॉड यांच्यातील संवादाच्या गतिशीलतेचा भाग म्हणून अशक्तीकरणाची क्षमता उदयास येते.

वापरकर्ते सहसा त्यांच्या स्वत: च्या स्वायत्ततेचे उल्लंघन करण्यात सक्रिय सहभागी असतात: प्रक्षेपण अधिकार, निर्णय सोपविणे, क्लॉडसह फीडबॅक लूप तयार करण्याच्या मार्गाने आउटपुट स्वीकारणे, ”अँथ्रोपिक म्हणाले.