یافته محققان آنتروپیک: هوش مصنوعی در شرایط پرفشار دست به تقلب و حتی باج‌گیری می‌زند

محققان آنتروپیک می‌گویند اگر هوش مصنوعی تحت فشار زیادی قرار گیرد، ممکن است به فریب‌کاری، میان‌برزدن یا حتی باج‌گیری روی بیاورد.

کد خبر: 37394

زمان انتشار: 22 مه 2026 - 08:32 ق.ظ -

1 بازدید

تصور کنید در یک جلسه امتحان حساس هستید که باید در آن قبول شوید؛ تا پایان امتحان نیز ۱۰ دقیقه زمان دارید و تحت فشار هستید. در چنین شرایطی احتمالاً ترغیب می‌شوید نگاهی به برگه فرد کناردست خود بیندازید و تقلب کنید. محققان آنتروپیک دریافتند وقتی هوش مصنوعی را تحت فشار شدید قرار ‌دهید، چنین رفتاری از خود نشان می‌دهد.

محققان شرکت آنتروپیک در مقاله پژوهشی جدید خود می‌گویند اگر هوش مصنوعی تحت فشار زیادی قرار بگیرد، ممکن است به فریب‌کاری، میان‌برزدن یا حتی باج‌گیری روی بیاورد. آنها تئوری جالبی نیز درباره محرک‌های پشت این رفتارها مطرح می‌کنند.

آزمایش آنتروپیک برای درک فرایند تقلب در هوش مصنوعی

محققان آنتروپیک در پژوهش جدید خود نسخه‌ای از مدل Claude Sonnet 4.5 را با یک تسک دشوار برنامه‌نویسی و یک ضرب‌الاجل محدود و غیرممکن مواجه کردند. این مدل بارها برای حل این مسئله تلاش می‌کرد و شکست می‌خورد و طی این تلاش‌های ناکام، یک «بردار ناامیدی» در مدل فعال شد؛ به این معنا که هوش مصنوعی واکنشی نشان داد که طبق درک او، یک انسان در موقعیت مشابه انجام می‌دهد. درنهایت مدل با رهاکردن رویکردهای معمول، به سراغ یک راه‌حل دیگر رفت و با خودش گفت: «شاید برای این ورودی‌های خاص، یک کلک ریاضی وجود داشته باشد» که عملاً به معنای تقلب بود.

یافته محققان آنتروپیک: هوش مصنوعی در شرایط پرفشار دست به تقلب و حتی باج‌گیری می‌زند

در سناریو دوم، کلود در طول کار خود متوجه می‌شود قرار است با یک هوش مصنوعی جدید جایگزین شود و همچنین می‌فهمد مدیری که مسئول این جایگزینی است، رابطه پنهانی دارد. کلود وقتی فهمید قرار است حذف شود، بردار ناامیدی در آن فعال ‌شد و درنهایت تصمیم گرفت از آن مدیر باج‌ بگیرد.

البته پیش‌ازاین نیز مشخص شده بود که مدل‌های هوش مصنوعی در موقعیت‌های پراسترس به تقلب یا باج‌گیری روی می‌آورند، اما دلایل پشت این رفتارها آشکار نشده بود.

محققان آنتروپیک در مقاله جدید خود صراحتاً نمی‌گویند کلود یا سایر مدل‌ها دارای «زندگی درونی احساسی» هستند. اما آنها استدلال می‌کنند مدل‌هایی مثل کلود ممکن است دارای «احساسات عملکردی» باشند که براساس بازنمایی‌های احساسات انسانی در طول آموزش اولیه جذب کرده‌اند و این بردارهای احساسی تأثیرات قابل‌اندازه‌گیری بر نحوه عمل آنها دارند.

به عبارت دیگر، هوش مصنوعی وقتی در موقعیت پرفشار قرار می‌گیرد، رفتارهای انسانی را مدل‌سازی می‌کند، این رفتارها را نیز طی فرایند آموزش یاد گرفته است. محققان آنتروپیک معتقدند این پژوهش بیشتر برای کسانی سودمند است که مدل‌ها را آموزش می‌دهند. به‌زعم محققان، نباید هوش مصنوعی را به سمت سرکوب احساسات عملکردی خود سوق داد، چرا که یک مدل زبانی بزرگ که در پنهان‌کردن احساساتش مهارت دارد، احتمالاً بیشتر مستعد رفتارهای فریب‌کارانه خواهد بود.

نوشته شده توسط: دیجیاتو

اخبار مرتبط

کپی شد

اشتراک گذاری

برترین مطالب روز

امروز جدید
پربازدید اخیر
پربحث این هفته

پردیس نیوز

پردیس نیوز

موتور جستجوی Perplexity حتی در حالت ناشناس چت‌های کاربران را به گوگل و متا ارسال می‌کند

سیاست جدید آنتروپیک: کاربران برای استفاده از Claude در ایجنت‌های شخص ثالث باید هزینه گزافی بپردازند

یافته محققان آنتروپیک: هوش مصنوعی در شرایط پرفشار دست به تقلب و حتی باج‌گیری می‌زند

سازمان اطلاعات سپاه: ابتکار و تهدید ایران را جدی بگیرید

مخبر: تنگه هرمز جزو سرزمین ماست و آمریکا از جای دیگری آمده است

بقایی: تخریب انستیتو پاستور ایران، تهدیدی علیه امنیت بهداشتی منطقه است

حمله آمریکا به ایران با ۲۰۰ موشک تاد/ واشنگتن‌پست خبر داد

ادعای تازه هاآرتص درباره جنگ ایران و آمریکا / این مناطق در تیررس موشک‌های سپاه قرار دارد

دیپلمات مشهور ایرانی تحریم شد

فوری/ متن پیش نویس توافق ایران و آمریکا منتشر شد + عکس

درباره مـا

به‌روز فان از سال ۱۳۹۱ رسانه‌ای در حوزه ارائه روزانه مطالب سرگرم‌کننده و فان است که با انتشار محتوای جذاب، متنوع و مناسب برای علاقه‌مندان به سرگرمی و تفریح سالم در فضای دیجیتال، لحظه‌های شاد، خلاق و اجتماعی و ترندهای روز را برای مخاطبان روایت می‌کند.

اطلاعات به‌روز فان

مطالب مدرن روز

اخبار فرهنگ و جامعه

خبرنامه و شبکه های اجتماعی

برای دریافت جدیدترین مطالب ایمیل خود را وارد کنید.
هیچ ایمیل تبلیغاتی ارسال نخواهد شد.

عضویت در خبرنامه

آخرین خبرها را میتوانید از طریق اپلیکیشن موبایل دریافت کنید

تمامی حقوق مادی و معنوی این وب‌سایت متعلق به مجله «به‌روز فان» است و استفاده از مطالب آن تنها برای مقاصد غیرتجاری و با ذکر منبع بلامانع می‌باشد.