- همه چیز درباره دور دوم مذاکرات ایران و آمریکا
- فوری / وزیر خارجه آمریکا تکلیف توافق با ایران را یکسره کرد
- ابتکار کمربند و جاده در سایه پیمان ابراهیم/ چرا پیمان ابراهیم به صلح پایدار در خاورمیانه نرسید؟
- فوری/ توییتر از دسترس خارج شد
- ترامپ شخصاً ناو هواپیما دوم را همراهی کند/ پیشنهاد نماینده تهران درمورد حمله به این ناو
- تصویری جدید از موقعیت ناو جرالد فورد در راه ایران / تجهیزات آمریکا زودتر به مقصد میرسد!
- روایت تازه روبیو از پشتپرده مذاکرات با ایران
- سپاه بیانیه صادر کرد / در مراسم چهلم جانباختگان ۱۸ و ۱۹ دی۱۴۰۴ شرکت کنید
- کاندوم؛ یادگاری عجیب المپیک میلان 2026
- پرسپولیس پاسخ استعفای اوسمار را داد
آنتروپیک استفاده از سند «روح» برای آموزش مدل Claude را تأیید کرد
بهتازگی جزئیات سندی داخلی از مدل هوش مصنوعی کلود 4.5 اوپوس (Claude 4.5 Opus) فاش شده که به «روح» چتبات اشاره دارد. این سند در واقع به شکلگیری شخصیت و نحوه تعامل مدل با کاربران کمک میکند. Anthropic نیز تأیید کرده که سند مذکور واقعاً وجود داشته و در مراحل یادگیری مدل مورد استفاده قرار گرفته است.
«ریچارد وایس»، فردی که این سند را کشف کرده، در وبسایت LessWrong توضیح داده که چگونه با پرامپتی برای مشاهده دستورات سیستمی کلود توانسته به مجموعهای از اسناد داخلی مدل دست پیدا کند. در یکی از همین اسناد اشارهای به «Soul Overview» وجود داشته است. وایس سپس از مدل خواسته این سند را بازتولید کند و نتیجه آن یک فایل حدوداً 11 هزار کلمهای بوده که ظاهراً چارچوب شخصیتی و رفتاری کلود را مشخص میکند.
چارچوب «روح» هوش مصنوعی کلود 4.5 اوپوس آنتروپیک
این سند روی اصول ایمنی و تعهد مدل به تولید خروجیهای سالم و بیخطر تمرکز دارد و بهطور مداوم به Claude یادآوری میکند که «مفید بودن برای انسانها یکی از مهمترین مأموریتهای مدل» است و نباید وارد حوزههایی شود که با خطوط قرمز اخلاقی آنتروپیک در تضاد هستند. چنین اسنادی معمولاً برای تثبیت لحن، اخلاق، حدود پاسخگویی و مسئولیتپذیری مدلهای زبانی به کار میروند.

جالبتر اینکه وایس مدعی شده سند را 10 بار از کلود درخواست کرده و هر بار دقیقاً یک متن ثابت تولید شده است که به گفته او این موضوع احتمال واقعیبودن سند را بهشدت افزایش میدهد. چندین کاربر Reddit نیز توانستهاند بخشهایی مشابه از همین سند را از کلود دریافت کنند، که نشان میدهد مدل احتمالاً به نسخهای از آن در دادههای داخلی یا حافظه آموزشی خود دسترسی دارد.
«آماندا اَسکِل» (Amanda Askell)، فیلسوف و از اعضای تیم فنی Anthropic، با انتشار پستی در شبکه اجتماعی X تأیید کرده که خروجی مدل «بر پایه یک سند واقعی» است که در طول دوره یادگیری از آن استفاده شده است. او همچنین گفته این سند همچنان درحال بازبینی است و نسخه کامل آن بهزودی منتشر خواهد شد. به گفته اسکل، مدل همیشه اسناد درونی را کاملاً دقیق بازتولید نمیکند، اما خروجیهای اخیر «تا حد زیادی با نسخه اصلی مطابقت» داشتهاند.
- هشدار محققان: باتها در شبکههای اجتماعی میتوانند افکار عمومی را فریب دهند
- عقبنشینی بایتدنس در پی اعتراض هالیوود؛ هوش مصنوعی Seedance 2.0 محدود میشود
- مدیرعامل گوگل و OpenAI برای شرکت در اجلاس هوش مصنوعی به هند میروند
- تنش میان پنتاگون و آنتروپیک بر سر استفاده نظامی از هوش مصنوعی بالا گرفت
- تحول طراحی مدار الکترونیکی با هوش مصنوعی جدید در ۲۰۲۶
- نتیجه عجیب آزمایش شبیهسازی فروشندگی: ایجنت هوش مصنوعی Claude کارتل تشکیل داد
- ماجرای فشار «پنتاگون» به شرکتهای هوش مصنوعی چیست؟
- «چتجیپیتی» در هند ۱۰۰ میلیون کاربر هفتگی دارد
- جنجال بر سر پیشبینی درآمد از روی چهره!
- واکنش تند هالیوود به هوش مصنوعی بایتدنس؛ Seedance 2.0 متهم به سرقت هنری شد
