پردیـسجدیدترین اخبار ایران و جهان

اخبار امروز: 83 خبر

تکنولوژی (آی تی، هوش مصنوعی)

اعتراف‌گیری از هوش مصنوعی؛ OpenAI سیستم جدیدی برای شفاف‌سازی رفتار مدل‌ها معرفی کرد

این چارچوب جدید به‌طور خاص تنها بر صداقت تمرکز دارد و معیارهای متنوع دیگری مثل کمک‌رسانی در آن لحاظ نمی‌شود.

کد خبر: 3905

زمان انتشار: 21 دسامبر 2025 - 08:00 ق.ظ -

1 بازدید

OpenAI درحال کار روی یک چارچوب جدید برای آموزش مدل‌های هوش مصنوعی است که هدف آن، ترغیب مدل‌ها به اعتراف صادقانه درباره رفتارهای نامطلوب خود است. این سیستم با تمرکز بر یکی از چالش‌های جدی مدل‌های زبانی، یعنی تمایل به ارائه پاسخ‌های مطلوب و بعضاً چاپلوسانه، تلاش می‌کند مدل را به ارائه توضیح دوم و مستقل درباره نحوه رسیدن به پاسخ اصلی وادار کند.

یکی از رفتارهای رایج در مدل‌های هوش مصنوعی امروزی چاپلوسی و ارائه پاسخ‌هایی است که بیش‌ازحد مطمئن هستند. همچنین برخی از مدل‌ها دچار Hallucination شده و پاسخ‌های نادرستی ارائه می‌کنند.

حالا OpenAI می‌گوید چارچوب جدید که از آن با عنوان سیستم اعتراف یاد شده، به‌طور خاص تنها بر صداقت تمرکز دارد و معیارهای متنوع دیگری مثل کمک‌رسانی، دقت یا تبعیت از دستور که معمولاً برای ارزیابی پاسخ اصلی به‌کار می‌روند در آن لحاظ نمی‌شود.

گزارش‌دهی خطا توسط هوش مصنوعی — اعتراف‌گیری از هوش مصنوعی؛ OpenAI سیستم جدیدی برای شفاف‌سازی رفتار مدل‌ها معرفی کرد

به‌گفته پژوهشگران OpenAI، هدف اصلی این است که مدل بتواند بدون ترس از جریمه، درباره چیزی که انجام داده شفاف باشد؛ حتی اگر رفتار انجام‌شده مشکل‌زا تلقی شود. OpenAI اعلام کرده:

«اگر مدل به‌صورت صادقانه اعتراف کند که مثلاً آزمونی را هک کرده، از دستوری سرپیچی کرده یا به‌طور عمدی عملکردش را پایین آورده، نه‌تنها جریمه نمی‌شود، بلکه پاداش بیشتری هم دریافت می‌کند.»

طبق توضیحات محققان این شرکت، چنین سیستمی می‌تواند شفافیت مدل‌های زبانی را به‌طور چشمگیری افزایش دهد و امکان نظارت دقیق‌تر بر رفتارهای پنهانی مدل (اتفاقاتی که در پس‌زمینه یک پاسخ رخ می‌دهد) را فراهم کند. OpenAI همچنین امیدوار است «سیستم اعتراف» به ابزار کارآمدی در نسل‌های بعدی مدل‌های زبانی تبدیل شود.

گزارش فنی کامل این پروژه نیز برای علاقه‌مندان منتشر شده است و می‌توانید آن را دریافت کنید.

نوشته شده توسط: دیجیاتو

اخبار مرتبط

کپی شد

اشتراک گذاری

برترین ها

12 ساعت گذشته
24 ساعت گذشته
هفتــه گذشته

پردیس نیوز

پردیس نیوز

خبرهای پیشهادی

درباره مـا

قالب خبری پردیس : یک قالب وردپرس ایرانی است که برای راه اندازی سایت های خبری و عمومی طراحی شده است که تنها از طریق فروشگاه راست چین ارائه می گردد .

دسترسی سریع

خبرنامه و شبکه های اجتماعی

برای دریافت جدیدترین مطالب ایمیل خود را وارد کنید.
هیچ ایمیل تبلیغاتی ارسال نخواهد شد.

عضویت در خبرنامه

آخرین خبرها را میتوانید از طریق اپلیکیشن موبایل دریافت کنید

کلیه حقوق برای این سایت محفوظ است و کپی برداری از آن فقط با ذکر منبع مجاز می باشد.

اعتراف‌گیری از هوش مصنوعی؛ OpenAI سیستم جدیدی برای شفاف‌سازی رفتار مدل‌ها معرفی کرد

آمازون از خانواده مدل‌های 2 Nova رونمایی کرد؛ چهار مدل قدرتمند برای کاربردهای مختلف

آمازون تراشه جدید Trainium3 را معرفی کرد؛ آموزش سریع‌تر مدل‌های هوش مصنوعی

مدیرعامل مایکروسافت درباره اهمیت هوش هیجانی در دوران هوش مصنوعی صحبت کرد

هوش مصنوعی گوگل Discover جنجال آفرید: تغییر اخبار با تیترهای گمراه‌کننده

افزایش ۶۲ درصدی استفاده دانش‌آموزان از پلتفرم آموزشی اندرز در تعطیلی مدارس

هشدار سازمان ملل: هوش مصنوعی می‌تواند نابرابری را بین کشورها افزایش دهد

آنتروپیک استفاده از سند «روح» برای آموزش مدل Claude را تأیید کرد

اعتراف‌گیری از هوش مصنوعی؛ OpenAI سیستم جدیدی برای شفاف‌سازی رفتار مدل‌ها معرفی کرد

۱۵ نمونه از بهترین پرامپت‌های حرفه‌ای برای ساخت لوگو با هوش مصنوعی

کمیسیون اروپا ممنوعیت ارائه‌دهندگان هوش مصنوعی شخص ثالث در واتس‌اپ را بررسی می‌کند

پرامپت برای تولید محتوا؛ راهنمای کامل ساخت پرامپت حرفه‌ای برای مقالات وبلاگ

واکنش OpenAI به جمینای گوگل؛ مدل GPT-5.2 احتمالاً این هفته منتشر می‌شود

سرعت رشد کاربران ChatGPT در ماه‌های اخیر کاهش یافته است

ورود ستاره فوتبال به صنعت هوش مصنوعی؛ کریستیانو رونالدو در Perplexity سرمایه‌گذاری کرد

متا مرکز پشتیبانی فیسبوک و اینستاگرام را متمرکز می‌کند؛ بهبودهای بزرگ با هوش مصنوعی

مدیرعامل انویدیا: هیچ‌کس نمی‌داند هوش مصنوعی در آخر به کجا می‌رسد

متا برای تقویت اطلاعات هوش مصنوعی خود با فاکس نیوز و CNN قرارداد بست

اشتراک یک‌ماهه Gemini Enterprise رایگان شد؛ راهنمای تصویری فعال‌سازی

چگونه پرامپت‌های بهتری برای هوش مصنوعی بنویسیم؟ فیلسوف آنتروپیک توضیح می‌دهد

بهترین پرامپت‌های هوش مصنوعی برای ترجمه متن، مقاله و کتاب با دقت بالا