تحقیق جدید: مدل‌های زبانی بزرگ می‌توانند اشتباهاتشان را شناسایی کنند

نتایج این تحقیق می‌تواند به کاهش هذیان گفتن مدل‌های هوش مصنوعی کمک کند.

کد خبر: 13587

زمان انتشار: 30 دسامبر 2025 - 06:25 ق.ظ -

2 بازدید

یکی از مشکلات رایج در مدل‌های زبان بزرگ (LLM) تمایل آن‌ها به تولید اطلاعات نادرست و به‌اصطلاح «هذیان» گفتن است. درحالی‌که تحقیقات زیادی بر روی تجزیه‌وتحلیل این خطاها از دیدگاه کاربر انجام شده است، اما یک تحقیق جدید نشان می‌دهد که این مدل‌ها درک بسیار عمیق‌تری از صداقت نسبت به آنچه قبلاً تصور می‌شد دارند.

این تحقیق توسط محققانی از Technion، مرکز گوگل ریسرچ و اپل انجام شده است و به بررسی عملکرد درونی مدل‌های زبانی بزرگ می‌پردازد. هذیان گفتن یک تعریف واحد جهانی ندارد و عموماً به طیف وسیعی از خطاهای LLM گفته می‌شود. برای انجام این تحقیق، محققان یک تعریف مشخص از هذیان گفتن ارائه دادند که شامل خطاهایی مانند عدم دقت، سوگیری‌ها، شکست‌های استدلال عقل سلیم و سایر خطاهای دنیای واقعی می‌شود.

مدل‌های زبانی بزرگ در سنجش عملکرد خود بسیار باهوش هستند

بیشتر تحقیقات قبلی در مورد توهمات بر تجزیه‌وتحلیل رفتار خارجی LLM و بررسی نحوه درک کاربران از این خطاها متمرکز شده است. اما چنین روشی بینش محدودی در مورد نحوه کدگذاری و پردازش خطاها در خود مدل‌ها ارائه می‌دهد.

مطالعه جدید اما رویکرد متفاوتی دارد. محققان به‌جای نگاه‌کردن به خروجی نهایی، «نشانه‌های پاسخ دقیق» را تجزیه‌وتحلیل می‌کنند. یعنی نشانه‌های پاسخی که اگر اصلاح شوند می‌توانند صحت پاسخ را تغییر دهند. محققان آزمایش خود را روی چهار مدل Mistral 7B و Llama 2 و در ۱۰ مجموعه داده انجام دادند که وظایف مختلفی مانند پاسخ به سؤال، استنتاج زبان طبیعی، حل مسئله ریاضی و تجزیه‌وتحلیل احساسات را در بر می‌گرفت.

محققان همچنین به مدل‌ها اجازه دادند تا پاسخ‌های نامحدودی را برای شبیه‌سازی استفاده در دنیای واقعی ایجاد کنند. یافته‌های آنها نشان می‌دهد که صحت اطلاعات در نشانه‌های پاسخ دقیق متمرکز است.

برای پیش‌بینی هذیان‌ها، محققان مدل‌های طبقه‌بندی‌کننده را آموزش دادند که آنها را «طبقه‌بندی‌کننده‌های کاوشگر» می‌نامند تا ویژگی‌های مربوط به صحت خروجی‌های تولید شده بر اساس فعال‌سازی‌های داخلی LLM را پیش‌بینی کنند. محققان دریافتند که آموزش طبقه‌بندی‌کننده‌ها بر روی نشانه‌های پاسخ دقیق می‌تواند به میزان قابل‌توجهی تشخیص خطا را بهبود می‌بخشد.

در نهایت، آن‌ها نتیجه‌گیری کردند که مدل‌های زبانی بزرگ می‌توانند اطلاعات مربوط به حقیقت خود را رمزگذاری کنند.

نوشته شده توسط: دیجیاتو

اخبار مرتبط

کپی شد

اشتراک گذاری

برترین مطالب روز

امروز جدید
پربازدید اخیر
پربحث این هفته

پردیس نیوز

پردیس نیوز

افشاگری یک مستندساز از بحران پسماند در شمال کشور/ تهدید به مرگ شدم!

عکسی از سریال جدید محمدحسین لطیفی/«خسوف» برای محرم آماده می‌شود

کنداکتور شبکه نسیم به احترام خانواده‌های شهدای دی‌ماه تغییر کرد

پارلمان اروپا استفاده از هوش مصنوعی روی دستگاه‌های سازمانی را ممنوع کرد

قالیباف: ایران یکپارچه سوگوار مراسم چهلم فرزندان دلبند شهید خود است

میزان تسهیلات ازدواج و فرزندآوری تعیین شد

پزشکیان: نباید اجازه دهیم سلامت پلیس در ماموریت‌ها به خطر بیفتد

در مواجهه با اخبار آکسیوس هوشیار باشیم

مجوز مجلس برای به‌کارگیری ۱۰ هزار معلم بازنشسته و حق‌التدریس

حجت‌الاسلام سیدمحمدجواد جلالی دبیر هیئت اجرایی شورای وحدت شد

درباره مـا

به‌روز فان از سال ۱۳۹۱ رسانه‌ای در حوزه ارائه روزانه مطالب سرگرم‌کننده و فان است که با انتشار محتوای جذاب، متنوع و مناسب برای علاقه‌مندان به سرگرمی و تفریح سالم در فضای دیجیتال، لحظه‌های شاد، خلاق و اجتماعی و ترندهای روز را برای مخاطبان روایت می‌کند.

اطلاعات به‌روز فان

مطالب مدرن روز

اخبار فرهنگ و جامعه

خبرنامه و شبکه های اجتماعی

برای دریافت جدیدترین مطالب ایمیل خود را وارد کنید.
هیچ ایمیل تبلیغاتی ارسال نخواهد شد.

عضویت در خبرنامه

آخرین خبرها را میتوانید از طریق اپلیکیشن موبایل دریافت کنید

تمامی حقوق مادی و معنوی این وب‌سایت متعلق به مجله «به‌روز فان» است و استفاده از مطالب آن تنها برای مقاصد غیرتجاری و با ذکر منبع بلامانع می‌باشد.