۳۰ ریاضی‌دان مطرح از عملکرد هوش مصنوعی در حل مسائل پیچیده شگفت‌زده شدند

۳۰ نفر از برجسته‌ترین ریاضیدانان جهان توانایی‌های مدل پیشرفته ChatGPT را در حل مسائل دشوار ارزیابی کردند.

کد خبر: 10566

زمان انتشار: 30 دسامبر 2025 - 03:37 ق.ظ -

3 بازدید

در یک گردهمایی در کالیفرنیا، ۳۰ نفر از برجسته‌ترین ریاضیدانان جهان در یک رویارویی مستقیم، توانایی‌های مدل پیشرفته هوش مصنوعی را در حل مسائل دشوار ارزیابی کردند. نتیجه باعث شگفتی و تحسین این افراد شد: مدل استدلال‌گر ChatGPT توانست مسائل بسیار پیچیده در سطح دکترا را حل کند.

براساس گزارش لایو ساینس، در اواسط ماه مه امسال یک رویداد علمی منحصربه‌فرد و محرمانه برگزار شد. ۳۰ نفر از نوابغ ریاضی جهان از سراسر دنیا جمع شدند تا در یک آزمون دو روزه توانایی‌های مدل استدلال‌گر o4-mini شرکت OpenAI را بسنجند. هدف طرح مسائلی بود که حتی برای یک ریاضیدان حرفه‌ای نیز چالش‌برانگیز باشد.

مسائل ریاضی دشوار برای ChatGPT

این رویارویی بخشی از یک پروژه بنچمارک به نام FrontierMath بود که توسط سازمان غیرانتفاعی Epoch AI و به سفارش OpenAI اجرا می‌شد. هدف ارزیابی توانایی واقعی هوش مصنوعی در استدلال و حل مسائلی بود که راه‌حل آنها پیشتر در اینترنت منتشر نشده و مدل نمی‌توانست صرفاً با جستجو به پاسخ برسد. برای جلوگیری از هرگونه تقلب ناخواسته، تمام ارتباطات میان ریاضیدانان شرکت‌کننده از طریق اپلیکیشن امن سیگنال انجام می‌شد و آنها متعهد به عدم افشای اطلاعات بودند.

chatGPT ریاضیدان — ۳۰ ریاضی‌دان مطرح از عملکرد هوش مصنوعی در حل مسائل پیچیده شگفت‌زده شدند

در ابتدا، ریاضیدانان با طرح مسائل پیچیده، در به چالش‌کشیدن هوش مصنوعی موفق بودند. برای هر مسئله‌ای که چت‌بات قادر به حل آن نبود، طراح سؤال یک جایزه ۷ هزار و ۵۰۰ دلاری دریافت می‌کرد. اما اوضاع تغییر کرد.

«کن اونو» (Ken Ono)، ریاضیدان سرشناس از دانشگاه ویرجینیا و یکی از داوران این رویداد، روایت می‌کند که چگونه ابتدا از عملکرد بات ناامید شده بود. اما او یک مسئله حل‌نشده در «نظریه اعداد» را که در سطح دکترا بود، برای چت‌بات مطرح کرد. اتفاقی که در ۱۰ دقیقه بعد رخ داد، همه را شگفت‌زده کرد:

ربات ابتدا دو دقیقه را صرف یافتن و تسلط بر تمام مقالات علمی مرتبط با آن حوزه کرد. سپس روی صفحه نوشت که برای یادگیری، ابتدا قصد دارد یک نسخه ساده‌تر از همان مسئله را حل کند. چند دقیقه بعد اعلام کرد که اکنون آماده حل مسئله اصلی و دشوارتر است. پنج دقیقه پس از آن، o4-mini یک راه‌حل کاملاً صحیح و در عین حال، به گفته پروفسور اونو، «گستاخانه» ارائه داد. این هوش مصنوعی در آخر جوابش گفت: «نیازی نیست به جایی استناد کنم، چون این مسئله را خودم حل کردم.»

پروفسور اونو می‌گوید: «من همکارانی دارم که به معنای واقعی کلمه گفتند این مدل‌ها دارند به سطح نبوغ ریاضی نزدیک می‌شوند.»

مدل o4-mini، برخلاف مدل‌های زبانی بزرگ معمولی که صرفاً به دنبال پیش‌بینی کلمه بعدی هستند، یک LLM استدلال‌گر است. این مدل‌ها بر روی مجموعه داده‌های تخصصی و با بازخورد انسانی بسیار قوی‌تر آموزش می‌بینند. این رویکرد به آنها اجازه می‌دهد تا به‌جای تکرار اطلاعات، به درک عمیق‌تری از مسائل پیچیده دست یابند و فرایند استدلال خود را مرحله به مرحله نمایش دهند.

نوشته شده توسط: دیجیاتو

اخبار مرتبط

کپی شد

اشتراک گذاری

برترین مطالب روز

امروز جدید
پربازدید اخیر
پربحث این هفته

پردیس نیوز

پردیس نیوز

کاندوم؛ یادگاری عجیب المپیک میلان 2026

پرسپولیس پاسخ استعفای اوسمار را داد

ماجرای وام کلان استقلال به رامین رضاییان چیست؟

هشدار محققان: بات‌ها در شبکه‌های اجتماعی می‌توانند افکار عمومی را فریب دهند

عقب‌نشینی بایت‌دنس در پی اعتراض هالیوود؛ هوش مصنوعی Seedance 2.0 محدود می‌شود

حمایت‌ از کارآفرینان باید به‌طور جدی در دستور کار مجلس قرار گیرد

آغاز رزمایش کنترل هوشمند تنگۀ هرمز نیروی دریایی سپاه

جزئیاتی از دیدار عراقچی با گروسی پیرامون مذاکرات هسته‌ای

دومین مجمع عمومی جمعیت اعتلا برگزار شد

حسینی: احزاب وظیفه دارند برای انقلاب نیرو تربیت کنند

درباره مـا

به‌روز فان از سال ۱۳۹۱ رسانه‌ای در حوزه ارائه روزانه مطالب سرگرم‌کننده و فان است که با انتشار محتوای جذاب، متنوع و مناسب برای علاقه‌مندان به سرگرمی و تفریح سالم در فضای دیجیتال، لحظه‌های شاد، خلاق و اجتماعی و ترندهای روز را برای مخاطبان روایت می‌کند.

اطلاعات به‌روز فان

مطالب مدرن روز

اخبار فرهنگ و جامعه

خبرنامه و شبکه های اجتماعی

برای دریافت جدیدترین مطالب ایمیل خود را وارد کنید.
هیچ ایمیل تبلیغاتی ارسال نخواهد شد.

عضویت در خبرنامه

آخرین خبرها را میتوانید از طریق اپلیکیشن موبایل دریافت کنید

تمامی حقوق مادی و معنوی این وب‌سایت متعلق به مجله «به‌روز فان» است و استفاده از مطالب آن تنها برای مقاصد غیرتجاری و با ذکر منبع بلامانع می‌باشد.