- کاندوم؛ یادگاری عجیب المپیک میلان 2026
- پرسپولیس پاسخ استعفای اوسمار را داد
- ماجرای وام کلان استقلال به رامین رضاییان چیست؟
- هشدار محققان: باتها در شبکههای اجتماعی میتوانند افکار عمومی را فریب دهند
- عقبنشینی بایتدنس در پی اعتراض هالیوود؛ هوش مصنوعی Seedance 2.0 محدود میشود
- حمایت از کارآفرینان باید بهطور جدی در دستور کار مجلس قرار گیرد
- آغاز رزمایش کنترل هوشمند تنگۀ هرمز نیروی دریایی سپاه
- جزئیاتی از دیدار عراقچی با گروسی پیرامون مذاکرات هستهای
- دومین مجمع عمومی جمعیت اعتلا برگزار شد
- حسینی: احزاب وظیفه دارند برای انقلاب نیرو تربیت کنند
۳۰ ریاضیدان مطرح از عملکرد هوش مصنوعی در حل مسائل پیچیده شگفتزده شدند
در یک گردهمایی در کالیفرنیا، ۳۰ نفر از برجستهترین ریاضیدانان جهان در یک رویارویی مستقیم، تواناییهای مدل پیشرفته هوش مصنوعی را در حل مسائل دشوار ارزیابی کردند. نتیجه باعث شگفتی و تحسین این افراد شد: مدل استدلالگر ChatGPT توانست مسائل بسیار پیچیده در سطح دکترا را حل کند.
براساس گزارش لایو ساینس، در اواسط ماه مه امسال یک رویداد علمی منحصربهفرد و محرمانه برگزار شد. ۳۰ نفر از نوابغ ریاضی جهان از سراسر دنیا جمع شدند تا در یک آزمون دو روزه تواناییهای مدل استدلالگر o4-mini شرکت OpenAI را بسنجند. هدف طرح مسائلی بود که حتی برای یک ریاضیدان حرفهای نیز چالشبرانگیز باشد.
مسائل ریاضی دشوار برای ChatGPT
این رویارویی بخشی از یک پروژه بنچمارک به نام FrontierMath بود که توسط سازمان غیرانتفاعی Epoch AI و به سفارش OpenAI اجرا میشد. هدف ارزیابی توانایی واقعی هوش مصنوعی در استدلال و حل مسائلی بود که راهحل آنها پیشتر در اینترنت منتشر نشده و مدل نمیتوانست صرفاً با جستجو به پاسخ برسد. برای جلوگیری از هرگونه تقلب ناخواسته، تمام ارتباطات میان ریاضیدانان شرکتکننده از طریق اپلیکیشن امن سیگنال انجام میشد و آنها متعهد به عدم افشای اطلاعات بودند.

در ابتدا، ریاضیدانان با طرح مسائل پیچیده، در به چالشکشیدن هوش مصنوعی موفق بودند. برای هر مسئلهای که چتبات قادر به حل آن نبود، طراح سؤال یک جایزه ۷ هزار و ۵۰۰ دلاری دریافت میکرد. اما اوضاع تغییر کرد.
«کن اونو» (Ken Ono)، ریاضیدان سرشناس از دانشگاه ویرجینیا و یکی از داوران این رویداد، روایت میکند که چگونه ابتدا از عملکرد بات ناامید شده بود. اما او یک مسئله حلنشده در «نظریه اعداد» را که در سطح دکترا بود، برای چتبات مطرح کرد. اتفاقی که در ۱۰ دقیقه بعد رخ داد، همه را شگفتزده کرد:
ربات ابتدا دو دقیقه را صرف یافتن و تسلط بر تمام مقالات علمی مرتبط با آن حوزه کرد. سپس روی صفحه نوشت که برای یادگیری، ابتدا قصد دارد یک نسخه سادهتر از همان مسئله را حل کند. چند دقیقه بعد اعلام کرد که اکنون آماده حل مسئله اصلی و دشوارتر است. پنج دقیقه پس از آن، o4-mini یک راهحل کاملاً صحیح و در عین حال، به گفته پروفسور اونو، «گستاخانه» ارائه داد. این هوش مصنوعی در آخر جوابش گفت: «نیازی نیست به جایی استناد کنم، چون این مسئله را خودم حل کردم.»
پروفسور اونو میگوید: «من همکارانی دارم که به معنای واقعی کلمه گفتند این مدلها دارند به سطح نبوغ ریاضی نزدیک میشوند.»
مدل o4-mini، برخلاف مدلهای زبانی بزرگ معمولی که صرفاً به دنبال پیشبینی کلمه بعدی هستند، یک LLM استدلالگر است. این مدلها بر روی مجموعه دادههای تخصصی و با بازخورد انسانی بسیار قویتر آموزش میبینند. این رویکرد به آنها اجازه میدهد تا بهجای تکرار اطلاعات، به درک عمیقتری از مسائل پیچیده دست یابند و فرایند استدلال خود را مرحله به مرحله نمایش دهند.
- هشدار محققان: باتها در شبکههای اجتماعی میتوانند افکار عمومی را فریب دهند
- عقبنشینی بایتدنس در پی اعتراض هالیوود؛ هوش مصنوعی Seedance 2.0 محدود میشود
- مدیرعامل گوگل و OpenAI برای شرکت در اجلاس هوش مصنوعی به هند میروند
- تنش میان پنتاگون و آنتروپیک بر سر استفاده نظامی از هوش مصنوعی بالا گرفت
- تحول طراحی مدار الکترونیکی با هوش مصنوعی جدید در ۲۰۲۶
- نتیجه عجیب آزمایش شبیهسازی فروشندگی: ایجنت هوش مصنوعی Claude کارتل تشکیل داد
- ماجرای فشار «پنتاگون» به شرکتهای هوش مصنوعی چیست؟
- «چتجیپیتی» در هند ۱۰۰ میلیون کاربر هفتگی دارد
- جنجال بر سر پیشبینی درآمد از روی چهره!
- واکنش تند هالیوود به هوش مصنوعی بایتدنس؛ Seedance 2.0 متهم به سرقت هنری شد
