- فارس: سه نفتکش توقیف شده توسط هند ارتباطی با ایران ندارد
- ایران گنبد جدید حرم امام حسین (ع) را با طلا ساخت / طلاهای گنبد از کجا تأمین شد؟
- زمان ورود ناو آمریکایی به منطقه مشخص شد؟ / اعلام وضعیت فوق العاده
- آیا حماس خلع سلاح خواهد شد؟/ پاسخ رهبران حماس به آخرین مهلت خلع سلاح
- اظهارات جدید وزیر امور خارجه آمریکا درمورد وضعیت مذاکرات با ایران
- تصمیم جدید دولت لبنان درمورد خلع سلاح حزب الله
- فوری/ جنگ اوکراین متوقف میشود؛ موافقت زلنسکی با پیشنهاد آتشبس
- واکنش سوئیس به نقش عمان در گفتوگو میان آمریکا و ایران
- رسوایی مالی تازه در استقلال/ پشتپرده پرداخت وام ۴۷ میلیاردی به رامین رضاییان چیست؟
- اینفانتینو لبنانی شد/ رئیس فیفا سومین تابعیتش را گرفت
مدل جدید OpenAI در المپیاد جهانی ریاضی 2025 در سطح مدال طلا عمل کرد
مدل زبانی جدید OpenAI که برای استدلال و حل مسائل پیچیده طراحی شده، موفق به کسب عملکردی در سطح مدال طلای المپیاد جهانی ریاضی (IMO) سال 2025 شده است.
طبق اعلام «الکساندر وی»، پژوهشگر OpenAI، این مدل در شرایطی مشابه شرکتکنندگان انسانی، یعنی دو جلسه 4.5 ساعته بدون دسترسی به ابزار، اینترنت یا منابع خارجی، آزمایش شده است. مدل OpenAI صرفاً با خواندن توضیح رسمی مسائل و ارائه اثباتهایی به زبان طبیعی توانسته به این دستاورد بزرگ برسد.
وی توضیح میدهد که این موفقیت از چند جهت اهمیت دارد. اول اینکه مسائل IMO به تفکر خلاق و استدلال مداوم در بازه زمانی طولانی نیازمند هستند. به گفته او، مسیر پیشرفت مدلهای زبانی در درک ریاضی از حل مسائل سادهای مانند GSM8K با زمان حل زیر یک دقیقه آغاز شده و حالا به IMO با بازه زمانی 100 دقیقه رسیده است.
دوم اینکه توضیحات IMO چندصفحهای هستند و ارزیابی آنها دشوارتر است و به همیندلیل، عبور از چارچوبهای سنتی یادگیری تقویتی برای رسیدن به استدلالهای دقیق انسانی، دستاوردی قابلتوجه محسوب میشود. نمونهای از سؤالات این آزمون در تصویر زیر آمده است.
عملکرد مدل OpenAI در المپیاد ریاضی
به گفته پژوهشگر OpenAI، این مدل زبانی جدید توانسته 5 مسئله از 6 مسئله المپیاد 2025 را حل کند و در مجموع امتیاز 35 را از مجموع 42 امتیاز ممکن کسب کند. وی ادعا میکند که این امتیاز معادل مدال طلا است. همچنین هر پاسخ مدل توسط سه مدالآور سابق IMO بهصورت مستقل بررسی شده و نمره نهایی با اجماع کامل آنها تعیین شده است.

مدل جدید OpenAI فعلاً یک نمونه آزمایشی است و قرار نیست نسخهای با این سطح از توانایی در حل مسائل ریاضی طی چند ماه آینده منتشر شود. بااینحال، وی تأکید کرده که این موفقیت سرعت بالای پیشرفت هوش مصنوعی طی سالهای اخیر را نشان میدهد.
هوش مصنوعی در حوزههایی مثل برنامهنویسی و ریاضیات پیشرفت سریعی داشته است. تنها چند روز پیش، یکی از مدلهای OpenAI موفق شد در مسابقه برنامهنویسی AtCoder رتبه دوم را کسب کند و بالاتر از همه انسانها (به جز یک نفر) قرار بگیرد. همچنین در هفتههای گذشته، مدل Grok-4 Heavy توانست نمره کامل 100 را در آزمون ریاضیمحور AIME 25 کسب کند. حالا با موفقیت OpenAI در IMO، به نظر میرسد زمان زیادی تا پیشی گرفتن کامل هوش مصنوعی از انسانها در زمینههایی مانند ریاضیات و برنامهنویسی باقی نمانده باشد.
- هشدار محققان: باتها در شبکههای اجتماعی میتوانند افکار عمومی را فریب دهند
- عقبنشینی بایتدنس در پی اعتراض هالیوود؛ هوش مصنوعی Seedance 2.0 محدود میشود
- مدیرعامل گوگل و OpenAI برای شرکت در اجلاس هوش مصنوعی به هند میروند
- تنش میان پنتاگون و آنتروپیک بر سر استفاده نظامی از هوش مصنوعی بالا گرفت
- تحول طراحی مدار الکترونیکی با هوش مصنوعی جدید در ۲۰۲۶
- نتیجه عجیب آزمایش شبیهسازی فروشندگی: ایجنت هوش مصنوعی Claude کارتل تشکیل داد
- ماجرای فشار «پنتاگون» به شرکتهای هوش مصنوعی چیست؟
- «چتجیپیتی» در هند ۱۰۰ میلیون کاربر هفتگی دارد
- جنجال بر سر پیشبینی درآمد از روی چهره!
- واکنش تند هالیوود به هوش مصنوعی بایتدنس؛ Seedance 2.0 متهم به سرقت هنری شد
