مدل جدید OpenAI در المپیاد جهانی ریاضی 2025 در سطح مدال طلا عمل کرد

به‌گفته پژوهشگر OpenAI، این مدل جدید توانسته 5 مسئله از 6 مسئله المپیاد 2025 را حل کند و در مجموع امتیاز 35 را کسب کند.

کد خبر: 10481

زمان انتشار: 30 دسامبر 2025 - 03:33 ق.ظ -

2 بازدید

مدل زبانی جدید OpenAI که برای استدلال و حل مسائل پیچیده طراحی شده، موفق به کسب عملکردی در سطح مدال طلای المپیاد جهانی ریاضی (IMO) سال 2025 شده است.

طبق اعلام «الکساندر وی»، پژوهشگر OpenAI، این مدل در شرایطی مشابه شرکت‌کنندگان انسانی، یعنی دو جلسه 4.5 ساعته بدون دسترسی به ابزار، اینترنت یا منابع خارجی، آزمایش شده است. مدل OpenAI صرفاً با خواندن توضیح رسمی مسائل و ارائه اثبات‌هایی به زبان طبیعی توانسته به این دستاورد بزرگ برسد.

وی توضیح می‌دهد که این موفقیت از چند جهت اهمیت دارد. اول اینکه مسائل IMO به تفکر خلاق و استدلال مداوم در بازه زمانی طولانی نیازمند هستند. به گفته او، مسیر پیشرفت مدل‌های زبانی در درک ریاضی از حل مسائل ساده‌ای مانند GSM8K با زمان حل زیر یک دقیقه آغاز شده و حالا به IMO با بازه زمانی 100 دقیقه رسیده است.

دوم اینکه توضیحات IMO چندصفحه‌ای هستند و ارزیابی آنها دشوارتر است و به همین‌دلیل، عبور از چارچوب‌های سنتی یادگیری تقویتی برای رسیدن به استدلال‌های دقیق انسانی، دستاوردی قابل‌توجه محسوب می‌شود. نمونه‌ای از سؤالات این آزمون در تصویر زیر آمده است.

عملکرد مدل OpenAI در المپیاد ریاضی

به گفته پژوهشگر OpenAI، این مدل زبانی جدید توانسته 5 مسئله از 6 مسئله المپیاد 2025 را حل کند و در مجموع امتیاز 35 را از مجموع 42 امتیاز ممکن کسب کند. وی ادعا می‌کند که این امتیاز معادل مدال طلا است. همچنین هر پاسخ مدل توسط سه مدال‌آور سابق IMO به‌صورت مستقل بررسی شده و نمره نهایی با اجماع کامل آنها تعیین شده است.

مدل جدید OpenAI در المپیاد جهانی ریاضی 2025 در سطح مدال طلا عمل کرد

مدل جدید OpenAI فعلاً یک نمونه آزمایشی است و قرار نیست نسخه‌ای با این سطح از توانایی در حل مسائل ریاضی طی چند ماه آینده منتشر شود. بااین‌حال، وی تأکید کرده که این موفقیت سرعت بالای پیشرفت هوش مصنوعی طی سال‌های اخیر را نشان می‌دهد.

هوش مصنوعی در حوزه‌هایی مثل برنامه‌نویسی و ریاضیات پیشرفت سریعی داشته است. تنها چند روز پیش، یکی از مدل‌های OpenAI موفق شد در مسابقه برنامه‌نویسی AtCoder رتبه دوم را کسب کند و بالاتر از همه انسان‌ها (به جز یک نفر) قرار بگیرد. همچنین در هفته‌های گذشته، مدل Grok-4 Heavy توانست نمره کامل 100 را در آزمون ریاضی‌محور AIME 25 کسب کند. حالا با موفقیت OpenAI در IMO، به نظر می‌رسد زمان زیادی تا پیشی گرفتن کامل هوش مصنوعی از انسان‌ها در زمینه‌هایی مانند ریاضیات و برنامه‌نویسی باقی نمانده باشد.

نوشته شده توسط: دیجیاتو

اخبار مرتبط

کپی شد

اشتراک گذاری

برترین مطالب روز

امروز جدید
پربازدید اخیر
پربحث این هفته

پردیس نیوز

پردیس نیوز

فارس: سه نفتکش توقیف شده توسط هند ارتباطی با ایران ندارد

ایران گنبد جدید حرم امام حسین (ع) را با طلا ساخت / طلاهای گنبد از کجا تأمین شد؟

زمان ورود ناو آمریکایی به منطقه مشخص شد؟ / اعلام وضعیت فوق العاده

آیا حماس خلع سلاح خواهد شد؟/ پاسخ رهبران حماس به آخرین مهلت خلع سلاح

اظهارات جدید وزیر امور خارجه آمریکا درمورد وضعیت مذاکرات با ایران

تصمیم جدید دولت لبنان درمورد خلع سلاح حزب الله

فوری/ جنگ اوکراین متوقف می‌شود؛ موافقت زلنسکی با پیشنهاد‌ آتش‌بس

واکنش سوئیس به نقش عمان در گفت‌و‌گو میان آمریکا و ایران

رسوایی مالی تازه در استقلال/ پشت‌پرده پرداخت وام ۴۷ میلیاردی به رامین رضاییان چیست؟

اینفانتینو لبنانی شد/ رئیس فیفا سومین تابعیتش را گرفت

درباره مـا

به‌روز فان از سال ۱۳۹۱ رسانه‌ای در حوزه ارائه روزانه مطالب سرگرم‌کننده و فان است که با انتشار محتوای جذاب، متنوع و مناسب برای علاقه‌مندان به سرگرمی و تفریح سالم در فضای دیجیتال، لحظه‌های شاد، خلاق و اجتماعی و ترندهای روز را برای مخاطبان روایت می‌کند.

اطلاعات به‌روز فان

مطالب مدرن روز

اخبار فرهنگ و جامعه

خبرنامه و شبکه های اجتماعی

برای دریافت جدیدترین مطالب ایمیل خود را وارد کنید.
هیچ ایمیل تبلیغاتی ارسال نخواهد شد.

عضویت در خبرنامه

آخرین خبرها را میتوانید از طریق اپلیکیشن موبایل دریافت کنید

تمامی حقوق مادی و معنوی این وب‌سایت متعلق به مجله «به‌روز فان» است و استفاده از مطالب آن تنها برای مقاصد غیرتجاری و با ذکر منبع بلامانع می‌باشد.