چالش دیگری برای OpenAI؛ محققان با کمتر از 50 دلار مدل هوش مصنوعی استدلال‌گر رایگان ساخته‌اند

این مدل از طریق فرایندی با نام «تقطیر» ساخته شده است که برای استخراج قابلیت‌های «استدلال» از یک مدل هوش مصنوعی دیگر کاربرد دارد.

کد خبر: 12577

زمان انتشار: 30 دسامبر 2025 - 05:29 ق.ظ -

3 بازدید

طی هفته‌های گذشته هوش مصنوعی چینی DeepSeek که با هزینه‌ای بسیار کمتر از مدل‌های آمریکایی ساخته شده باعث سقوط سهام شرکت‌های فناوری و بازارهای جهان شده بود. حالا محققان دانشگاه‌های استنفورد و واشنگتن در مقاله جدیدی ادعا کرده‌اند که با کمتر از 50 دلار موفق به ساخت یک مدل هوش مصنوعی استدلال‌گر رایگان مانند o1 از OpenAI شده‌اند.

طبق گزارش‌های منتشر شده، این مدل که s1 نام دارد در تست‌هایی که توانایی آن در ریاضی و کدنویسی را اندازه‌گیری می‌کنند، مشابه مدل‌های استدلال‌گر پیشرفته مانند o1 و DeepSeek R1 عمل کرده است. هم‌اکنون مدل s1 به همراه داده‌ها و کد مورد استفاده برای آموزش آن در GitHub موجود است.

ساخت مدل هوش مصنوعی رایگان s1

چالش دیگری برای OpenAI؛ محققان با کمتر از 50 دلار مدل هوش مصنوعی استدلال‌گر رایگان ساخته‌اند

محققان در مقاله خود می‌گویند که ابتدا یک مدل پایه را توسعه داده‌اند و سپس از طریق فرایندی با نام «تقطیر» که برای استخراج قابلیت‌های «استدلال» از یک مدل هوش مصنوعی دیگر کاربرد دارد، آن را تنظیم کرده‌اند. به گفته آنها، برای این فرایند از مدل جمینای 2.0 Flash Thinking Experimental گوگل کمک گرفته شده است.

به گفته محققان، آموزش s1 با 16 پردازنده گرافیکی انویدیا H100 کمتر از 30 دقیقه طول کشیده است و این مدل در برخی از بنچمارک‌های هوش مصنوعی به عملکرد بسیار خوبی دست یافته است.

تیم تحقیقاتی سازنده s1 در توسعه مدل خود به دنبال ساده‌ترین رویکرد برای دستیابی به عملکرد قدرتمند در استدلال و «مقیاس‌بندی زمان آزمون» بوده‌اند که مورد دوم به مدل هوش مصنوعی اجازه می‌دهد تا قبل از ارائه پاسخ بیشتر فکر کند. البته OpenAI نیز در مدل o1 خود به چنین پیشرفت‌هایی دست یافته بود و سپس DeepSeek و دیگر آزمایشگاه‌های هوش مصنوعی نیز سعی کرده‌اند تا آنها را از طریق تکنیک‌های مختلف مورد استفاده قرار دهند.

مقاله s1 نشان می‌دهد که مدل‌های استدلال‌گرا را می‌توان از طریق فرایندی به نام «تنظیم دقیق نظارت‌شده» (SFT) با یک مجموعه داده نسبتاً کوچک تقطیر کرد. در این فرایند به مدل هوش مصنوعی دستور داده می‌شود که رفتارهای خاصی را در یک مجموعه داده شبیه‌سازی کند. گفته می‌شود که فرایند SFT نسبت به روش یادگیری تقویتی که DeepSeek برای آموزش مدل R1 براساس o1 انجام داده، ارزان‌تر است.

نوشته شده توسط: دیجیاتو

اخبار مرتبط

کپی شد

اشتراک گذاری

برترین مطالب روز

امروز جدید
پربازدید اخیر
پربحث این هفته

پردیس نیوز

پردیس نیوز

افشاگری یک مستندساز از بحران پسماند در شمال کشور/ تهدید به مرگ شدم!

عکسی از سریال جدید محمدحسین لطیفی/«خسوف» برای محرم آماده می‌شود

کنداکتور شبکه نسیم به احترام خانواده‌های شهدای دی‌ماه تغییر کرد

پارلمان اروپا استفاده از هوش مصنوعی روی دستگاه‌های سازمانی را ممنوع کرد

قالیباف: ایران یکپارچه سوگوار مراسم چهلم فرزندان دلبند شهید خود است

میزان تسهیلات ازدواج و فرزندآوری تعیین شد

پزشکیان: نباید اجازه دهیم سلامت پلیس در ماموریت‌ها به خطر بیفتد

در مواجهه با اخبار آکسیوس هوشیار باشیم

مجوز مجلس برای به‌کارگیری ۱۰ هزار معلم بازنشسته و حق‌التدریس

حجت‌الاسلام سیدمحمدجواد جلالی دبیر هیئت اجرایی شورای وحدت شد

درباره مـا

به‌روز فان از سال ۱۳۹۱ رسانه‌ای در حوزه ارائه روزانه مطالب سرگرم‌کننده و فان است که با انتشار محتوای جذاب، متنوع و مناسب برای علاقه‌مندان به سرگرمی و تفریح سالم در فضای دیجیتال، لحظه‌های شاد، خلاق و اجتماعی و ترندهای روز را برای مخاطبان روایت می‌کند.

اطلاعات به‌روز فان

مطالب مدرن روز

اخبار فرهنگ و جامعه

خبرنامه و شبکه های اجتماعی

برای دریافت جدیدترین مطالب ایمیل خود را وارد کنید.
هیچ ایمیل تبلیغاتی ارسال نخواهد شد.

عضویت در خبرنامه

آخرین خبرها را میتوانید از طریق اپلیکیشن موبایل دریافت کنید

تمامی حقوق مادی و معنوی این وب‌سایت متعلق به مجله «به‌روز فان» است و استفاده از مطالب آن تنها برای مقاصد غیرتجاری و با ذکر منبع بلامانع می‌باشد.