مدل زبانی جدید اپل می‌تواند با سرعتی خیره‌کننده متون طولانی تولید کند

اپل مدل زبان جدیدی معرفی کرده که متن‌های بلند را با سرعتی 128 برابر سریع‌تر از مدل‌های مشابه تولید می‌کند.

کد خبر: 4613

زمان انتشار: 21 دسامبر 2025 - 08:45 ق.ظ -

4 بازدید

مدل زبانی جدید اپل با بهره‌گیری از معماری پیشرفته قادر است متن‌های بلند و پیچیده را با سرعتی فوق‌العاده و دقت بالا تولید کند. براساس گزارش‌ها، تیم تحقیقاتی اپل یک مدل مبتنی بر Diffusion ارائه کرده است که می‌تواند متن‌ها را تا 128 برابر سریع‌تر از مدل‌های مشابه ایجاد کند.

مدل‌های زبانی بزرگ مانند ChatGPT از نوع Autoregressive هستند؛ این مدل‌ها متن را به‌صورت توکن به توکن و پشت سر هم تولید می‌کنند و هر توکن را با در نظر گرفتن ورودی کاربر و تمام توکن‌های پیشین می‌سازند.

مدل زبانی جدید اپل سرعت بسیار زیادی دارد

در مقابل، مدل‌های Diffusion چند توکن را همزمان تولید کرده و در چند مرحله اصلاح می‌کنند تا پاسخ نهایی شکل بگیرد. یکی از انواع پیشرفته این مدل‌ها، Flow-matching است که مراحل اصلاح چندگانه را کنار می‌گذارد و تلاش می‌کند نتیجه نهایی را در یک مرحله به‌دست آورد.

معرفی مدل زبان سریع اپل — مدل زبانی جدید اپل می‌تواند با سرعتی خیره‌کننده متون طولانی تولید کند

مطالعه جدید اپل با عنوان «FS-DFM: Fast and Accurate Long Text Generation with Few-Step Diffusion Language Models» یک مدل جدید موسوم به Few-Step Discrete Flow-Matching (FS-DFM) معرفی می‌کند. این مدل می‌تواند متن‌های بلند را تنها با هشت مرحله اصلاح با سرعتی زیادی تولید کند، درحالی‌که مدل‌های Diffusion معمولی بیش از هزار مرحله نیاز داشتند تا کیفیت مشابه ارائه دهند.

برای رسیدن به این سرعت، پژوهشگران از سه مرحله استفاده کرده‌اند: ابتدا مدل آموزش می‌بیند که چندین مرحله اصلاح متن را مدیریت کند، سپس یک مدل «معلم» برای انجام به‌روزرسانی‌های دقیق و بزرگ‌تر در هر مرحله به کار گرفته می‌شود و در نهایت نحوه اجرای هر مرحله بهینه می‌شود تا مدل بتواند با طی مراحل کمتر و ثبات بیشتر به نتیجه برسد.

در مقایسه با مدل‌های بزرگ مشابه، FS-DFM در معیارهای «آنتروپی» و «سردرگمی» عملکرد قابل توجهی داشته است. سردرگمی کیفیت متن را اندازه می‌گیرد؛ هرچه پایین‌تر باشد، متن طبیعی‌تر و دقیق‌تر است. آنتروپی میزان اطمینان مدل در انتخاب هر کلمه را نشان می‌دهد؛ مقدار پایین متن را تکراری یا قابل پیش‌بینی می‌کند و مقدار زیاد باعث می‌شود متن نامنسجم یا تصادفی شود.

مدل FS-DFM با پارامترهای 1.7، 1.3 و 0.17 میلیارد، در مقایسه با مدل‌های Dream و LLaDA با 7 و 8 میلیارد پارامتر، در معیار سردرگمی عددی پایین‌تر و در آنتروپی نتیجه‌ای پایدارتر به‌دست آورد.

باتوجه‌به عملکرد عالی و کمبود مدل‌های مشابه، پژوهشگران اعلام کرده‌اند که قصد دارند کد و چک‌پوینت‌های مدل را منتشر کنند تا امکان بازتولید و تحقیقات بیشتر فراهم شود. مطالعه کامل مقاله در arXiv شامل نمونه‌های عملکردی و نمودارهایی است که مراحل اصلاح هر توکن و نحوه تغییرات آن را نشان می‌دهد.

نوشته شده توسط: دیجیاتو

اخبار مرتبط

کپی شد

اشتراک گذاری

برترین مطالب روز

امروز جدید
پربازدید اخیر
پربحث این هفته

پردیس نیوز

پردیس نیوز

پارلمان اروپا استفاده از هوش مصنوعی روی دستگاه‌های سازمانی را ممنوع کرد

قالیباف: ایران یکپارچه سوگوار مراسم چهلم فرزندان دلبند شهید خود است

میزان تسهیلات ازدواج و فرزندآوری تعیین شد

پزشکیان: نباید اجازه دهیم سلامت پلیس در ماموریت‌ها به خطر بیفتد

در مواجهه با اخبار آکسیوس هوشیار باشیم

مجوز مجلس برای به‌کارگیری ۱۰ هزار معلم بازنشسته و حق‌التدریس

حجت‌الاسلام سیدمحمدجواد جلالی دبیر هیئت اجرایی شورای وحدت شد

سازوکار مجلس برای پوشش بیمه‌ای دستیاران علوم پزشکی

تعیین میزان تسهیلات اشتغال خرد و خانگی در سال آینده

ورود هوش مصنوعی به اتاق تصمیم وزارت جهادکشاورزی؛ از تحلیل قوانین تا پایش نیروی انسانی

درباره مـا

به‌روز فان از سال ۱۳۹۱ رسانه‌ای در حوزه ارائه روزانه مطالب سرگرم‌کننده و فان است که با انتشار محتوای جذاب، متنوع و مناسب برای علاقه‌مندان به سرگرمی و تفریح سالم در فضای دیجیتال، لحظه‌های شاد، خلاق و اجتماعی و ترندهای روز را برای مخاطبان روایت می‌کند.

اطلاعات به‌روز فان

مطالب مدرن روز

اخبار فرهنگ و جامعه

خبرنامه و شبکه های اجتماعی

برای دریافت جدیدترین مطالب ایمیل خود را وارد کنید.
هیچ ایمیل تبلیغاتی ارسال نخواهد شد.

عضویت در خبرنامه

آخرین خبرها را میتوانید از طریق اپلیکیشن موبایل دریافت کنید

تمامی حقوق مادی و معنوی این وب‌سایت متعلق به مجله «به‌روز فان» است و استفاده از مطالب آن تنها برای مقاصد غیرتجاری و با ذکر منبع بلامانع می‌باشد.