- افشاگری یک مستندساز از بحران پسماند در شمال کشور/ تهدید به مرگ شدم!
- عکسی از سریال جدید محمدحسین لطیفی/«خسوف» برای محرم آماده میشود
- کنداکتور شبکه نسیم به احترام خانوادههای شهدای دیماه تغییر کرد
- پارلمان اروپا استفاده از هوش مصنوعی روی دستگاههای سازمانی را ممنوع کرد
- قالیباف: ایران یکپارچه سوگوار مراسم چهلم فرزندان دلبند شهید خود است
- میزان تسهیلات ازدواج و فرزندآوری تعیین شد
- پزشکیان: نباید اجازه دهیم سلامت پلیس در ماموریتها به خطر بیفتد
- در مواجهه با اخبار آکسیوس هوشیار باشیم
- مجوز مجلس برای بهکارگیری ۱۰ هزار معلم بازنشسته و حقالتدریس
- حجتالاسلام سیدمحمدجواد جلالی دبیر هیئت اجرایی شورای وحدت شد
بهروزرسانی جدید مدل DeepSeek R1 با انتشار روی Hugging Face رسماً معرفی شد [تماشا کنید]
استارتاپ چینی DeepSeek که بهعنوان یک رقیب جدی برای شرکتهای هوش مصنوعی آمریکایی فعالیت میکند، بهروزرسانی جدید مدل استدلالی R1 خود را از طریق پیامرسان WeChat معرفی و سپس در پلتفرم Hugging Face منتشر کرده است.
DeepSeek که امسال با مدل R1 توجه زیادی را به خود جلب کرد، حالا نسخه جدیدی از این مدل را با مجوز باز MIT روی پلتفرم Hugging Face منتشر کرده است. این مجوز به کاربران اجازه میدهد تا از این مدل بهصورت تجاری استفاده کنند.
به گفته DeepSeek، این بهروزرسانی جزئی است و نسبت به نسخه قبلی شامل چندین بهبود میشود. با این حال، مخزن مربوط به این مدل در Hugging Face فاقد توضیحات دقیق بوده و فقط شامل فایلهای پیکربندی و وزنهای مدل است؛ یعنی همان پارامترهایی که رفتار مدل را تعیین میکنند.
مدل جدید R1 دارای 685 میلیارد پارامتر است که نشاندهنده اندازه عظیم آن است. این حجم بالا باعث میشود اجرای مدل بدون تغییرات خاص روی سختافزارهای خانگی ممکن نباشد.
عملکرد مدل جدید DeepSeek R1 از زبان کاربران
![بهروزرسانی جدید مدل DeepSeek R1 با انتشار روی Hugging Face رسماً معرفی شد [تماشا کنید] بهروزرسانی جدید مدل DeepSeek R1 با انتشار روی Hugging Face رسماً معرفی شد [تماشا کنید]](https://static.digiato.com/digiato/2025/05/deepseek-939x1024.jpg)
طبق دادههای منتشرشده توسط برخی کاربران فعال در حوزه مدلهای هوش مصنوعی، نسخه جدید DeepSeek R1 عملکرد بهتری نسبت به نسخه قبلی خود در بنچمارک Thematic Generation ثبت کرده است. امتیاز این مدل در این آزمون از 1.80 به 1.74 کاهش یافته که نشاندهنده بهبود در توانایی مدل برای تولید محتوای موضوعمحور است؛ چرا که در این معیار، امتیاز پایینتر نشاندهنده کیفیت بالاتر است.
همچنین کاربر دیگری با انتشار ویدیوی زیر که عملکرد DeepSeek-R1-0528 (نسخه جدید) را در برابر Claude-4-Sonnet نشان میدهد، ادعا کرده که این نسخه در حوزه استدلال منطقی با بهبود قابلتوجهی همراه بوده است. طبق گفته این کاربر، مدل جدید در زمینه توسعه فرانتاند و استفاده هوشمندانهتر از ابزارها نیز پیشرفت کرده است.
این ارتقاها میتواند R1 را به گزینهای قویتر برای توسعهدهندگان و کاربران حرفهای تبدیل کند.
DeepSeek در اوایل سال جاری با معرفی نسخه اولیه مدل R1 سر و صدای زیادی بهپا کرد و حتی با رقبای بزرگی مانند OpenAI مقایسه شد. بااینحال، فناوری این استارتاپ چینی توجه برخی نهادهای نظارتی آمریکایی را نیز به خود جلب کرده و برخی آن را تهدیدی برای امنیت ملی ایالات متحده دانستهاند.
این حرکت همچنین موج جدیدی از انتشار مدلها توسط شرکتهای چینی نظیر علیبابا و Zhipu AI را به دنبال داشت.
- پارلمان اروپا استفاده از هوش مصنوعی روی دستگاههای سازمانی را ممنوع کرد
- ورود هوش مصنوعی به اتاق تصمیم وزارت جهادکشاورزی؛ از تحلیل قوانین تا پایش نیروی انسانی
- «اوپنایآی» توسعهدهنده هوش مصنوعی جنجالبرانگیز «OpenClaw» را استخدام کرد
- ۹۵ درصد استارتآپها در جهان با شکست مواجه میشوند
- معرفی یک هوش مصنوعی برای مراسم عشای ربانی توسط واتیکان
- خرچنگ دریایی هوش مصنوعی آنقدرها هم هیجانانگیز نیست!
- هشدار محققان: باتها در شبکههای اجتماعی میتوانند افکار عمومی را فریب دهند
- عقبنشینی بایتدنس در پی اعتراض هالیوود؛ هوش مصنوعی Seedance 2.0 محدود میشود
- مدیرعامل گوگل و OpenAI برای شرکت در اجلاس هوش مصنوعی به هند میروند
- تنش میان پنتاگون و آنتروپیک بر سر استفاده نظامی از هوش مصنوعی بالا گرفت
