- افشاگری یک مستندساز از بحران پسماند در شمال کشور/ تهدید به مرگ شدم!
- عکسی از سریال جدید محمدحسین لطیفی/«خسوف» برای محرم آماده میشود
- کنداکتور شبکه نسیم به احترام خانوادههای شهدای دیماه تغییر کرد
- پارلمان اروپا استفاده از هوش مصنوعی روی دستگاههای سازمانی را ممنوع کرد
- قالیباف: ایران یکپارچه سوگوار مراسم چهلم فرزندان دلبند شهید خود است
- میزان تسهیلات ازدواج و فرزندآوری تعیین شد
- پزشکیان: نباید اجازه دهیم سلامت پلیس در ماموریتها به خطر بیفتد
- در مواجهه با اخبار آکسیوس هوشیار باشیم
- مجوز مجلس برای بهکارگیری ۱۰ هزار معلم بازنشسته و حقالتدریس
- حجتالاسلام سیدمحمدجواد جلالی دبیر هیئت اجرایی شورای وحدت شد
مدل هوش مصنوعی جدید دیپسیک منتشر شد؛ ارتقایافته و سریعتر از رقبا
استارتاپ چینی DeepSeek بیسروصدا مدل هوش مصنوعی ارتقایافتهای به نام V3-0324 را منتشر کرده است. این مدل در بخشهای مختلف مانند کدنویسی بهبود یافته است. درکل دیپسیک ادعا میکند مدل هوش مصنوعی آن میتواند با مدلهای آمریکایی OpenAI و Anthropic رقابت کند یا آنها را شکست دهد.
براساس گزارش TechRadar، دیپسیک بهتازگی ارتقای قابلتوجهی برای مدل اصلی خود منتشر کرد. مدل جدید V3-0324 با حجم 641 گیگابایت اکنون متنباز با مجوز MIT در Hugging Face منتشر شده است. نکته عجیب اینکه برخلاف شرکتهای آمریکایی که تبلیغات زیادی برای مدلهای جدید خود میکنند، مدل جدید چینیها تقریباً بدون هیچ اطلاعیه خاصی منتشر شده است.
مدل هوش مصنوعی جدید دیپسیک
محقق هوش مصنوعی مدل جدید دیپسیک را روی مک استودیو با تراشه M3 Ultra اجرا کرده و نشان داده این مدل با سرعت بیش از 20 توکن در ثانیه عمل میکند. البته نباید از قدرت شگفتانگیز مک استودیوی 9 هزار و 500 دلاری غافل شد و شاید برای سنجش سرعت این هوش مصنوعی چنین سیستم قدرتمندی معیار عمومی خوبی نباشد.

باتوجهبه تستهای این شرکت، نسخه جدید DeepSeek از مدل V3 ارتقای قابل توجهی در تواناییهای مختلف مانند کدنویسی یافته است. شاید چنین ارتقاهایی بهخودیخود انقلابی نباشند اما سرعت پیشرفت DeepSeek قابلتوجه است.
دیپسیک که سال گذشته میلادی به شهرت رسید، پس از انتشار نسخه اصلی V3 در دسامبر، بهسرعت درحال پیشروی است. یک ماه بعد از انتشار نسخه اصلی، مدل استدلالگر R1 از راه رسید و اکنون V3-0324 منتشر شده است. حتی اگر مدلهای دیپسیک در برخی بنچمارکها نتوانند با مدلهای OpenAI و آنتروپیک رقابت کنند، از لحاظ قیمتی بسیار بهصرفهاند.
DeepSeek-V3-0324 از معماری «ترکیب متخصصان» (MoE) بهره میبرد که اساساً با نحوه عملکرد مدلهای زبانی بزرگ معمولی فرق دارد. مدلهای معمولی کل تعداد پارامترهای خود را برای یک کار فعال میکنند اما در رویکرد DeepSeek فقط حدود 37 میلیارد از 685 میلیارد پارامتر حین انجام وظایف خاص فعال میشوند.
- پارلمان اروپا استفاده از هوش مصنوعی روی دستگاههای سازمانی را ممنوع کرد
- ورود هوش مصنوعی به اتاق تصمیم وزارت جهادکشاورزی؛ از تحلیل قوانین تا پایش نیروی انسانی
- «اوپنایآی» توسعهدهنده هوش مصنوعی جنجالبرانگیز «OpenClaw» را استخدام کرد
- ۹۵ درصد استارتآپها در جهان با شکست مواجه میشوند
- معرفی یک هوش مصنوعی برای مراسم عشای ربانی توسط واتیکان
- خرچنگ دریایی هوش مصنوعی آنقدرها هم هیجانانگیز نیست!
- هشدار محققان: باتها در شبکههای اجتماعی میتوانند افکار عمومی را فریب دهند
- عقبنشینی بایتدنس در پی اعتراض هالیوود؛ هوش مصنوعی Seedance 2.0 محدود میشود
- مدیرعامل گوگل و OpenAI برای شرکت در اجلاس هوش مصنوعی به هند میروند
- تنش میان پنتاگون و آنتروپیک بر سر استفاده نظامی از هوش مصنوعی بالا گرفت
