- علیبابا مدل Qwen 3.5 را معرفی کرد؛ گامی بزرگ به سمت ایجنتهای چندوجهی
- متا از Manus Agents رونمایی کرد؛ راهی برای ارتباط با هوش مصنوعی در پیامرسانها
- نهاد حریم خصوصی اتحادیه اروپا درباره تولید تصاویر جنسی توسط گراک تحقیق میکند
- بریتانیا چتباتهای هوش مصنوعی را مشمول قوانین ایمنی آنلاین میکند
- همکاری احتمالی ایلان ماسک با پنتاگون؛ xAI روی پروژه کنترل پهپادهای خودمختار کار میکند
- بکارگیری انواع تسلیحات پدافندی و آفندی در رزمایش کنترل هوشمند سپاه
- تخصیص بودجه برای ارتقای فعالیتها و تولیدات فرهنگی
- تصویب جدول مصارف هدفمندسازی یارانهها
- ثبتنام ۱۰۴ هزار و ۷۵۵ متقاضی داوطلبی انتخابات شوراهای روستا
- دیدار لاریجانی با وزیر انرژی روسیه
هزینه سختافزارهای DeepSeek میتواند بیش از 500 میلیون دلار بوده باشد
طبق گزارشی جدید، به نظر میرسد هزینه سختافزارهای DeepSeek بالاتر از 500 میلیون دلار بوده است. اما آنچه اخیراً بیشتر به آن توجه شده هزینه 5 میلیون و 600 هزار دلاری آموزش مدل جدید این شرکت چینی بوده که بسیار کمتر از مبلغ مصرفی رقبای آمریکایی است.
براساس گزارش SemiAnalysis که شرکتی تحقیقاتی در زمینه نیمهرساناهاست، با احتساب هرینههای تحقیق و توسعه و دیگر بخشها، تخمین زده میشود هزینه سختافزارهای DeepSeek بسیار بیش از 500 میلیون دلار باشد.
البته دیپسیک در مقاله معرفی مدل DeepSeek-V3 گفته بود کل هزینههای آموزشی آن نزدیک به 5 میلیون و 570 هزار دلار است. همچنین این شرکت گفته این رقم فقط شامل «آموزش رسمی» مدل میشود و هزینههای «تحقیقات قبلی و آزمایشهای فرسایشی انجامشده روی معماریها، الگوریتمها یا دادهها» لحاظ نشده است. این شرکت همچنین هزینه کل تولید این مدل را اعلام نکرده است.
برای مثال شرکت آنتروپیک برای آموزش مدل Claude 3.5 Sonnet حدود 10 میلیون دلار هزینه کرده است اما اگر هزینه توسعه مدل فقط به همین رقم محدود میشد، این شرکت میلیاردها دلار از گوگل و آمازون جذب سرمایه نمیکرد.
هزینه سختافزارهای DeepSeek

به ادعای SemiAnalysis، شرکت DeepSeek به حدود 10 هزار تراشه H800 و حدود 10 هزار H100 انویدیا دسترسی دارد. علاوهبراین، تعداد زیادی از تراشههای H20 را که انویدیا آنها را برای بازار چین تولید کرده، در اختیار دارند. البته این پردازشگرهای گرافیکی ظاهراً بین شرکت High-Flyer و DeepSeek مشترکاند. این 2 شرکت را «لیانگ ونفنگ» تأسیس کرده و حامی مالی دیپسیک نیز High-Flyer است.
محققان SemiAnalysis مدعیاند اگرچه V3 بدون شک یک مدل قدرتمند است، باید دقت بیشتری داشته باشیم که آن را با کدام مدل مقایسه میکنیم. بسیاری از افراد V3 را با GPT-4o مقایسه کردهاند اما باید بدانیم که GPT-4o مه 2024 منتشر شد و مسلماً سرعت پیشرفت هوش مصنوعی در این مدت بیشتر شده است.
البته نمیتوان از مدل R1 دیپسیک نیز غافل شد که توانست در برخی بنچمارکها از مدل o1 شرکت OpenAI جلو بزند.
- علیبابا مدل Qwen 3.5 را معرفی کرد؛ گامی بزرگ به سمت ایجنتهای چندوجهی
- متا از Manus Agents رونمایی کرد؛ راهی برای ارتباط با هوش مصنوعی در پیامرسانها
- نهاد حریم خصوصی اتحادیه اروپا درباره تولید تصاویر جنسی توسط گراک تحقیق میکند
- بریتانیا چتباتهای هوش مصنوعی را مشمول قوانین ایمنی آنلاین میکند
- همکاری احتمالی ایلان ماسک با پنتاگون؛ xAI روی پروژه کنترل پهپادهای خودمختار کار میکند
- پارلمان اروپا استفاده از هوش مصنوعی روی دستگاههای سازمانی را ممنوع کرد
- ورود هوش مصنوعی به اتاق تصمیم وزارت جهادکشاورزی؛ از تحلیل قوانین تا پایش نیروی انسانی
- «اوپنایآی» توسعهدهنده هوش مصنوعی جنجالبرانگیز «OpenClaw» را استخدام کرد
- ۹۵ درصد استارتآپها در جهان با شکست مواجه میشوند
- معرفی یک هوش مصنوعی برای مراسم عشای ربانی توسط واتیکان
