- اعلام شرط اصلی سوریه برای پایان مذاکرات / ارتفاعات جولان واگذار میشود؟
- جلسه مهم نمایندگان ایران، روسیه و چین / متحدین ایران به میدان آمدند
- رابرت مالی: ایران قبل از رفع تحریمهای آمریکا امتیاز نمیدهد
- خشم رئیس اسرائیل از توهین ترامپ / نتانیاهو دسیسهچینی کرده است؟!
- پیام هشدارآمیز عراق به منطقه/ امیدواریم وارد جنگ نشویم
- جزئیات دور جدید مذاکرات ایران و آمریکا/مارکو روبیو اعلام کرد
- مدیران پرسپولیس تکلیف اوسمار را روشن کردند
- بایتدنس مدل Doubao 2.0 را معرفی کرد؛ ورود به عصر ایجنتهای هوش مصنوعی
- پزشکیان: حوادث اخیر بسیار تلخ و غیرقابل تصور بود
- حاجی میرزایی: تصویر آینده ایران را باید در مدارس امروز جستوجو کرد
آمازون در حال توسعه بزرگترین مدل هوش مصنوعی تبدیل متن به گفتار است
محققان آمازون ادعا کردهاند که بزرگترین مدل هوش مصنوعی تبدیل متن به گفتار را آموزش دادهاند. این مدل جدید که BASE TTS نام دارد، با 100 هزار ساعت اطلاعات صوتی آموزش داده شده است و با قابلیتهای بیسابقه خود، میتواند در حوزه مدلهای تبدیل متن به صدا انقلابی ظاهر شود.
مدل جدید آمازون Big Adaptive Streamable TTS با قابلیتهای نوظهور نام دارد که بهصورت مخفف و با عنوان BASE TTS شناخته میشود. برای آموزش بزرگترین نسخه این مدل از 100 هزار ساعت سخنرانی در حوزه عمومی استفاده شده که 90 درصد آن به زبان انگلیسی و بخش دیگر به زبانهای آلمانی، هلند و اسپانیایی است.

این نسخه (BASE-large) با پشتیبانی از 980 میلیون پارامتر، ظاهرا بزرگترین مدل در نوع خود محسوب میشود. همچنین این مدل اساساً یک تقلید کننده صدا نیست، بلکه با وجود ویژگیهای نوظهور خود میتواند حتی در صورت مواجهشدن با جملات پیچیده، در زمینه ارائه گفتار با صدای طبیعی، بهترین عملکرد را داشته باشد. آمازون همچنین مدلهای 400 و 150 پارامتری مدل خود را براساس 10 هزار و 1000 ساعت صدا آموزش داده است.
نمونه تولیدشده توسط مدل هوش مصنوعی تبدیل متن به گفتار آمازون
در وبسایتی که برای این مدل ساخته شده است، چندین نمونه صدا که توسط ابزارهای تبدیل متن به صدا با هوش مصنوعی ساخته شده، وجود دارد. در ادامه یک مورد از این صداها را میتوانید گوش دهید.
باید به این نکته توجه داشت که این مدل هنوز در مرحله فرایند تجربی خود قرار دارد و برای اهداف تجاری یا موارد مشابه نمیتوان از آن استفاده کرد. در تحقیقات بعدی احتمالاً توضیحات بیشتری درباره تواناییهای نوظهوری و همچنین نحوه آموزش و استقرار مدل اعلام خواهد شد.
هرچند منابع و دادههای مورداستفاده در BASE TTS به دلایل امنیتی فاش نشده است، اما عملکرد چشمگیر این مدل نشانههای روشنی از پیشرفت حوزه هوش مصنوعی است.
- بایتدنس مدل Doubao 2.0 را معرفی کرد؛ ورود به عصر ایجنتهای هوش مصنوعی
- تراشههای هوش مصنوعی ۹۰ درصد ارزانتر میشوند
- مدیرعامل آنتروپیک: نمیدانیم هوش مصنوعی خودآگاه شده است یا نه
- لزوم ترکیب پژوهشهای بومی با یافتههای هوش مصنوعی به منظور ارتقاء سواد پایه
- مدل بحثبرانگیز ChatGPT رسما بازنشسته شد
- تحویل فاز اول دستیار هوشمند وزارت راه/ تحلیل قوانین و اولویتبندی پروژههای جادهای با AI
- تحولی بزرگ با هوش مصنوعی؛ چرا مهندسان اسپاتیفای دیگر کدنویسی نمیکنند؟
- حمله تند ایلان ماسک؛ مالک xAI سیاستهای آنتروپیک را «شیطانی» توصیف کرد
- مدیر هوش مصنوعی مایکروسافت: اکثر امور اداری تا یکسالونیم آینده خودکار میشوند
- آمریکا در عملیات بازداشت رئیسجمهور ونزوئلا از هوش مصنوعی Claude استفاده کرد
