- پارلمان اروپا استفاده از هوش مصنوعی روی دستگاههای سازمانی را ممنوع کرد
- قالیباف: ایران یکپارچه سوگوار مراسم چهلم فرزندان دلبند شهید خود است
- میزان تسهیلات ازدواج و فرزندآوری تعیین شد
- پزشکیان: نباید اجازه دهیم سلامت پلیس در ماموریتها به خطر بیفتد
- در مواجهه با اخبار آکسیوس هوشیار باشیم
- مجوز مجلس برای بهکارگیری ۱۰ هزار معلم بازنشسته و حقالتدریس
- حجتالاسلام سیدمحمدجواد جلالی دبیر هیئت اجرایی شورای وحدت شد
- سازوکار مجلس برای پوشش بیمهای دستیاران علوم پزشکی
- تعیین میزان تسهیلات اشتغال خرد و خانگی در سال آینده
- ورود هوش مصنوعی به اتاق تصمیم وزارت جهادکشاورزی؛ از تحلیل قوانین تا پایش نیروی انسانی
بایدو از مدل هوش مصنوعی PP-OCRv5 رونمایی کرد؛ متخصص خواندن متن
بایدو پس از معرفی مدل Ernie X1.1، حالا مدل جدید PP-OCRv5 را منتشر کرده است. PP-OCRv5 یک مدل تشخیص نوری حروف (OCR) است که هماکنون از طریق Hugging Face در دسترس کاربران قرار دارد.
به گزارش گیزموچاینا، نکتهای که این مدل را از رقبا متمایز میکند توانایی بسیار خوب آن در خواندن متون است. همچنین این مدل سبک و کم حجم طراحی شده. یکی از ضعفهای مدلهای بزرگ بینایی زبان این است که بعضاً در انجام کار دقیق و جزئی مانند خواندن متنهای ساختاریافته با مشکل مواجه میشوند. اما PP-OCRv5 میتواند چنین مشکلی را برای کاربران حل کند.
با قابلیتهای مدل هوش مصنوعی PP-OCRv5 از بایدو آشنا شوید
مدل هوش مصنوعی PP-OCRv5 به طور خاص برای دور زدن این محدودیتها طراحی شده است. این مدل در دو مرحله اصلی کار میکند، یعنی در ابتدا موقعیت متن را در تصویر پیدا میکند و سپس خود متن را میخواند.

این رویکرد به مدل کمک میکند تا مشخص کند متن دقیقاً در کجا قرار دارد. همچنین این روش برای استخراج دادهها از اسناد یا تحلیل فرمها بسیار کاربردی است. مدل PP-OCRv5 فقط ۰.۰۷ میلیارد پارامتر دارد که در مقایسه با مدلهای شناختهشده این حوزه بسیار کوچک است.
بایدو این مدل را روی سیستمهای موبایل آزمایش و مشاهده کرده که میتواند بیش از ۳۷۰ کاراکتر در ثانیه روی پردازنده اینتل Xeon پردازش کند. این یعنی میتوان این مدل را روی کامپیوترهای معمولی یا حتی دستگاههای لبه فناوری بدون نیاز به دیتاسنترهای بزرگ اجرا کرد.
بایدو PP-OCRv5 را در وظایف OCR با برخی مدلهای شناختهشده مانند جمینای ۲.۵ پرو و GPT-4o مقایسه کرده و این مدل توانسته عملکرد خوبی از خود نشان دهد. همچنین این مدل میتواند هم متون چاپی و هم دستنویس را بهخوبی پردازش کند و در مجموع از بیش از ۴۰ زبان پشتیبانی میکند.
بایدو این مدل را از طریق Hugging Face در دسترس همه قرار داده است و توسعهدهندگان میتوانند بهراحتی از آن استفاده کنند.
- پارلمان اروپا استفاده از هوش مصنوعی روی دستگاههای سازمانی را ممنوع کرد
- ورود هوش مصنوعی به اتاق تصمیم وزارت جهادکشاورزی؛ از تحلیل قوانین تا پایش نیروی انسانی
- «اوپنایآی» توسعهدهنده هوش مصنوعی جنجالبرانگیز «OpenClaw» را استخدام کرد
- ۹۵ درصد استارتآپها در جهان با شکست مواجه میشوند
- معرفی یک هوش مصنوعی برای مراسم عشای ربانی توسط واتیکان
- خرچنگ دریایی هوش مصنوعی آنقدرها هم هیجانانگیز نیست!
- هشدار محققان: باتها در شبکههای اجتماعی میتوانند افکار عمومی را فریب دهند
- عقبنشینی بایتدنس در پی اعتراض هالیوود؛ هوش مصنوعی Seedance 2.0 محدود میشود
- مدیرعامل گوگل و OpenAI برای شرکت در اجلاس هوش مصنوعی به هند میروند
- تنش میان پنتاگون و آنتروپیک بر سر استفاده نظامی از هوش مصنوعی بالا گرفت
