مدل DeepSeek-OCR
تیم DeepSeek از مدل تازهی خودش برای OCR رونمایی کرد. این مدل بر پایهی VL2 ساخته شده و با داشتن حدود ۳ میلیارد پارامتر، عملکردی بسیار بهینه و سریع داره.
• پشتیبانی از ۱۰۰ زبان مختلف دنیا
• دقت بالا در تبدیل تصویر به متن حتی در اسناد پیچیده
• خروجی به فرمت Markdown برای حفظ ساختار سند
• مناسب برای کارهای چندزبانه از جمله فارسی
تصویر بالا نشون میده که مدل DeepSeek-OCR خوب عمل میکنه و مدل دستخط دکتر رو به خوبی تشخیص داده.
تمام باکسها و فیلدهای مختلف (مثل Name، Address، Rx، Dosage، Physician’s Sig و شمارهها) هم درست شناسایی شده.
در نهایت خروجی OCR کاملاً سازماندهی شده و متنها و موقعیتها را با دقت ارائه کرده.
لینک هاگینگ فیس
@silicon_brain I از هوش مصنوعی عقب نمانید
تیم DeepSeek از مدل تازهی خودش برای OCR رونمایی کرد. این مدل بر پایهی VL2 ساخته شده و با داشتن حدود ۳ میلیارد پارامتر، عملکردی بسیار بهینه و سریع داره.
ویژگی ها
• پشتیبانی از ۱۰۰ زبان مختلف دنیا
• دقت بالا در تبدیل تصویر به متن حتی در اسناد پیچیده
• خروجی به فرمت Markdown برای حفظ ساختار سند
• مناسب برای کارهای چندزبانه از جمله فارسی
نمونه
تصویر بالا نشون میده که مدل DeepSeek-OCR خوب عمل میکنه و مدل دستخط دکتر رو به خوبی تشخیص داده.
تمام باکسها و فیلدهای مختلف (مثل Name، Address، Rx، Dosage، Physician’s Sig و شمارهها) هم درست شناسایی شده.
در نهایت خروجی OCR کاملاً سازماندهی شده و متنها و موقعیتها را با دقت ارائه کرده.
لینک هاگینگ فیس
@silicon_brain I از هوش مصنوعی عقب نمانید
❤8👍4🔥1
group-telegram.com/silicon_brain/1781
Create: 
 
Last Update:
Last Update:
مدل DeepSeek-OCR
تیم DeepSeek از مدل تازهی خودش برای OCR رونمایی کرد. این مدل بر پایهی VL2 ساخته شده و با داشتن حدود ۳ میلیارد پارامتر، عملکردی بسیار بهینه و سریع داره.
• پشتیبانی از ۱۰۰ زبان مختلف دنیا
• دقت بالا در تبدیل تصویر به متن حتی در اسناد پیچیده
• خروجی به فرمت Markdown برای حفظ ساختار سند
• مناسب برای کارهای چندزبانه از جمله فارسی
تصویر بالا نشون میده که مدل DeepSeek-OCR خوب عمل میکنه و مدل دستخط دکتر رو به خوبی تشخیص داده.
تمام باکسها و فیلدهای مختلف (مثل Name، Address، Rx، Dosage، Physician’s Sig و شمارهها) هم درست شناسایی شده.
در نهایت خروجی OCR کاملاً سازماندهی شده و متنها و موقعیتها را با دقت ارائه کرده.
لینک هاگینگ فیس
@silicon_brain I از هوش مصنوعی عقب نمانید
تیم DeepSeek از مدل تازهی خودش برای OCR رونمایی کرد. این مدل بر پایهی VL2 ساخته شده و با داشتن حدود ۳ میلیارد پارامتر، عملکردی بسیار بهینه و سریع داره.
ویژگی ها
• پشتیبانی از ۱۰۰ زبان مختلف دنیا
• دقت بالا در تبدیل تصویر به متن حتی در اسناد پیچیده
• خروجی به فرمت Markdown برای حفظ ساختار سند
• مناسب برای کارهای چندزبانه از جمله فارسی
نمونه
تصویر بالا نشون میده که مدل DeepSeek-OCR خوب عمل میکنه و مدل دستخط دکتر رو به خوبی تشخیص داده.
تمام باکسها و فیلدهای مختلف (مثل Name، Address، Rx، Dosage، Physician’s Sig و شمارهها) هم درست شناسایی شده.
در نهایت خروجی OCR کاملاً سازماندهی شده و متنها و موقعیتها را با دقت ارائه کرده.
لینک هاگینگ فیس
@silicon_brain I از هوش مصنوعی عقب نمانید
BY Silicon Brain | جامعه هوش مصنوعی


Share with your friend now:
group-telegram.com/silicon_brain/1781
