در تشخیص کاراکتر نوری (OCR) ترجمه بیت مپ نوری اسکن شده از چاپ و یا نوشته شده است شخصیت های متن را به کدهای شخصیت، مانند اسکی است. این یک راه کارآمد برای تبدیل مواد سخت کپی به فایل های داده است که می تواند ویرایش و در غیر این صورت دستکاری بر روی یک کامپیوتر است. این تکنولوژی طولانی توسط کتابخانه ها و سازمان های دولتی استفاده می شود تا مدارک طولانی به سرعت در دسترس الکترونیکی است. پیشرفت در تکنولوژی OCR افزایش استفاده از آن توسط شرکت موجب شده است. برای بسیاری از وظایف سند ورودی، OCR مقرون به صرفه ترین و روش سریع در دسترس است. و هر سال، این فن آوری آزاد هکتار از فضای ذخیره سازی بیش از یک بار به فایل کابینت و جعبه پر از اسناد کاغذی داده شده است. قبل از OCR می تواند مورد استفاده قرار گیرد، مواد منبع باید با استفاده از یک اسکنر نوری (و گاهی اوقات مدار تخصصی در PC) به عنوان خوانده شده در صفحه به عنوان یک بیت مپ (الگوی نقطه) اسکن شود. نرم افزار به رسمیت شناختن تصاویر نیز مورد نیاز است.
بسته نرم افزاری ما پیشنهاد برای حل طبقه بندی شخصیت جدا شده دست نوشته و رقم از شخصیت های اوجی، کیوتو قلم مجموعه دادهها با استفاده از شبکه های عصبی. اطلاعات شامل نمونه از 26 شخصیت و 10 رقم نوشته شده توسط 11 نویسندگان بر روی یک کامپیوتر قرص. شخصیت (در فرمت استاندارد UNIPEN) هر دو در مورد بالا و پایین نوشته شده است و دو مجموعه ای کامل از کاراکتر در هر نویسنده وجود دارد. بنابراین خروجی باید در یکی از 35 کلاس باشد. هدف نهایی در حال ساخت یک مدل مستقل نویسنده برای هر یک از شخصیت.
انتخاب از ویژگی های ارزشمند مجموعه ای جدید و معنی دار از ویژگی های در به رسمیت شناختن شخصیت بسیار مهم است، بنابراین، یکنواخت دیفرانسیل نرمال مختصات (UDNC)، معرفی شده توسط C. Agell، اتخاذ شده است. این ویژگی ها نشان داده شده است به منظور بهبود سرعت تشخیص با استفاده از الگوریتم های طبقه بندی ساده به طوری که آنها استفاده می شود برای آموزش شبکه عصبی و تست عملکرد آن بر صفات اوجی، کیوتو قلم مجموعه دادهها.
شرایط صفحه اول:. نرم افزار Matlab، منبع، کد، OCR، تشخیص کاراکتر نوری، متن اسکن شده، متن نوشته شده، اسکی، شخصیت جدا شده
مورد نیاز:
نرم افزار Matlab
نظر یافت نشد