PDFTextStream

نرم افزار تصویر:
PDFTextStream
جزئیات نرم افزار:
نسخه: 2.6.0
ها تاریخ: 20 Feb 15
توسعه دهنده: Snowtide Informatics Systems, Inc.
پروانه: نرم افزار
قیمت: 1900.00 $
محبوبیت: 63

Rating: 3.5/5 (Total Votes: 2)

پروژه PDFTextStream PDF متن و ابرداده کتابخانه استخراج دسترس برای جاوا، پایتون، و دات نت است.
این پشتیبانی از تمام نسخه از خصوصیات سند PDF، (از جمله v1.6، استفاده شده توسط آکروبات 7)، استخراج متن کد گذاری با استفاده از مجموعه کاراکتر دو بایت (از جمله چینی، ژاپنی، کره ای و)، رمزگشایی از 40 بیتی و 128- کمی رمزگذاری اسناد و استخراج همه ابرداده سند ارائه شده توسط اسناد PDF (از جمله داده های فرم، بوک مارک ها، و حاشیه نویسی).
ادغام آسان با جاکارتا Lucene شامل است

چه جدید در این نسخه است:.

این نسخه شامل انواع رفع ساخته شده برای اطمینان از PDFTextStream قادر به استخراج متن از اسناد PDF که است نامنطبق به خصوصیات PDF.
این همچنین شامل انواع کارآیی.

جدید در نسخه 2.3.0 است:

به روش .isStruckThrough () اضافه شده به com.snowtide.pdf.TextUnit، نشان می دهد که آیا یک شخصیت دارای یک خط خورده کشیده شده را از طریق آن.
بهبود پشتیبانی PDFTextStream برای تعیین شخصیت تعبیه شده است.
محاسبه فضای خالی بین کلمات ثابت شده است به درستی برای فضای خالی است که به صراحت در اسناد منبع PDF کد گذاری حساب.
دست زدن به بهبود PDFTextStream از کدگذاری محتوای کامپوزیت، که قبلا می تواند شکست و در نتیجه برخی از دامنه PDF محتوا که "نادیده گرفته 'در طول استخراج.
رفع اشکال در VisualOutputTarget که در آن متن از یک خط می توان بیش از چند خط تقسیم
چیدمان عمودی بهبود از متن استخراج با استفاده از VisualOutputTarget
بهبود VisualOutputTarget تولید عصاره برای از بین بردن فضای خالی اضافی ساختگی بین کلمات از نزدیک-مجاور

جدید در نسخه 2.2.5 است:

در این نسخه اضافه می کند پشتیبانی از استخراج فرم اطلاعات XFA به عنوان XML.
این به طور قابل توجهی بهبود عملکرد استخراج متن با استفاده از VisualOutputTarget. پشتیبانی از اسناد PDF بزرگتر از 2GB است.
ثابت برای یک اشکال که در آن رمزگذاری از فونت Type1 تعبیه شده که قبلا به درستی در برخی شرایط اعمال نمی شد.
ثابت برای یک مشکل که در آن محتوای جدیدتر در اسناد PDF به روز گاهی اوقات که نادیده گرفته شد.
ثابت برای یک مشکل که در آن بوک مارک-PDFDocEncoding کد گذاری و ابرداده شد به درستی رمزگشایی نشده است.
روش .getDestinationName () در com.snowtide.pdf.Bookmark.

مورد نیاز:

آپاچی Lucene

نظرات به PDFTextStream

نظر یافت نشد
اضافه کردن نظر
روشن کردن تصاویر!