در pdfminer3k بندر pdfminer نوشته شده در پایتون 3 است.
PDFMiner یک ابزار برای استخراج اطلاعات از اسناد PDF است. بر خلاف دیگر ابزار های مربوط به PDF، آن را در گرفتن و تجزیه و تحلیل داده های متنی تمرکز به طور کامل.
PDFMiner اجازه می دهد تا برای به دست آوردن محل دقیق آن از متون در یک صفحه، و همچنین دیگر اطلاعات مانند فونت و یا خطوط. این شامل یک مبدل PDF است که می تواند فایل های PDF به فرمت های متن دیگر (مانند HTML) تبدیل. این PDF تجزیه کننده توسعه است که می تواند برای مقاصد دیگر به جای تجزیه و تحلیل متن استفاده می شود
چه در این نسخه جدید است.
اضافه شده بهترین های وب، ابزاری برای اشکال زدایی فایلهای PDF از طریق بررسی خود داده ها.
آیا به جعبههای متن گروه سعی کنید زمانی که بیش از حد بسیاری وجود دارد (آن طول می کشد بیش از حد طولانی).
منابع شی پشتیبانی به عنوان فیلتر در جریان می یابد.
پارسه هر شی به عنوان به زودی به عنوان یک objectid نمی توان یافت.
بهبود دقیق مبتنی بر رفع خطا اصطلاح.
جدید در نسخه 1.2.4 است:
هنگام جداول XREF فاسد باشند، تجزیه و کش تمام اشیاء را به عنوان یک مجدد.
ثابت ادعای ساختگی در طرح بندی.
جدید در نسخه 1.2.3 است:
به ثابت یک تصادف در کد CMAP ناهموار.
ثابت متا تصادف ناشی از repr PSParser بد است.
مورد نیاز:
پایتون
نظر یافت نشد