lxml

نرم افزار تصویر:
lxml
جزئیات نرم افزار:
نسخه: 3.4.1
ها تاریخ: 17 Feb 15
توسعه دهنده: Martijn Faassen
پروانه: رایگان
محبوبیت: 12

Rating: nan/5 (Total Votes: 0)

در lxml یک ماژول پیچیده، قدرتمند، رایگان و منحصر به فرد پایتون که libxml2 و libxslt کتابخانه متصل می شود، اجازه می دهد توسعه دهندگان پایتون به کار با هر دو XML و HTML فایل های خودی خود پایتون code.An librarylxml XML پردازش XML (زبان نشانه گذاری توسعه پذیر است ) پردازش کتابخانه نوشته شده در زبان برنامه نویسی پایتون، به طور خاص طراحی شده به دنبال مشخصات API ElementTree به همان اندازه که ممکن است.
این می تواند API ElementTree گسترش به افشای عملکرد خاص از libxslt و libxml2 برای کتابخانه ها، مانند آرامش NG (نسل بعدی)، XPath و XML طرحواره، c14n، XSLT (توسعه سبک زبان)، lxml etc.Use به تماس کد پایتون از stylesheetsDevelopers XSLT قادر به استفاده از این برنامه lxml به تماس کد پایتون از شیوه XSLT و عبارات XPath از طریق توابع فرمت خواهد شد. طیف گسترده ای از آموزشهای موجود در پروژه و ترانزیت هستند؛ صفحه خانگی (لینک در پایان مقاله مراجعه کنید).
نرم افزار منبع باز طراحی شده توسط است و ترکیب کامل از ویژگی های و سرعت از کتابخانه مذکور با سادگی پایتون برون API (برنامه نویسی رابط برنامه کاربردی) .Getting با lxmlIt آغاز شده است بسیار آسان برای نصب lxml در یک توزیع گنو / لینوکس با استفاده از بایگانی منبع توزیع در Softoware و ترانزیت پروژه و. وب سایت رسمی. نگران نباشید، بسته منبع، دانلود ذخیره آن در پوشه خانه خود را، باز کردن آن، باز کردن برنامه ترمینال و حرکت به محل فایل های استخراج شده آرشیو (به عنوان مثال /home/softoware/lxml-3.4.1 سی دی).
اجرای و lsquo؛ را برون فرمان به کامپایل برنامه، که باید در مورد 1-2 دقیقه بر روی یک کامپیوتر مدرن را. پس از مجموعه موفق، اجرا و lsquo؛ را نصب برون دستور به عنوان ریشه یا و lsquo. کد: sudo را نصب برون دستور به عنوان یک کاربر ممتاز به نصب wide.Supports سیستم lxml گنو / لینوکس و ویندوز عامل systemsThe نرم افزار به طور رسمی در گنو / لینوکس و مایکروسافت ویندوز سیستم عامل های پشتیبانی شده است. این شده است با موفقیت در 32 بیتی و 64 بیتی کامپیوتر تست شده

چه در این نسخه جدید است:. اضافه شده

ویژگی ها:
جدید ژنراتور htmlfile HTML به همراه افزایشی API ترتیب xmlfile. پچ های Burak در ارسلان.
اشکالات ثابت:
lxml.sax.ElementTreeContentHandler بود ارشد خود مقداردهی اولیه نیست.

چه در نسخه 3.3.1 جدید است:

به اشکالات ثابت:
LP # 1014290: اسناد HTML تجزیه با parser.feed () برای پیدا کردن عناصر در طول تگ تکرار شکست خورده است.
LP # 1273709: ساختمان در پایپای به علت از دست رفته برای حمایت از PyUnicode_Compare () و PyByteArray _ * () در C-API پایپای را شکست خورده است.
LP # 1274413: نقشه کشی در MSVC به علت از دست رفته و & quot شکست خورد، stdint.h ها & quot؛ فایل هدر استاندارد.
LP # 1274118: iterparse () موفق به تجزیه BOM فایل های شروع شده است.

چه جدید در نسخه 3.0 آلفا 2 است: اضافه

ویژگی ها:
روش .iter () از عناصر در حال حاضر استدلال برچسب پذیرد مانند & quot؛ را {*} نام & quot؛ را برای جستجوی عناصر با نام محلی داده شده در هر فضای نام. با استفاده از این علاوه بر این، تمام ترکیبات از نویسه عام در حال حاضر کار به عنوان انتظار می رود: & quot؛ را {NS} نام & quot؛ باشد quot &؛ {} نام & quot؛ باشد quot &؛ {*} نام & quot؛ باشد و & quot؛ {NS} * و & quot ؛، & quot؛ را {} * و & quot؛ و & quot؛ {*} * و & quot؛ توجه داشته باشید که & quot؛ نام & quot؛ را معادل است به & quot؛ {} نام & quot؛ باشد اما به & quot؛ * و & quot؛ است & quot؛ را {*} * و & quot؛ همان تغییر به .getiterator (اعمال)، .itersiblings ()، .iterancestors ()، .iterdescendants ()، .iterchildren () و .itertext () روش. strip_attributes ()، strip_elements () و strip_tags () توابع و همچنین به عنوان iterparse () طبقه.
C14N اجازه می دهد تا مشخص پیشوندهای فراگیر در طول ترتیب منحصر به فرد به سطح بالا توسعه داده شود.
اشکالات ثابت:
پس از گذشت رشته یونیکد طولانی به خوراک () رابط تجزیه کننده قادر به خواندن تمام رشته.

جدید در نسخه 2.3.5 است:

به تصادف در هنگام ادغام گره متن در element.remove ().
تصادف در ساکس تجزیه کننده / هدف هنگام گزارش DOCTYPE خالی می باشد.

جدید در نسخه 2.3.4 است:

به تصادف در هنگام ساخت یک nsmap (اموال عنصر) با URI ها فضای نام خالی می باشد.
سقوط به علت نژاد شرایط زمانی که خطا (یا پیام کاربر) در طول پردازش XSLT موضوعی رخ می دهد.
XSLT تلفیقی شیوه می تواند خطاهای تلفیقی را نادیده گرفت.

ویژگی های اضافه شده:

جدید در نسخه 2.3.2 است:
lxml.objectify.deannotate () دارای یک جدید cleanup_namespaces گزینه بولی به حذف اعلانهای فضای نامی ابژهی (و به طور کلی پاک کردن اعلان فضای نامی) پس از حذف حاشیه نویسی نوع.
lxml.objectify SubElement تابع () خود را به عنوان یک کپی از etree.SubElement به دست آورد برای جلوگیری از واردات در غیر این صورت کار برکنار شده از lxml.etree در سمت کاربر.
اشکالات ثابت:
ثابت ها & quot؛ نسل ها & quot؛ اشکال در cssselect بار دوم (بعد از ثابت برای اولین بار در lxml 2.3.1). تغییر قبلی منجر به یک رگرسیون عملکرد جدی برای ارزیابی از XPath مبتنی بر بیان ترجمه شده است. توجه داشته باشید که این معافیت استفاده از برخی از عبارات XPath تولید به عنوان مسیرهای محل XSLT که قبلا در 2.3.1 کار می کرد.
تجزیه ثابت برخی از انتخاب در cssselect. فضای خالی پس از combinators ها & quot؛ & gt؛ به & quot؛ باشد و & quot؛ + & quot؛ را و & quot؛ ~ و & quot؛ در حال حاضر به درستی استفاده کنه. پیش به عنوان یک ترکیب نسل تجزیه شد. به عنوان مثال، به & quot؛ DIV ها & gt؛ .foo ها & quot؛ به عنوان همان تجزیه شد و & quot؛ DIV ها & gt؛ * .foo ها & quot؛ به جای & quot؛ را DIV ها & gt؛ .foo و quot؛ کلیک کنید

ویژگی های اضافه شده:

جدید در نسخه 2.3.1 است:
در lxml.html.clean kill_tags گزینه جدید برای حذف تگ خاص و محتوای آنها (به عنوان مثال کل زیر درخت خود را).
pi.get () و pi.attrib در دستورالعمل های پردازش تجزیه شبه صفات از محتوای متن دستورالعمل های پردازش.
lxml.get_include () یک لیست از شامل مسیرهای که می تواند مورد استفاده قرار گیرد به کامپایل کد خارجی C برابر lxml.etree گرداند. این است که به طور خاص مورد نیاز برای lxml آماری مرتبط می سازد هنگامی که کد نیاز به کامپایل علیه دقیقا همان نسخه فایل هدر به عنوان lxml خود را.
Resolver.resolve_file () طول می کشد close_file گزینه های اضافی که پیکربندی اگر فایل (سان) شی خواهد بعد از خواندن یا نه بسته شود. به طور پیش فرض، فایل بسته خواهد شد، به عنوان کاربر انتظار نمی رود برای حفظ یک مرجع به آن.
اشکالات ثابت:
لینک ها: تمیز کردن HTML به 'داده' را حذف کنید.
ادغام تجزیه کننده html5lib در حال حاضر با استفاده از اجرای رسمی در html5lib خود، که باعث می شود آن را با انتشار جدیدتر از کتابخانه کار می کنند.
در lxml.sax، endElementNS () نادرست می تواند یک نام تگ ساده رد زمانی که رویداد شروع مربوطه استنباط همین نام تگ ساده به در فضای نامی پیش فرض باشد.
هنگامی که یک شبه فایل شی باز به تجزیه گذشت () و یا iterparse ()، تجزیه کننده دیگر آن را نزدیک پس از استفاده خواهد شد. این تبدیل تغییر در lxml 2.3 که در آن تمام فایل های تعطیل خواهد شد. این کاربران مسئولیت را به درستی در مورد خطا بستن فایل (سان) شی، نیز می باشد.
خطا ادعا در lxml.html.cleaner زمانی که دور عناصر سطح بالا.
در lxml.cssselect، استفاده از XPath و '// B' (مخفف 'A / نسل یا خود :: گره () / B') به جای 'A / نسل :: B' برای انتخاب نسل CSS ( 'B'). این باعث می شود چند مورد لبه به سازگار با رفتار انتخاب در WebKit و فایرفاکس، و باعث می شود عبارات CSS تر مسیرهای محل معتبر (برای استفاده در XSL: قالب بازی).
در lxml.html، برچسب ها غیر انتخاب دیگر نشان می دهد تا در مقادیر فرم جمع آوری شده.
اضافه کردن / حذف مقادیر به / از یک میدان فرم های متعدد را انتخاب درستی آنها را انتخاب و unselects آنها.
تغییرات دیگر:
استاتیک ایجاد می توانید دایرکتوری دانلود با گزینه --download، دیر را مشخص کنید.

ویژگی های اضافه شده:

جدید در نسخه 2.3 است:
هنگامی که به دنبال کودکان، lxml.objectify '{} برچسب' طول می کشد به معنای یک فضای نامی خالی، به عنوان فضای نام پدر و مادر مخالف است.
اشکالات ثابت:
هنگام خواندن از یک شی مانند فایل به پایان رسید، تجزیه فورا روش آن .close () می نامد.
در هنگام تجزیه به پایان رسید، iterparse () فورا بسته فایل ورودی.
کار در اطراف برای اشکال libxml2 برای استفاده است که می تواند تجزیه HTML در حالت غیر تابعی پس از تجزیه یک سند خراب شدت (در libxml2 برای 2.7.8 ثابت) را ترک کنند.
برچسب ضبط اموال بیگانگان در کد پاکسازی HTML غیر فعال است درست به نام خیمه.
تغییرات دیگر:
برخی از توابع عمومی در سطح Cython C-API انواع بازگشت صریح تر.

جدید در نسخه 2.2.8 / 2.3 بتا 1 است:

به سقوط در نسخه های جدیدتر libxml2 برای زمانی که در حال حرکت عناصر بین اسناد که ویژگی های در گره XInclude جایگزین شده بود.
XMLID تابع () از دست رفته پارامترهای تجزیه و BASE_URL اختیاری است.
جستجو برای برچسب کلمات در iterparse () در Py3 شکسته شد.
lxml.html.open_in_browser () را در پایتون 3 با توجه به استفاده از os.tempnam کار نمی کند. این در حال حاضر 'را پشتیبانی می کند' پارامتر اختیاری طول می کشد.

مورد نیاز:

پایتون

نرم افزار های مشابه

EDIReader
EDIReader

3 Jun 15

manspider
manspider

20 Feb 15

scrap2rtf
scrap2rtf

20 Feb 15

Aephea
Aephea

20 Feb 15

نرم افزار های دیگر از توسعه دهنده Martijn Faassen

z3c.relationfield
z3c.relationfield

14 Apr 15

hurry.resource
hurry.resource

11 May 15

نظرات به lxml

نظر یافت نشد
اضافه کردن نظر
روشن کردن تصاویر!