جزئیات نرم افزار:
طراحی به عنوان یک پوشه در سراسر lxml، در حال حاضر گسترش می یابد lxml با تمام ویژگی های معمول در HTML داده کاوی مورد نیاز
ویژگی ها:.
ویژگی های عمومی:
انتخاب CSS جی کوئری مانند زیبا
دسترسی آسان به ویژگی های عنصر
راه آسان برای تبدیل HTML به فرمت های دیگر (کدهای BB، مدل های نشانه گذاری، و غیره)
چند توابع خوب برای کار با متن
موجب صرفه جویی در همه از ویژگی های اصلی lxml
توابع کار با متن خالص:
to_unicode - تبدیل رشته به رشته یونیکد
strip_accents - لهجه ها نوار از یک رشته
strip_symbols - نوار زشت علامت یونیکد از یک رشته
strip_spaces - نوار فضاهای بیش از حد از یک رشته
strip_linebreaks - نوار پرش به خط بیش از حد از یک رشته
مورد نیاز:
lxml
نظر یافت نشد