در uni2ascii و ascii2uni بین UTF-8 Unicode و هر یک از انواع معادل ASCII 7 بیتی از جمله تبدیل: هگزادسیمال و اعشاری HTML مراجع شخصیت عددی، U-فرار، هگزادسیمال استاندارد و هگزادسیمال خام است.
چنین معادل ASCII هنگامی که از جمله متن یونیکد در منبع برنامه، هنگام ورود متن در برنامه های وب است که می تواند مجموعه کاراکتر یونیکد رسیدگی اما 8 بیتی امن نیست، و هنگام اشکال زدایی مفید هستند.
یونیکد در دسترس فرار عبارتند از:
- HTML هگزادسیمال مراجع شخصیت عددی (به عنوان مثال)
- HTML دهدهی مراجع شخصیت عددی (به عنوان مثال ȳ)
- U-فرار، همانطور که در پایتون استفاده می شود (به عنوان مثال u00E9)
- U-فرار در BMP و U-فرار فراتر از BMP، به عنوان مثال u00E9 اما U00010024.
- U -escapes (به عنوان مثال U 00E9)
- U-فرار (به عنوان مثال U00E9)
- U-فرار (به عنوان مثال u00E9)
- U-فرار در براکت زاویه (به عنوان مثال)
- X-فرار (به عنوان مثال x00E9)
- X-فرار با پرانتز (به عنوان مثال X {} 00E9)
- هگزادسیمال استاندارد (به عنوان مثال 0x00E9)
- هگزادسیمال خام (به عنوان مثال 00E9)
uni2ascii یک پرچم خط فرمان تعیین اینکه آیا برای تولید حروف AF یا حروف AF و رقم شانزده شانزدهی از برخی از برخی از برنامه های شرایط تنها یک یا دیگر را می پذیرد. ascii2uni می پذیرد یا نه.
در مورد uni2ascii به طور پیش فرض، تنها شخصیت های خارج از محدوده ASCII هستند تبدیل شده است. حتی اگر کاراکتر های اسکی نیز تبدیل، خط جدید حفظ مگر اینکه تبدیل آنها به صراحت درخواست شده است. شخصیت های فضایی نیز حفظ مگر اینکه تبدیل به صراحت درخواست شده است. در مورد سه شخصیت فضای غیر ASCII (فضای حبشی کلمه، فضای اوگام و فضای مجازی)، در صورت شخصیت های فضایی تبدیل نیست، این ها با فضای ASCII (0x20) جایگزین به طوری که برای نگه داشتن خروجی در 7- محدوده ASCII بیتی.
این بسته شامل چهار برنامه. برنامه اصلی uni2ascii است. این است که در C نوشته شده است و باید کامپایل شود. uni2html.py سلف به uni2ascii است. همانطور که در پایتون نوشته شده است، لازم نیست وارد شده و باید فقط در مورد هر کامپیوتر در حال حاضر اجرا بر روی. uni2ascii در غیر این صورت در آن برتر است:
- این تولید طیف وسیع تری از فرمت های خروجی.
- این در حدود 20 برابر سریعتر است.
- این دسته ورودی در محدوده 32 بیتی کامل از یونیکد. در مقابل، uni2html تنها دسته
عمومی چند زبانه هواپیما (هواپیما 0) چون در حال حاضر پایتون نشان دهنده یونیکد در متن کد گذاری داخلی با استفاده از اعداد صحیح 16 بیتی. اگر متن را، مثلا خطی B یا اوگاریتی شما رو، شما نیاز uni2ascii.
این کار یک کار بهتر از گزارش خطاها. اگر یک خطا در ورودی آن، مواجه مانند سوء تشکیل UTF-8، آن را گزارش محل خطا هم از نظر تعداد کاراکتر از ابتدای فایل (با شروع از 0) و از نظر تعداد بایت از ابتدای فایل (همچنین در 0 شروع). (تعداد کاراکتر و تعداد بایت به طور کلی همان از یک شخصیت کد گذاری UTF-8 را اشغال 1-4 کلمه در ادامه متن.) تنها گزارش نسخه پایتون تعداد کاراکتر. uni2ascii همچنین اطلاعات در مورد ماهیت خطا را فراهم می کند.
برنامه سوم، ascii2uni، معکوس uni2ascii است. قابل قبول متنی حاوی انواع بازنمایی ASCII از کاراکترهای یونیکد و تولید یونیکد UTF-8.
برنامه چهارم، ascii2uni.py، بار خوانده شده ASCII 7 بیتی حاوی-U فرار از یونیکد، همانطور که در پایتون و Tcl استفاده می شود، و آن را به UTF-8 یونیکد تبدیل می کند. این برنامه اصلی که ascii2uni تعمیم است
در چه در این نسخه جدید است.
در اشکال ثابت در uni2ascii که در آن در بعضی از موارد تعداد subsitution بیش از حد بالا بود، تعمیر دبیان اشکال # 626268.
وصله که مسئولیت رسیدگی به وضعیت در نتبیاسدی که فاقد getline.
معناشناسی گزینه خالص به عنوان تبدیل کاراکتر در محدوده اسکی غیر از فضا و خط جدید روشن. اشکال ثابت که در آن این شد به درستی برای UTF8 انواع اجرا نشده است.
به چه جدید در نسخه 4.17 است: U + 2022 گلوله به 'O'، U + 00B7 نقطه عمق به دوره، U:
برای uni2ascii تبدیل زیر به نزدیکترین معادل ASCII اضافه شده 0085 خط بعدی به خط جدید، U + 2028 جدا خط به خط جدید.
به چه جدید در نسخه 4.16 است:
در قالب Q کار می کند دوباره در ascii2uni.
او U + 2033 DOUBLE PRIME به شخصیت به نزدیکترین معادل کد اسکی خود را تحت E با استفاده از قالب در uni2ascii تبدیل شده است.
به چه جدید در نسخه 4.15 است:
endian.h تغییر نام به u2a_endian.h برای از بین بردن تضاد با endian.h خارجی.
کپی حذف از getline GNU از ascii2uni.c آن را به عنوان استاندارد را به عنوان از POSIX2008 است.
به چه جدید در نسخه 4.14 است:
رفع اشکال که با استفاده از قالب Q در uni2ascii دخالت.
اشکال ثابت که در آن ascification از U + 2502 + 2503 و U دو نقل قول به خروجی اضافه شده است.
رفع اشکال که در آن -a گزینه S تولید یک & quot؛ تبدیل به طوری کاراکتر ها & quot بسیاری از. خط برای هر کاراکتر به دلیل ترک در اشکال زدایی کد.
به چه جدید در نسخه 4.13 است:
در اشکال ثابت که باعث تعداد بیش از حد از شخصیت های به ASCII تغییر به گزارش شود.
به چه جدید در نسخه 4.12 است:
در هر دو برنامه در حال حاضر اجازه می دهد نام فایل ورودی به توان در خط فرمان بدون تغییر مسیر مشخص شده است.
به چه جدید در نسخه 4.11 است:
در این نسخه می افزاید: حمایت برای به & lt؛ XX & gt؛ به به & lt؛ XX & gt؛ به و فرمت٪ uXXXX.
به چه جدید در نسخه 4.10 است:
در این نسخه رفع اشکال ساخته شده است که این استدلال Y به پرچم -a از ascii2uni بدون OP، و تصحیح صفحات man و کمک به برای استدلال Y و Q به پرچم -a برای هر دو برنامه.
استدلال Y در حال حاضر یک خطا برای uni2ascii.
خلاصه اطلاعات نسخه و عمل آموزنده تر است.
نظر یافت نشد