LanguageTool

نرم افزار تصویر:
LanguageTool
جزئیات نرم افزار:
نسخه: 2.9 به روز شده
ها تاریخ: 14 Apr 15
توسعه دهنده: Daniel Naber
پروانه: رایگان
محبوبیت: 18

Rating: nan/5 (Total Votes: 0)

در LanguageTool یک برنامه غلط گیری متن باز طراحی شده برای پیدا کردن خطایی که ابزار غلطیاب املایی به طور منظم نمی تواند تشخیص است. این یک قاعده بر اساس سبک و جستجوگر دستور زبان است که اشتباهات که یک قانون در فایل های XML پیکربندی آن تعریف شده است، از جمله مخلوط کردن تا بر & ldquo پیدا خود کار & rdquo؛ با صفحه & ldquo؛ وجود دارد. کار & rdquo؛


تشخیص مشکلات مختلف دستور زبان

در این برنامه همچنین می تواند مشکلات مختلف شناسایی و دستور زبان می آید با پشتیبانی از بیش از 20 زبان از جمله انگلیسی، آلمانی، لهستانی، فرانسوی، اسپانیایی، سوئدی، یونانی، چینی، دانمارکی، ژاپنی، ایسلندی، پرتغالی پرتغالی برزیل و.
علاوه بر این، آن را دارای یک رابط کاربر گرافیکی آسان برای استفاده، ساده و سر راست است که اجازه می دهد تا هر کسی برای چسباندن متن است که نیاز به طلسم می شود بررسی می شود. این می تواند متن را در کلیپ بورد را بررسی کنید، متن برچسب، برش / کپی / چسباندن متن و اقامت در منطقه سینی سیستم.


تشخیص طیف گسترده ای از مشکلات

از گفتگوی گزینه، شما می توانید فعال که چه نوع از مشکلات برنامه کاربردی می توانند تشخیص، از جمله سبک بد، اشتباهات دستور زبان، زبان عامیانه، اشتباهات نگارشی، غلط املایی ممکن است، عبارات کار برکنار شده، معمولا کلمات اشتباه،، مجموعه، حروف بزرگ، معناشناسی، و همچنین به عنوان عبارات غیر استاندارد.


LanguageTool برای لیبرآفیس و آفیس اپن سورس

علاوه بر این که یک برنامه مستقل، LanguageTool نیز در دسترس به عنوان یک فرمت برای دو تا از محبوب ترین و قدرتمند مجموعههای اداری منبع باز، لیبرآفیس و Apache OpenOffice.org است، اجازه می دهد تا کاربران را به ویرایش متون خود را با راست کلیک کردن بر روی عبارات انتخاب شده یا پاراگراف.


LanguageTool برای موزیلا فایرفاکس

علاوه بر این، این نرم افزار همچنین برای دانلود در دسترس به عنوان یک افزودنی برای جهان برون است؛ مرورگر وب منبع باز محبوب ترین در جهان، موزیلا فایرفاکس است. این نیاز به هیچ راه اندازی مجدد و مکان یک دکمه کوچک در نوار ابزار اصلی، به شما این امکان ویرایش متن هایلایت شده از وب سایت و یا اشکال.


زیر کاپوت و در دسترس بودن
SA نرم افزار کراس پلت فرم، طراحی شده برای کار با هر توزیع گنو / لینوکس، و همچنین به عنوان BSD، سولاریس، ویندوز مایکروسافت و Mac OS X عامل؛

این برنامه به طور کامل در زبان برنامه نویسی جاوا، که بدان معنی است که آن را برون نوشته شده است سیستم های، که در آن جاوا نصب شده است.

در چه در این نسخه جدید است:



کاتالان:
به روز شده POS برچسب فرهنگ لغت
قوانین جدید اضافه
آلارم کاذب ثابت
زبان انگلیسی:
اضافه شده چند قوانین و ثابت چند آلارم کاذب
اضافه شده بسیاری از قوانین به سبک جدید ارائه شده توسط اینکه Heikki Lehvaslaiho. همانطور که این ممکن است باعث آلارم کاذب، آنها به طور پیش فرض فعال نیست. شما می توانید آنها را با روشن همه قوانین در رده جدید به زبان انگلیسی ساده 'را فعال کنید.
اسپرانتو:
اضافه چند قوانین جدید
فرانسوی
به روز شده فرهنگ لغت برچسب POS و Hunspell فرهنگ لغت به Dicollecte-5.3
آلمان:
اضافه چند قانون جدید و آلارم کاذب ثابت
اضافه شدن یک قانون جدید که برای فعل مورد موضوع بررسی می کند. در حال حاضر، تنها موارد با 'IST'، 'سند'، 'جنگ' و 'waren' پشتیبانی می شوند. به عنوان مثال برای اشتباهات است که شناسایی شده است:. اشپیگل Hund سند schA و پاراگراف. N '،' مرگ خودرو schnell IST. را به این کار قانون، عبارات در حال حاضر در disambiguation.xml متحد: به عنوان مثال، 'مان' در عبارت «عین مان" تنها خواندن آن فاعلی حفظ (SUB: NOM: SIN: MAS)، در حالی که از آن استفاده می کرده اند نیز خوانش مفعولی و حالت مفعولی (SUB: AKK: SIN: MAS، SUB: DAT: SIN: MAS). (https://github.com/languagetool-org/languagetool/issues/233)
ایتالیایی:
بهبود چند قانون
لهستانی:
چند قوانین جدید اضافه
پرتغالی:
اضافه / بهبود چند قوانین
3695 کلمات مرکب (پیش از اصلاحات) - بزرگترین پایگاه داده رایگان
روسیه:
قوانین اضافه شده و بهبود یافته
اوکراین:
بزرگ فرهنگ لغت به روز رسانی
قواعد دستور زبان جدید
ساده جدید جایگزین قانون برای پیشنهادات نرم
بهبود disambiguator
برچسب زدن ترکیب و بهبود املا
حروف بهبود برچسب زدن
جمله و کلمه پیشرفت tokenizing
بهبود دست زدن به نماد stres و خط تیره نرم
قوانین Bitext:
اضافه یک قانون ساده برای چک کردن اینکه آیا ترجمه با علامت نقطه گذاری همان اصلی پایان دادن به (این شامل تنها.؟! کاراکتر).
آن است که در حال حاضر امکان اضافه کردن فایل های حکومت bitext خارجی در خط فرمان با استفاده از
گزینه -bitextrule. مسیر فایل را به مطلق است. توجه: این اجازه می دهد تا با استفاده از قوانین bitext همچنین برای زبان که هیچ قوانین bitext شامل به طور پیش فرض.
املا:
فایل های جدید در /hunspell/spelling.txt می توان برای اضافه کردن کلمات پذیرفته شده به غلطیاب املایی که نیز در نظر گرفته که هنگام ایجاد پیشنهادات خود را برای کلمات غلط املایی. این شبیه به فایل های /hunspell/ignore.txt، لیست کلمات که * * * * استفاده نمی هنگام ایجاد پیشنهادات خود را برای کلمات غلط املایی پذیرفته شده است.
API:
JLanguageTool.activateDefaultPatternRules () و JLanguageTool.activateDefaultFalseFriendRules () حذف شده اند - همه قوانین و قواعد الگوی دوستان کاذب (اگر زبان دوم است مشخص شده) در حال حاضر به طور خودکار زمانی سازنده JLanguageTool است که به نام فعال می شود. اگر شما نیاز به یک جستجوگر بدون قواعد مبتنی بر XML الگوی، گسترش کلاس زبان شما (به عنوان مثال 'انگلیسی') با یکی که رونویسی getPatternRules () روش و یک لیست خالی می گرداند وجود دارد.
ManualTagger.lookup () نوشته شده توسط ManualTagger.tag () پس از از آخرین نسخه منسوخ شده جایگزین
همه روش های استاتیک و رشته های مختلف از کلاس زبان 'به کلاس جدید' زبان 'منتقل شده است. در حال حاضر، روش / زمینه در کلاس زبان هنوز هم وجود دارد، اما بد دانسته شده است.
LanguageIdentifierTools حذف شده است. به جای استفاده از LanguageIdentifier.
حذف (پیش فرض) ResourceDataBroker.setResourceDir () و setRulesDir () به عنوان این را می توان با سازنده مجموعه
تمیز کردن تا نویسندگان کلاس، به عنوان مثال از بین بردن getRemark ()
Category.setDefaultOff () حذف شده است، این می تواند از طریق سازنده مجموعه در حال حاضر
کلاس های تغییر نام داد: o.lt.rules.patterns.Element = & gt؛ به o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt؛ به o.lt.rules.patterns.PatternTokenMatcher
دیگر پاکسازی API های کوچک است که باید مورد استفاده مشترک تاثیر نمی گذارد، به عنوان مثال IncorrectExample.getCorrections () بازده و لیست غیرقابل تغییر در حال حاضر، حذف روش منسوخ شده است.
سرور های جاسازی شده:
XML فرار ثابت شده است، این می تواند اسناد XML نامعتبر باعث می شود برگشت
گزینه فایل پیکربندی جدید maxWorkQueueSize 'که به شما امکان تنظیم حداکثر اندازه از درخواست از نوبت - اگر آن را بزرگتر از این می شود، درخواست رد خواهد شد (503 سرویس در دسترس نیست)
سرور در حال حاضر با مشخص تر کدهای وضعیت HTTP به این شرایط خطا پاسخ: 413 درخواست نهاد بیش از حد بزرگ - اگر متن بیش از حداکثر اندازه متن 503 سرویس در دسترس نیست - اگر چک بیش از حداکثر زمان بررسی
GUI:
GUI مستقل هم اکنون می توانید یک فایل متنی را به عنوان آرگومان، این فایل پس از آن در هنگام راه اندازی (گیتهاب مسئله # 232) لود شود.
خط فرمان:
در حال حاضر امکان برای اضافه کردن یک فایل حکومت خارجی هنگام فراخوانی LanguageTool از خط فرمان. استفاده از --rulefile برای اضافه کردن یک فایل. اگر نام فایل یک فرمت است که شامل یک نام زبان، از آن خواهد شد در کنار قوانین دیگر استفاده می شود. در غیر این صورت، آن را به قوانین جایگزین. شما همچنین می توانید یک فایل خارجی با دوستان دروغین با استفاده از گزینه --falsefriends بارگذاری. نام فایل باید مسیر فایل مطلق باشد، و فایل های کاذب دوستان همیشه به آنهایی هستند که برای زبان لود اضافه شده است. (گیتهاب مسئله # 192)
قانون نحو:
یک قانون در حال حاضر ممکن است به عنوان مثال جمله اند تا زمانی که آن را به یک "اصلاح 'ویژگی - این می تواند برخی از افزونگی را ذخیره کنید اگر تنها جمله درست است همان جمله نادرست با تصحیح کاربردی است. قبل از اینکه، یک قانون حداقل دو مثال جملات مورد نیاز است.
"مثال" عنصر: نوع = "نادرست" در حال حاضر اختیاری اگر یک "اصلاح 'ویژگی وجود دارد. 'اصلاح' ویژگی نشان میدهد که حکم نادرست است.
"مثال" عنصر: نوع = "درست" در حال حاضر اختیاری است. بدون نوع 'ویژگی و نه "اصلاح' ویژگی نشان میدهد که حکم درست است.
داخلی:
ما از آپاچی Tika به زبان آشکارساز (https://github.com/optimaize/language-detector) برای شناسایی اتوماتیک زبان متن روشن باشد. باید سریعتر باشد و نتایج باید قابل اطمینان تر خواهد بود. تشخیص Asturian و گالیسیایی تا به حال به غیر فعال شود زیرا کیفیت تشخیص بیش از حد کم بود و همچنین تشخیص اسپانیایی تحت تاثیر قرار.
ثابت رگرسیون ساخته شده است که آن را غیر ممکن برای بارگذاری فایل های حکومت خارجی در GUI.

در نسخه 2.8 چه جدید است:



Asturian:
وابستگی به حذف در Hunspell، در حال حاضر با استفاده از Morfologik برای بررسی املا
برتون:
اضافه شده و چند قانون بهبود
کاتالان:
به روز شده فرهنگ لغت
قوانین اضافه شده و بهبود یافته
آلارم کاذب ثابت
هلندی:
اضافه شده و بهبود یافته قوانین بسیاری از
زبان انگلیسی:
برخی از قوانین جدید (با تشکر از نیک هاف)
به روز شده در دستوری و سینت سایزر واژه نامه ها، رفع مشکل # 202
فیلتر جدید را برای تطبیق partofspeech قطعات از کلمات، به عنوان مثال استفاده می شود: در * این تنها بازی برای کلماتی که با "در" و که در آن شروع خواهد شد نگه داشتن بخشی بعد از "در" صفت (POS برچسب 'JJ' است ). 'هیچ: 1' موقعیت رمز است، یعنی در اینجا برای اولین بار (و فقط) تطبیق شده است به اشاره شده است.
فرانسه:
اضافه شده و چند قانون بهبود
آلمان:
اضافه شده و چند قانون بهبود
لهستانی:
اضافه شده و بهبود یافته چندین قوانین
اضافه شده و بهبود یافته دوستان دروغین با زبان انگلیسی
پرتغالی:
اضافه / بهبود چند قوانین
اسپانیایی:
وابستگی به حذف در Hunspell، در حال حاضر با استفاده از Morfologik برای بررسی املا
فرمت فایل قوانین
اضافه شده قوانین بیشتر
تاگالوگ:
وابستگی به حذف در Hunspell، در حال حاضر با استفاده از Morfologik برای بررسی املا
شخصیت خط تیره ("") حائل در حال حاضر زمانی که tokenizing متن
روسیه:
قوانین اضافه شده و بهبود یافته
چند قانون دوستان نادرست اضافه (به روسی / انگلیسی)
اوکراین:
بسیاری از قوانین جدید (از جمله توافق با اسم، عبارات زمان و ...)
بهبود پوشش قانون
فرهنگ لغت به روز رسانی (پیشرفت های بزرگی برای اسم های خاص و مورد ندایی)
تگ جدید و حکومت در مورد املای دیگر هشدار می دهند
اضافه اطلاعات فرکانس کلمه برای بهبود پیشنهادی برای املا
برخی از قوانین disambiguator جدید
قانون نحو:
... هم اکنون می توانید به یک rulegroup اضافه شود برای تحت تاثیر قرار از تمام قوانین آن گروه
اگر شما قوانین خود را که بخشی از LT نمی توسعه شما هم اکنون می توانید اضافه کنید = خارجی "بله" به دسته خود را برای جلوگیری از لینک حکومت به community.languagetool.org از ظاهر شدن در GUI مستقل ما (لینک نبود قوانین کار که بخشی از توزیع اصلی LT) نیست. (گیتهاب مسئله # 223)
اگر یک گروه قانون پیش فرض را تعیین = "خاموش"، قواعد در داخل گروه حکومت نیز ممکن است به طور پیش فرض نمی مشخص = "در" / "خاموش".
API:
کلاس های حذف شده و روش هایی که از 2.7 یا بیشتر توصیه نمی شده است
سرور های جاسازی شده:
'requestLimit' فایل پیکربندی گزینه ها و 'requestLimitPeriodInSeconds' در حال حاضر نیز می تواند برای سرور HTTP استفاده می شود (و نه فقط برای سرور HTTPS)
جدید فایل پیکربندی گزینه 'trustXForwardForHeader': این به «درست» تنظیم اگر شما سرور در پشت یک پروکسی معکوس اجرا و می خواهید محدودیت درخواست برای کار بر روی آدرس IP اصلی ارائه شده توسط هدر HTTP 'Xforwardedfor، معمولا توسط پروکسی تنظیم شده است. اگر شما پشت یک پروکسی اجرا اما این خاصیت را درست تنظیم نشده است، یک کاربر می تواند تمام درخواست استفاده کنند، کاربران دیگر نیز یک پیغام خطا را به دلیل محدودیت درخواست دریافت کنید.
ثابت پاسخ پس از حالت مهلت: ... گاهی اوقات خالی بود، گیج کننده چک در متن وردپرس
قوانین Bitext به درستی غیر فعال است، حتی اگر آنها را با پارامتر مناسب برای سرور مشخص شد. در حال حاضر آن را ثابت
حل مشکل با موقعیت نامناسب برای برخی از قوانین bitext (موضوع # 218)
GUI:
یک تنظیم جدید 'errorColors' شده است به فایل پیکربندی languagetool.cfg اضافه شده است. می توان آن را مورد استفاده برای تنظیم رنگ پس زمینه از خطا است. به عنوان مثال، errorColors = تایپی: # b8b8ff، سبک: # ffb8b8 خطاهای 'تایپی رو با یک پس زمینه آبی و خطاهای سبک رو با یک پس زمینه قرمز در قسمت فوقانی پنجره LT نشان می دهد. 'تایپی "و" سبک "انواع که در grammar.xml به عنوان" نوع = ... "مجموعه می باشد. هیچ رابط کاربری وجود دارد هنوز به پیکربندی این رنگ. توجه داشته باشید که شما باید فقط از ویرایش فایل languagetool.cfg هنگامی که در حال اجرا است LT نیست.
داخلی:
اشکالات: قوانین در داخل یک گروه حاکمیت بود فعال شده است اگر یک قانون قبلی از rulegroup مشابه استفاده می شود به طور پیش فرض = "خاموش"
کلمات دیگر توسط غلطیاب املایی فقط به خاطر اینکه آنها در پیشنهاد یک قاعده رخ دهد نادیده گرفته شود. اگر می خواهید غلطیاب املایی را به چشم پوشی کلمات در سطح جهان، افزودن آنها به hunspell / ignore.txt. به چشم پوشی از آنها را در زمینه بسته، اضافه کردن یک "ignore_spelling 'قانون به disambiguation.xml.
فایل hunspell / prohibit.txt 'در حال حاضر می تواند استفاده شود به علامت کلمات به عنوان اشتباهات املایی حتی اگر غلطیاب املایی به طور معمول آنها را بپذیرید. این بسیار مفید است برای بهبود LanguageTool غلطیاب املایی بدون انتظار برای جستجوگر بالادست به روز می شود. فایل 'prohibit.txt' در مقابل 'ignore.txt'، که باعث غلطیاب املایی را به چشم پوشی کلمات است.
دستوری partofspeech برای اکثر زبانهای هم اکنون می توانید با اضافه کردن مطالب به فایل سازمان / languagetool / منابع / XX / added.txt (XX بودن زبان) تمدید شود. فرمت "postag baseform fullform"، سه ستون از هم جدا شده زبانه است. این باعث می شود آن را آسان تر برای کاربران (و توسعه دهندگان) به گسترش دستوری POS، به عنوان آنها لازم نیست به صادرات، ویرایش، و از نو خلق کردن فرهنگ لغت دودویی برای هر تغییر.

در چه نسخه 2.7 جدید است:



برتون:
قوانین اضافه شده و بهبود یافته
قانون جدید که چک اگر یک روز هفته مسابقات از تاریخ، به عنوان مثال تشخیص "Gwener 28 Eost یعنی 2014"، به عنوان آن تاریخ است روز جمعه نیست.
کاتالان:
قوانین اضافه شده و بهبود یافته
آلارم کاذب ثابت
هلندی:
اضافه شده و بهبود یافته قوانین بسیاری از
تغییر به اساس Morfologik-غلطیاب املایی
انگلیسی:
آیا شما می خواهید به عنوان بخشی از تیم است که توسعه قدرتمند ترین ابزار غلط گیری متن باز در جهان؟ ما به دنبال یک نگهدارنده برای قوانین زبان انگلیسی در LanguageTool. http://wiki.languagetool.org/tasks-for-language-maintainers برای جزئیات بیشتر.
همه دیکشنری های انگلیسی اند تمدید شده است شامل کلاس های فرکانس کلمه برای بهبود پیشنهادات غلطیاب املایی (داده فرکانس از https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js/imes/ گرفته واژه نامه ها / لاتین، به عنوان برای زبان های دیگر که در حال حاضر استفاده از این ویژگی).
پیشنهادهای بهتری را برای زبان آموزان زبان انگلیسی: افعال بیقاعده، اسم، صفت و در حال حاضر معمولا یک پیشنهاد بهتر است. به عنوان مثال، 'thinked' نشان می دهد 'فکر'، 'زن' 'زنان' نشان می دهد.
غلط املائی بیشتر در حال حاضر ارائه پیشنهادات، به عنوان مثال 'garentee' (تضمین)، 'greatful (سپاسگزار). این ممکن است به کاهش عملکرد ~ 10٪ (بیشتر برای متون با تعداد زیادی از کلمات ناشناخته) شود.
قانون جدید که چک اگر یک روز هفته مسابقات از تاریخ، به عنوان مثال تشخیص "دوشنبه، 2014 اکتبر 7"، به عنوان آن تاریخ است دوشنبه نیست. این قانون تنها کار خواهد کرد اگر آن را به فرمت تاریخ در استفاده از تشخیص. تا کنون، این فرمت پشتیبانی می شوند: * "دوشنبه، 2014 اکتبر 7" * * * * "دوشنبه، 2014 اکتبر 7" * * * * "دوشنبه، 2014 اکتبر 7" * * * * "دوشنبه، 2014 اکتبر 7" * * * * (از این نیز با هفته به صورت مختصر کار می کند روز مانند مو یا دوشنبه روز دوشنبه)
اسپرانتو:
قانون جدید که چک اگر یک روز هفته مسابقات از تاریخ، به عنوان مثال تشخیص "Vendredon لا 28-د AAgusto 2014"، به عنوان آن تاریخ است روز جمعه نیست.
فرانسه:
به روز شده فرهنگ لغت برچسب POS و Hunspell فرهنگ لغت به Dicollecte-5.2
اضافه سینت سایزر - قانون مورد هم اکنون می توانید پیشنهادات خود را برای برخی از اشتباهات را
اضافه / بهبود چند قوانین
قانون جدید که چک اگر یک روز هفته مسابقات از تاریخ، به عنوان مثال تشخیص "vendredi 28/08/2014"، به عنوان آن تاریخ است روز جمعه نیست.
آلمان:
ثابت NullPointerException نادر و ArrayIndexOutOfBoundsException
چند آلارم کاذب ثابت
اضافه شده و بهبود یافته قوانین
قانون جدید که برای جملات (به علت خطر ابتلا به آلارم کاذب پیش فرض خاموش تبدیل) چک بدون فعل
قانون جدید که چک اگر یک روز هفته مسابقات از تاریخ، به عنوان مثال تشخیص "Dienstag، 2014/09/29"، به عنوان آن تاریخ است روز سه شنبه نیست.
بهبود عملکرد برای بررسی املا پیشنهادات
فارسی:
حمایت اولیه اضافه شده برای فارسی (فارسی)
لهستانی:
اضافه شده و بهبود یافته برخی از قوانین
قانون جدید که چک اگر یک روز هفته مسابقات از تاریخ
پرتغالی:
اضافه / بهبود چند قوانین
ده ها اضافه شده است بسیاری از کلمات مرکب
روسیه:
قوانین جدید اضافه
رفع سورس درخواست ویژگی # 38 (بررسی علامت نقل قول های مختلف)
چند قانون دوستان نادرست اضافه (به روسی / انگلیسی)
قانون جدید که چک اگر یک روز هفته مسابقات از تاریخ، به عنوان مثال تشخیص "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ؟؟ و ETH؛ و میکرو؛ و ETH؛ و frac12. N & sbquo. N ؟؟ و ETH؛ و plusmn؛ N & یورو، N ؟؟ 2014 و ETH؛ و sup3؛ "، به عنوان آن تاریخ است دوشنبه نیست.
گسترش حاکمیت ترکیب روسیه با کلمات جدید از postag فرهنگ لغت
اسپانیایی:
اضافه شده جدید Z رده POS (برای اعداد املای، به عنوان مثال 'UNO'، 'داس'، ...)
تعداد املای هم اکنون می توانید تشخیص داده شود و هر دو در ابهامزدایی و قوانین اداره می شود.
ثابت برخی از lemmas نادرست در POS فرهنگ لغت.
اضافه ترکیبی chunker-disambiguator.
تامیل:
اضافه شدن پشتیبانی اولیه برای تامیل. اگر فونت برای تامیل به درستی بر روی کامپیوتر شما نمایش داده نمی شود و شما با استفاده از ویندوز، شما ممکن است نیاز به درخواست کار در سراسر در اینجا شرح: https://bugs.openjdk.java.net/browse/JDK-8008572
اوکراین:
به روز رسانی بزرگ برای POS فرهنگ لغت (رفع و کلمات جدید)
برخی از تگ POS تغییر نام برای قوام؛ برچسب جدید برای اختصارات و کلمات نادر
بسیاری از قوانین جدید و رفع قوانین موجود برای
قانون جدید که چک اگر یک روز هفته مسابقات از تاریخ، به عنوان مثال تشخیص "و ETH؛ و ETH؛ و frac34؛ و ETH؛ و frac12؛ و ETH؛ و میکرو؛ و ETH؛ 'N- و ETH؛" و ETH؛ و frac34؛ و ETH؛ و ordm؛ 7 و ETH؛ و بند؛ و ETH؛ و frac34؛ و ETH؛ و sup2. 2014 "، به عنوان آن تاریخ است دوشنبه
بهبود عملکرد عادی رمز
ادغام لیبرآفیس:
آیا اشتباه توسط پانوشت در لیبرآفیس 4.3 می کنید و بعد از آن (در حال حاضر ما فراهم می کند با مواضع پاورقی به عنوان داده های متا، بنابراین ما می توانیم آنها را نادیده گرفت).
API:
بهبود عملکرد عمده برای چند موضوع مورد استفاده، که در آن JLanguageTool هر موضوع ایجاد می شود، اما جسم زبان (مثلا آلمان) را فقط یک بار ایجاد می شود. خطوط برای ایجاد JLanguageTool در حال حاضر باید بسیار پایین تر است.
کلاس های مختلف حذف شده و روش هایی که از نسخه 2.6 بد دانسته شده است
DutchSpellerRule حذف - به جای استفاده از MorfologikDutchSpellerRule
امضای Language.getRelevantRules () تغییر کرده است
سازنده JLanguageTool و MultiThreadedJLanguageTool را اعلام به پرتاب IOException دیگر
WhitespaceRule شده است به MultipleWhitespaceRule تغییر نام داد (WhitespaceRule هنوز هم وجود دارد، اما قدیمی شده است)
توصیه برخی از روش های که دید خواهد شد (به عنوان مثال از عمومی به محافظت) کاهش
MorfologikSpellerRule.getRuleMatch (رشته، اعضای هیات) شده است به MorfologikSpellerRule.getRuleMatches تغییر نام داد (رشته، اعضای هیات)
سازنده RuleMatch در حال حاضر استثنای اگر toPosition است نه بزرگتر از fromPosition
معرفی TextLevelRule جدید کلاس انتزاعی است که گستردگی و قانون است که می تواند برای قوانین است که پوشش بیش از جملات تنها استفاده می شود.
خط فرمان:
فعال کردن و غیر فعال کردن قوانین خاص در همان زمان در حال حاضر مجاز می باشد. به منظور آزمون تنها برخی از قوانین (غیر فعال کردن تمام بقیه) که قبلا با "LIST_OF_RULES --enable" انجام شد، در حال حاضر استفاده از "LIST_OF_RULES --enabledonly --enable" (یا "-eo -e LIST_OF_RULES").
سرور های جاسازی شده:
دو گزینه جدید را می توان در خواص مجموعه فایل به فرمت XML LanguageTool همان پس از مهلت (ATD) بازگشت. به این ترتیب می توان آن را به عنوان یک قطره در جایگزینی برای ATD استفاده می شود: * در حالت - LanguageTool 'یا' AfterTheDeadline '* afterTheDeadlineLanguage - کد زبان پیش فرض اگر حالت است توجه داشته باشید' AfterTheDeadline 'تنظیم: حالت' AfterTheDeadline 'باید در نظر گرفته شود تجربی در حال حاضر.
گزینه جدید maxCheckThreads 'اجازه می دهد تا تنظیم حداکثر تعداد موضوعات کار بر روی درخواست ها را در موازی. به طور پیش فرض 10 است، به عنوان آن استفاده می شود.
داخلی:
جدید AbstractDateCheckFilter قانون انتزاعی است که اجازه می دهد تا اگر یک روز در هفته و تاریخ بازی به تیک بزنید. به عنوان مثال »سه شنبه 2014 سپتامبر 29" می تواند تشخیص داده شود، به عنوان 2014 سپتامبر 29 است در واقع نه یک سه. این با استفاده از رابط کاربری جدید RuleFilter تجربی است که می توان از XML با Filter را عنصر جدید به نام. 'کلاس:: نام به طور کامل واجد شرایط از یک کلاس جاوا است که پیاده سازی RuleFilter، به عنوان مثال "فیلتر" این ویژگی را می گیرد "org.languagetool.rules.de.DateCheckFilter" استدلال ": یک رشته مانند" سال: 1 ماه: 2 روز: 3 روز هفته: 4 "، یعنی یک لیست فاصله از هم جدا از جفت کلید / مقدار که x می شود به حل و فصل ارزش راستا الگوی است (همانطور که در 'پیام' عنصر)
قانون ترکیب در حال حاضر نشانه هایی که در disambiguation.xml واکسینه شده است را نادیده می گیرد
"فیلتر" اقدام در disambiguator در حال حاضر تنها به تگ های POS که مطابقت برچسب POS داده شده استفاده شود. اگر آنها با هم مطابقت ندارند، قانون اعمال نمی شود.
اگر شما در حال گسترش قوانین XML به عنوان در http://wiki.languagetool.org/tips-and-tricks#toc2 توصیف، قانون و ابهامزدایی فایل های خارجی هم اکنون می توانید در سرور محافظت شده با پسوردم بوسیله تعیین یک URL مانند میزبانی می شود این است: http: // کاربر: password@example.org/path/user-rules.xml
خط فاصله Em ("و یورو؛" ") در حال حاضر یک شخصیت tokenizing برای تمام زبان ها
ویژگی های جدید:
استفاده از مدل های زبان
LanguageTool هم اکنون می توانید استفاده از داده ngram کند. اطلاعات ngram اطلاعات در مورد اینکه چگونه اغلب عبارات در زبان رخ می دهد است. در حال حاضر، این با استفاده از عبارات طول 3.
داده ها توسط یک حکومت انگلیسی استفاده می شود برای پیدا کردن خطاها متشابه الصوت، مانند مخلوط کردن تا درشت / دوره و یا استعداد / شعله ور شدن. LanguageTool به حال برخی از قوانین از این نوع قبل، اما در حکومت جدید در حال حاضر در حدود 900 کلمه از جمله جفت / مجموعه پشتیبانی می کند.
اطلاعات مورد نیاز برای این بزرگ (7GB برای زبان انگلیسی) و در نتیجه بخشی یا LanguageTool است.
داده (فقط انگلیسی در حال حاضر) و مدارک بیشتری در http://wiki.languagetool.org/finding-errors-using-big-data موجود است
با استفاده از ngrams می سازد LanguageTool کمی کندتر زمانی که داده ها بر روی یک SSD ذخیره می شود.
اگر در SSD ذخیره نمی شوند، عملکرد به شدت ممکن است کاهش می دهد.
با استفاده از گزینه --languagemodel جدید با مشتری خط فرمان برای فعال کردن حکومت است که با استفاده از داده ها. که گزینه در حال حاضر برای GUI مستقل نیست.

در نسخه 2.4.1 چه جدید است:



به روز شده در کتابخانه Morfologik به 1.8.3 به رفع پیشنهادات آهسته در غلطیاب املایی، که حداقل EN-US تحت تاثیر قرار

در نسخه 2.4 چه جدید است:



برتون:
SRX tokenization جمله
اضافه / بهبود چند قانون
ثابت برخی از آلارم کاذب
ثابت پیشنهادات نادرست به لطف آزمون اضافه شده در اصلاحات
کاتالان:
اضافه / بهبود چند قوانین
آلارم کاذب ثابت
اضافه شده به لغت نامه و رفع دستوری
حذف برخی از کلمات از فرهنگ لغت سنتز (filterarchaic.txt مراجعه کنید)
اطلاعات فرکانس به فرهنگ لغت دستوری اضافه شده است؛ wordlist فرکانس می آید از پروژه گایا، با مجوز آپاچی، نسخه 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
زبان انگلیسی:
اضافه / بهبود چند قانون
ثابت برخی از آلارم کاذب
فرانسه:
اضافه / بهبود چند قوانین
ثابت برخی از آلارم کاذب
آلمان:
اضافه / بهبود چند قوانین
اضافه سینت سایزر قانون مورد هم اکنون می توانید پیشنهادات خود را برای برخی از اشتباهات (نه همه پیشنهادات درست است، هر چند) را
لهستانی:
اضافه / بهبود قوانین مختلف، به ویژه برای خط و خط تیره استفاده
اطلاعات فرکانس اضافه شده برای املا فرهنگ لغت. wordlist فرکانس می آید از پروژه گایا، با مجوز آپاچی، نسخه 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
ثابت برخی از آلارم کاذب
پرتغالی:
اضافه / بهبود چند قاعده (که شامل قوانین جنسیتی "" / "O")
آن در حال حاضر 3400+ کلمات مرکب
فایل JAR تغییر کرده است به languagetool.jar، از قبلا languagetoolstandalone.jar برای جلوگیری از سردرگمی در مورد چه چیزی مستقل به معنی در این زمینه (گیتهاب مسئله # 29)
برای زبان با بسیاری از قوانین (مانند فرانسه یا آلمانی) عملکرد ارائه شده در متون طولانی شده است در مورد 2030 درصد افزایش یافته است
تعمیر برای threadsafety (می تواند قطع در MultiWordChunker شود)
رفع اشکالی که در آن حاشیه نویسی تکه شد در گروه مورد آزمایش قرار نمی
تعمیر: 1 و شده بود در مورد ارزیابی قرار نمی ...
رفع اشکالی در مکانیزم وحدت است که برخی از تفاسیر تطبیق دور انداخته قبل از موعد مقرر
اضافه شده پشتیبانی از حاشیه نویسی تکه در disambiguator، و یکی از مشکلات را در نشانه فیلتر با حاشیه نویسی تکه ثابت
کتابخانه به روز شده Morfologik به 1.8.2 (رفع اشکال، سلامت عقل ورودی سختگیرانه تر چک کردن، اضافه کردن اطلاعات فرکانس به لغت نامه)
اضافه گزینه شامل اطلاعات فراوانی به taggging و یا املایی واژه نامه ها. فرمت مورد از wordlists فرکانس یکی در پروژه گایا است، با مجوز آپاچی، نسخه 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
ابزارهای جدید خط فرمان به صادرات و ایجاد لغت نامه های باینری:
org.languagetool.dev.DictionaryExporter
org.languagetool.dev.POSDictionaryBuilder
ادغام لیبرآفیس / آفیس اپن سورس:
برای تشخیص جمله نادرست در مورد که پاورقی پس از یک جمله توقف کامل به نظر می رسد (های Sourceforge اشکال # 191) اضافه شده یک راه حل
GUI مستقل:
گفت و گو با "بیشتر ..." آیتم در منوی زمینه از خطا باز در حال حاضر نیز به عنوان مثال جملات درست و نادرست نمایش
API:
SentenceTokenizer در حال حاضر یک رابط، پیاده سازی شده است به RegexSentenceTokenizer نقل مکان کرد، اما این است که بد دانسته و SRXSentenceTokenizer باید به جای استفاده
برخی از روش های از org.languagetool.tools.StringTools در پروژه languagetoolguicommons به کلاس org.languagetool.gui.Tools منتقل شده است
LanguageToolListener.languageToolEventOccured () شده است به LanguageToolListener.languageToolEventOccurred تغییر نام داد ()
org.languagetool.tools.SymbolLocator است عمومی دیگر نیست (باید کسی تاثیر نمی گذارد)
حذف DanishSentenceTokenizer که به مدت سه سال توصیه نمی شده است
Rule.getCorrectExamples () و Rule.getIncorrectExamples () نمی گرداند پوچ دیگر اما یک لیست خالی اگر هیچ نمونه وجود دارد. در نتیجه، setCorrectExamples () و setIncorrectExamples () را قبول نمی پوچ دیگر.
Rule.getId () ممکن است هر رشته در حال حاضر بازگشت، نه فقط ASCIIonly رشته (در واقع این بوده است مورد قبل، به عنوان محدودیت ASCIIonly هرگز به اجرا گذاشته شد و تنها در javadoc ذکر شده)
languagetoolwikipedia: گزینه های خط فرمان برای چک کردن تخلیه ویکیپدیا ساده شده است. دستور هم اکنون می توانید مثل این است نامیده می شود: شیشه جاوا languagetoolwikipedia.jar checkdata ل EN F enwiki20130621pagesarticles.xml تماس بگیرید فقط "شیشه جاوا checkdata languagetoolwikipedia.jar" برای به دست آوردن یک پیام استفاده. بیش از یک فایل را می توان با گزینه F مشخص شود. علاوه بر این به ویکیپدیا افسردگی XML، فایل های CSV از Tatoeba (http://tatoeba.org) در حال حاضر نیز پشتیبانی می کنند، لازم است برای اولین بار به فقط شامل زبان مربوط به فیلتر می شود.

در چه در نسخه 2.3 جدید است:



برتون:
اضافه / بهبود چند قانون
آلارم کاذب ثابت
به روز شده فرهنگ لغت POS از Apertium (SVN r47282)
کاتالان:
اضافه شده پشتیبانی از زبان های CA-ES-والنسیا (کاتالان Valencian)، که در لیبرآفیس 4.2.0 استفاده
با صدها نفر از پیشنهادات جایگزینی اضافه یک قاعده ساده جایگزین
اضافه / بهبود چند قوانین
آلارم کاذب ثابت
چینی:
اضافه یک راه حل برای یک StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
زبان انگلیسی:
الگوهای جایگزینی برای اضافه جستجوگر املا را به پیشنهادهای بهتری را (در حال حاضر ارائه می دهد 'آموزش داده' برای 'مشغول به تدریس')
اضافه / بهبود چند قانون
فرانسه:
اضافه / بهبود چند قانون
آلارم کاذب ثابت
به روز شده فرهنگ لغت برچسب POS و Hunspell فرهنگ لغت به Dicollecte-4.12
آلمان:
اضافه / بهبود چند قوانین
پرتغالی:
اضافه / بهبود چند قانون
آن در حال حاضر 3300+ کلمات مرکب
اوکراین:
اضافه / بهبود چند قوانین
کد منبع شده است به گیتهاب نقل مکان کرد: https://github.com/languagetool-org/languagetool
LanguageTool نیاز به جاوا 7 در حال حاضر
LanguageTool استفاده می کند از موضوعات مختلف در حال حاضر برای چک کردن متن بر روی سخت افزار های مدرن، بهبود عملکرد (این بر نسخه مستقل، نسخه خط فرمان و گسترش لیبرآفیس / آفیس اپن سورس)
قانون نحو:
حمایت اولیه برای صفات حداقل / حداکثر جدید اجازه می دهد که برای مطابقت با یک عنصر است که به نظر می رسد تعداد معینی از بار. به عنوان مثال: مواد غذایی خواهد شد هیچ چیز و یا "تولی"، یعنی مطابقت "تولی" است غذ اختیاری خواهد "تولی" و یا "در foo foo" foo به دنبال هیچ چیز مطابقت، "مواد غذایی"، و یا "در foo foo" استفاده از حداکثر = مطابقت "- 1" اجازه می دهد تا ظهور نامحدود. برای دقیقه، فقط 0 یا 1 پشتیبانی می شود (1 پیش فرض است).
پشتیبانی از OR-اظهارات. به عنوان مثال: در داخل و در زمان اجرا، شامل قاعده OR-اظهارات به قوانین چند بدون OR-اظهارات تبدیل شده است.
انگلیسی در حال حاضر chunker را برای شناسایی، در میان دیگران، تکه اسم مفرد و جمع. این است که در http://wiki.languagetool.org/using-chunks مستند
نسخه مستقل:
نسخه مستقل در حال حاضر تاکید خطا با رنگ قرمز (اشتباهات املایی) یا آبی (خطاهای دیگر) خط (پناگیوتیس Minos)
به یاد داشته باشید انتخاب زبان برای شروع بعدی
بهبود پنجره و قرار دادن گفت و گو در راه اندازی چند مانیتور
سرور تعبیه شده: با استفاده از پورت پیش فرض (8081) دوباره اگر بدون آرگومان آغاز شده
به روز شده در morfologik-ناشی کتابخانه به نسخه 1.7.1 به فعال کردن پیشنهادهای بهتری را، از جمله اداره مناسب تفکیک و الگوهای جایگزینی (معادل MAP و REP ویژگی های در لغت نامه hunspell)
ادغام آفیس اپن سورس / لیبرآفیس:
تعمیر: "درباره" گفت و گو را در آپاچی آفیس اپن سورس 4.0 کار نمی کند
ثابت: قوانین خاص کشور (مانند به انگلیسی بریتانیایی) کار نمی کند
API:
در کلاس زبان، getCountryVariants () شده است به getCountries () تغییر نام داد، و یک روش getVariant جدید اضافه شده است.
برخی از روش قدیمی شده است
برخی از روش های از کلاس ها (languagetool هسته ای) به کلاس جدید CommandLineTools (languagetool-خط فرمان) منتقل شده است
AbstractRuleDisambiguator تا به XmlRuleDisambiguator تغییر نام شده است و دیگر انتزاعی نیست. کلاس RuleDisambiguator حذف شده اند، XmlRuleDisambiguator تواند به طور مستقیم به جای استفاده می شود.
یک روش جدید JLanguageTool.check (AnnotatedText) معرفی شده است که اجازه می دهد تا به شما برای بررسی متن را با نشانه گذاری. استفاده از AnnotatedTextBuilder برای ساخت تا ورودی.
موضوع ایمنی است بهبود یافته است. مورد استفاده توصیه می شود در حال حاضر برای ایجاد یک شیء JLanguageTool جدید برای هر موضوع، اما برای ایجاد زبان تنها یک بار (به عنوان مثال جدید انگلیسی ()) و استفاده از آن برای همه موارد JLanguageTool. این تغییر API برخی از کلاس های عمومی است، اما برای مورد استفاده استاندارد از چک کردن متون با JLanguageTool اعتراض آن را باید یک تفاوت را ندارد. (پچ توسط Stefan Lotties)
JLanguageTool.loadFalseFriendRules () در حال حاضر مانند JLanguageTool.loadPatternRules () رفتار: آن را در مسیر کلاس به نظر می رسد برای اولین بار، و پس از آن، در صورتی که فایل داده شده است وجود دارد یافت نشد، در فایل سیستم
معرفی رابط Chunker است که می تواند تکه های اختصاص (همچنین به عنوان عبارات شناخته می شود) به نشانه. به عنوان مثال، برای عبارات اسم مانند "یک کامپیوتر سریع" chunker می تواند 'NP-مفرد (عبارت اسم، مفرد) تکه به هر یک از نشانه های که در آن عبارت اختصاص دهید. در grammar.xml، مانند نشانه سپس می توانید با این نحو همسان باشد:
MultiThreadedJLanguageTool کلاس جدید با استفاده از موضوعات به عنوان بسیاری از کامپیوتر دارای پردازنده. در آزمایشات ما این است بهبود یافته متن چک کردن زمان در حدود 70٪ در پردازنده i7 اینتل زمانی که در متن 30KB استفاده می شود.
AnalyzedTokenReadings در حال حاضر پیاده سازی Iterable بنابراین می توان آن را در حلقه foreach به استفاده
AnalyzedGermanTokenReadings حذف شده است، AnalyzedTokenReadings می تواند به جای استفاده
سرور HTTP تعبیه شده: سرور در حال حاضر با استفاده از 10 موضوعات به جای 1 (با تشکر از پناگیوتیس Minos)
استخراج متن از افسردگی ویکیپدیا است بهبود یافته است

در چه در نسخه 2.2 جدید است:



بسیاری از قوانین تشخیص خطا به روز شده اند، به ویژه برای فرانسوی، کاتالان، آلمانی، پرتغالی، روسی، اسپرانتو، و برتون.
تعدادی از اشکالات کوچک برطرف شده است.

در چه در نسخه 2.1 جدید است:



این نسخه به روز رسانی می افزاید: بسیاری برای قوانین تشخیص خطا برای زبان های انگلیسی، فرانسوی، آلمانی، پرتغالی، کاتالان، لهستانی، روسی، برتون، اسپرانتو، و ایتالیایی.
LanguageTool در حال حاضر مدولار است، برای استفاده راحت تر توسط توسعه دهندگان جاوا.
به جای یکی JAR بزرگ، در حال حاضر آنهایی که چند کوچک (به زودی به در MAVEN مرکزی یافت می شود) وجود دارد.
تعدادی از اشکالات برطرف شده است.

در چه در نسخه 2.0 جدید است:



بسیاری از به روز رسانی برای قوانین تشخیص خطا برای زبان های انگلیسی، اسپانیایی، فرانسوی، آلمانی، پرتغالی، روسی، برتون، کاتالان، اسپرانتو، و اوکراین اضافه شده است.
سرور HTTP تعبیه شده هم اکنون می توانید از منوی زمینه آغاز شده است اگر LanguageTool در حال اجرا در سینی سیستم.
برخی از اشکالات کوچک برطرف شده است.

در نسخه 1.9 چه جدید است:



بسیاری از قوانین تشخیص خطا های جدید به آن اضافه شده و قوانین موجود به روز شده است.

در مورد نیاز:




نرم افزار های دیگر از توسعه دهنده Daniel Naber

Jwordsplitter
Jwordsplitter

21 Jan 15

LanguageTool
LanguageTool

21 Jan 15

نظرات به LanguageTool

نظر یافت نشد
اضافه کردن نظر
روشن کردن تصاویر!