DataCleaner

نرم افزار تصویر:
DataCleaner
جزئیات نرم افزار:
نسخه: 4.0.9
ها تاریخ: 11 Apr 16
توسعه دهنده: -
پروانه: رایگان
محبوبیت: 49

Rating: nan/5 (Total Votes: 0)

DataCleaner منبع باز و راه حل های کاملا رایگان برای سازمان ها و کسب و کار که مایل به افزایش و اندازه گیری کیفیت داده است.

با DataCleaner، کاربران قادر به مشاهده، مقایسه، اعتبار داده ها در برابر قوانین کسب و کار، و نظارت بر پیشرفت این اندازه گیری ها در طول زمان خواهد بود.

در میان ویژگی های آن است، ما می توانیم نظارت بر داده، پروفایل داده ها و تجزیه و تحلیل DQ، پاک کردن داده و غنی سازی به ذکر است، شناسایی و ادغام موارد تکراری، با کیفیت داده های مشتری، و همچنین ETLightweight فوق العاده سریع (عصاره تبدیل بار).

برای کسب اطلاعات بیشتر در مورد توابع و قابلیت های DataCleaner، و همچنین به عنوان نحوه کار با آن، لطفا به http://eobjects.dk/docs

What مراجعه در این نسخه جدید است

ارتقاء و ویژگی های جدید:
ما آن را ممکن است برای ایجاد و رها کردن جداول از طریق UI دسکتاپ DataCleaner. توجه داشته باشید که مدت و & quot؛ جدول و & quot؛ در اینجا در واقع پوشش می دهد بیش از جداول پایگاه داده فقط رابطه ای است. این همچنین شامل ورق در datastores اکسل، مجموعه در مانگودیبی، انواع سند در کاوچدیبی و ElasticSearch و ... در واقع تمام انواع محل ذخیره که نوشتن عملیات، به جز datastores تک جدول مانند datastores CSV پشتیبانی، پشتیبانی از این قابلیت! عملکرد توسط معرض:
و & quot؛ ایجاد جدول و & quot؛ فعال از طریق منوی راست کلیک طرحواره در درخت در سمت چپ از نرم افزار.
و & quot؛ ایجاد جدول و & quot؛ همچنین از طریق ورودی جدول انتخاب در قطعات مانند وارد به جدول، مراجعه جدول و جدول به روز رسانی را فعال کنید.
و & quot؛ DROP TABLE و & quot؛ فعال از طریق منوی راست کلیک از جداول در درخت در سمت چپ از نرم افزار.
ما در بر قابلیت (اختیاری) مشخص خود را وب سرویس Salesforce.com نقطه پایانی URL اضافه شده است. این اجازه می دهد تا شما را به استفاده DataCleaner برای اتصال به محیط گودال ماسهبازی از Salesforce.com به عنوان به خوبی به نقاط انتهایی سفارشی خود را.
حمایت ElasticSearch است بهبود یافته است، اجازه می دهد تعیین سفارشی و همچنین استفاده مجدد از تعاریف محل ذخیره ElasticSearch در حال حاضر نیز برای جستجو و نمایه سازی.
نمونه گیری از سوابق و انتخاب تکراری بالقوه در عملکرد تشخیص تکراری است بهبود یافته است، که منجر به پیکربندی سریع تر به دلیل تصمیمات اتخاذ شده در طول تمرین نماینده تر است.
فرمت فایل مدل تشخیص تکراری به روز شده است که نیاز به یک فایل جداگانه، مرجع به منظور صرفه جویی تصمیم گیری آموزش گذشته برداشته شده است. سازگاری با فرمت های قدیمی حفظ شده است، اما با استفاده از فرمت جدید مزایای بسیاری برای تجربه کاربر اضافه می کند.
رفع اشکالات:
موضوع موضوع گرسنگی در مانیتور DataCleaner ثابت شد. تاثیر این موضوع بزرگ بود، اما آن را تنها در موارد نادر و بسیار سفارشی اتفاق افتاده است. اگر شنونده سفارشی اشیاء بر روی مانیتور DataCleaner می خطا بزنند، آن را در یک منبع نتیجه هرگز به آزاد بودن و در نظر گرفتن موضوع از استخر کوارتز-برنامه ریزی بر روی سرور. اگر این بسیاری از اوقات اتفاق می افتد سرور در نهایت می تواند از موضوعات که در استخر را اجرا کنید.
منوی عمودی روی صفحه نمایش نتیجه در حال حاضر انجام یک کار مناسب از نمایش برچسب از اجزاء است که نتایج. این باعث می شود آن را آسان تر برای به رسمیت شناختن که نقاط آیتم های منو به چه مورد نتیجه.

چه در نسخه 3.5.5 جدید است:

در "مترادف مراجعه تحول در حال حاضر دارای یک گزینه برای نگاه کردن به هر نشانه ورودی. این بسیار مفید است اگر شما در حال انجام جایگزینی مترادف در مقادیر یک فیلد متنی طولانی است.
مسدود کردن اعدام شغل DataCleaner از طریق وب سرویس مانیتور را برای این می تواند گاهی اوقات با یک اشکال ناشی از موضوع مسدود کردن شکست. این موضوع ثابت شده است.
بهبود در شغل راه ساخته شده بود و دنباله ای از اجزای بسته شده است / پس از اعدام تمیز کردن.
JNLP نسخه / جاوا WebStart از DataCleaner توسط اشکال در جاوا باعث فایل های JAR مشخص نیست به پرتاب WebStart به رسمیت شناخته شود، تحت شرایط خاص قرار گرفت. این مسئله مطرح شده توسط تغییرات جزئی به آن فایل JAR ثابت شده است.
یک لینکدونی مرده چند در اسناد و مدارک ثابت شد.

چه در نسخه 3.5.4 جدید است:

در حال حاضر امکان برای مخفی کردن ستون خروجی تبدیل شده است. پنهان کردن جریان پردازش تاثیر می گذارد نه در همه، اما به سادگی آنها را پنهان از رابط کاربر، و در نتیجه به طور بالقوه ساخت تجربه تمیز تر، در هنگام تعامل با سایر اجزاء.
خدمات وب جدید شده است به برنامه وب نظارت، راه به نظرسنجی از وضعیت اجرای یک کار خاص فراهم می کند که اضافه شده است.
اشکال، ثابت بود و باعث گزارش HTML به انواع تجزیه و تحلیل خاص را شکست زمانی که هیچ ثبتی پردازش شده است.
و 6 اشکال جزئی دیگر adressed شده است.

چه در نسخه 3.5.1 جدید است:

ضبط سوابق تغییر:
فیلتر جدید قادر به پردازش افزایشی از مدارک که قبل از پردازش نشده است اضافه شده است، به عنوان مثال برای پروفایل و یا کپی کردن تنها سوابق تغییر یافتهاست. نام فیلتر های جدید است ضبط تغییر پرونده، با اشاره به مفهوم ضبط تغییر داده است.
اعدام در صف شغل:
مانیتور DataCleaner اکنون اعدام کار مشابه خواهد صف، اگر آن باعث شده است چند بار. این تضمین می کند که شما به طور تصادفی اجرا کار مشابه به صورت همزمان که ممکن است به تمام انواع مسائل منجر شود، بسته به چه کار می کند.
رفع اشکالات جزئی:
چند رفع اشکالات اجرا شد.

چه در نسخه 3.5 جدید است:

چند جادوگران در حال حاضر برای ثبت نام datastores در دسترس است. از جمله فایل آپلود به سرور برای فایل های CSV، ورود اتصال به پایگاه داده، ثبت نام هدایت از اعتبار Salesforce.com و بیشتر.
کار ساخت و ساز جادوگران نیز با ویژگی های پیشرفته گسترش؛ گزیده ای از توزیع مقدار و زمینه الگوی یافتن در ویزارد تجزیه و تحلیل سریع، یک جادوگر کاملا جدید برای ایجاد شغل پاکسازی مشتری EasyDQ و بر اساس یک جادوگر کار جدید برای شلیک شغل Pentaho ادغام داده ها (ادامه مطلب در زیر).
شما هم اکنون می توانید موقت پرس و جو هر محل ذخیره به طور مستقیم در رابط کاربری وب سایت. این باعث می شود آن را آسان به بینش سریع و یا پراکنده را به داده های بدون راه اندازی شغل و یا دیگر روش های مدیریت از پردازش داده.
هنگامی که شغل یا datastores ایجاد می کند، کاربر هدایت به اقدام با هدف تازه ساخته شده. به عنوان مثال، شما به سرعت می توانید اجرای یک کار درست پس از آن ساخته شده است، و یا پرس و جو محل ذخیره پس از آن ثبت شده است.
مدیران هم اکنون می توانید به طور مستقیم شغل به مخزن است که به ویژه مفید است اگر شما می خواهید به دست ویرایش محتوای XML از فایل های کار را بارگذاری کنید.
بسیاری از فایلهای بیهوده فنی در حال حاضر دور به نفع نشان تبادل ساده پنهان است. به عنوان مثال، وقتی که یک کار باعث شده است یک شاخص بارگذاری بزرگ نشان داده شده است، و هنگامی که به پایان رسید نتیجه نشان داده خواهد شد. صفحه نمایش ورود به سیستم پیشرفته که قبلا وجود دارد هنوز هم می تواند بر کلیک کردن بر روی لینک برای جزئیات بیشتر نمایش داده شد است.

چه در نسخه 3.1.2 جدید است:

ما یک وب سرویس در نرم افزار نظارت بر برای گرفتن یک (فهرست) مقادیر متریک اضافه شده است. این باعث می شود نظارت حتی بیشتر قابل استفاده به عنوان یک جزء زیرساخت کلید، به عنوان یک راه برای نظارت بر داده (با کیفیت) و افشای نتایج را به برنامه های شخص ثالث.
وی مراجعه جدول 'بخش شده است با اضافه کردن ملحق معناشناسی به عنوان یک ویژگی قابل تنظیم بهبود یافته است. با استفاده از معناشناسی عضویت شما می توانید نیشگون گرفتن و کشیدن اگر شما می خواهید مراجعه به کار معنایی مانند LEFT JOIN یا INNER JOIN.
اجزای EasyDQ روز رسانی شده است، اضافه کردن گزینه تنظیمات بیشتر و رابط نتیجه deduplication را غنی تر است.
بهبود عملکرد تمرکز خاص از این نسخه بوده است. بهبود در موتور DataCleaner به استفاده بیشتر از روش پردازش جریان در موارد گوشه خاص بود که قبلا پوشش داده نمی شده است.

چه در نسخه 3.1.1 جدید است:

تاریخ و زمان مربوط به گزینه های تجزیه و تحلیل گسترش یافته، اضافه کردن تجزیه و تحلیل توزیع برای شماره های هفته، ماه و سال. همه تجزیه و تحلیل مربوط به تاریخ و زمان در حال حاضر در منوها به نام و & quot گروه بندی می شوند. تاریخ و زمان و & quot؛ زیر & quot؛ و & quot ؛. تجزیه و تحلیل
اختیاری و & quot؛ آمار توصیفی و & quot؛ گزینه شده است به تجزیه و تحلیل تعداد و تجزیه و تحلیل تاریخ / زمان اضافه شده است. این گزینه اضافه می کند معیارهای اضافی را به نتایج حاصل از این تجزیه و تحلیل، مانند ماد، چولگی، کشیدگی درصد و. این معیارهای اختیاری هستند از حافظه خود را تا حدودی بزرگتر از معیارهای موجود.
خطوط در نمودار جدول زمانی از برنامه های تحت وب در حال حاضر نظارت بر نقطه های کوچک در آنها است. این امر به ویژه برای نمودار مفید با برخی از مشاهدات (و یا حتی تنها یک) در آنها - به این نکته اشاره دقیقا همان جایی که نقاط مشاهده هستند.
پارسر جستجوهای وقتی استناد موقت نمایش داده شد نیز قابل ملاحظه بهبود یافته است. در حال حاضر نمایش داده شد می تواند شامل بند مجزا، * -wildcards، زیر استعلام و مقاوم در برابر خطا نسبت به مسائل مربوط به متن مورد.
دو ترانسفورماتور جدید برای تولید UUIDs و برچسب زمانی تولید اضافه شده است.

چه در نسخه 3.1 جدید است:

فرمول متری - شرح و بسط کیفیت KPI ها داده:
در حال حاضر امکان به ساخت بسیار بیشتر توضیح کیفیت KPI ها داده ها در برنامه های تحت وب نظارت DataCleaner است. رابط کاربری اجازه می دهد تا شما را به ساخت فرمول های پیچیده را در یک سبک فرمول گسترده مانند؛ با استفاده از متغیرهای جمع آوری شده توسط مشاغل DataCleaner.
فرمول متریک می توانید هر تعداد از معیارهای، ثابت و عملیات ترکیب، تا زمانی که می توان آن را در یک معادله ریاضی بیان شده است.
به عنوان مثال - اندازه گیری میزان رکوردهای تکراری در درصدی از تعداد کل رکورد ها. و یا اندازه گیری مقدار کد محصول که به مجموعه ای از الگوهای رشته های متعدد مطابقت داشته باشد.
موقت پرس و جو - از هر محل ذخیره:
با DataCleaner 3.1 شما هم اکنون می توانید موقت نمایش داده شد به هر محل ذخیره! نمایش داده شد را می توان در SQL ساده بیان خواهد شد و به پایگاه داده و همچنین فایل های، پایگاه داده های NoSQL و بیشتر اعمال می شود، ارائه یک مکانیزم جستجوهای واقعا مفید به گسترش به کشف و پروفایل داده تجربه کنید.
گزینه پرس و جو از طریق یک سرویس وب برای نظارت بر کاربران با نقش مدیریت در دسترس است. پرس و جو به عنوان یک پارامتر HTTP و یا بدن POST ارائه شده، و در نتیجه به عنوان یک جدول XHTML ارائه شده است.
ارزش تطبیق - یک گزینه تجزیه و تحلیل جدید:
اغلب اوقات شما یک ایده شرکت که ارزش باید اجازه داده شود و انتظار می رود برای یک زمینه خاص است. در DataCleaner وجود دارد همیشه گزینه تجزیه و تحلیل ارزش توزیع که به شما کمک مفروضات خود را ادعا شده است. در DataCleaner 3.1 هر چند، شما یک ارائه دقیق تر - تطبیق ارزش. این گزینه تجزیه و تحلیل اجازه می دهد تا به شما برای مشخص مجموعه ای از ارزش مورد انتظار و پس از آن انجام توزیع مقدار مانند تجزیه و تحلیل، به طور خاص به اعتبار و شناسایی ارزش های غیر منتظره.
کپی، حذف و مدیریت شغل:
مدیریت شغل و نتایج در نرم افزار مانیتور DataCleaner تا حد زیادی بهبود یافته است. شما هم اکنون می توانید با کلیک بر روی یک کار در صفحه برنامه ریزی مانیتور، و پیدا کردن گزینه های مدیریت موجود برای عملیات مانند تغییر نام، کپی، حذف و بیشتر. هر یک از عملیات احترام می گذارد ارتباط به دیگر آثار مکشوفه در مانیتور، مانند نتایج تجزیه و تحلیل، برنامه و بیشتر. این به این معنی است که مدیریت مخزن نظارت تبدیل شده است خیلی آسان تر و بالغ.
مدیریت سابقه کیفیت داده:
گاهی اوقات شما شرایطی که در آن شما در واقع می خواهید به انجام نظارت با داده های تاریخی مواجه هستیم! این ممکن است که شما باید کیسه تاریخی یا پشتیبان گیری از پایگاه داده ها، که شما می خواهید برای نشان دادن و داستان است. شما هم اکنون می توانید انجام تجزیه و تحلیل این داده های تاریخی، آن را به مانیتور DataCleaner، و با استفاده از یک وب سرویس جدید، مجموعه ای از یک داده های تاریخی از که نتیجه تجزیه و تحلیل خاص است. این به این معنی است که جدول زمانی خود را به درستی خواهد رسم نتایج با استفاده از تاریخ در نظر گرفته خود را، اما با نتایج که شما شاید در یک نقطه بعد در زمان جمع آوری کرده ایم.
حمایت زمانبندی خوشه (EE تنها):
زمانبند مانیتور DataCleaner است بیرونی شده است، به طوری که می توان آن را با استفاده از پیکربندی ساده جایگزین شده است. در نسخه Enterprise (EE) از DataCleaner، ما شما را زمانبندی خوشه، ارائه توانایی به تعادل بار و توزیع اعدام خود را در سراسر مجموعه ای از ماشین آلات.
تک signon (SSO) با استفاده از CAS (EE تنها):
در نسخه Enterprise (EE) از DataCleaner ما در حال حاضر یک گزینه تک signon برای استفاده مانیتور فراهم می کند. حالا DataCleaner می تواند بخشی لاینفک از زیرساخت های فناوری خود را نیز به امنیت و حکیم است.
... و خیلی بیشتر:
در بالا فقط خلاصه است. بیش از سی مسائل در این نسخه حل شده است. ما درخواست های مختلف که از انجمن ها و جامعه را حل کرده اند، و ما همه را تشویق به استفاده از این رسانه به عنوان ابزاری برای تغییر است. ما بسیار خوشحال به توسعه DataCleaner به شدت توسط جریان در جامعه را تحت تاثیر قرار است.

چه در نسخه 3.0.3 جدید است:

می افزاید: یک سرویس برای تغییر نام شغل در مخزن نظارت.
شما می توانید این به عنوان یک سرویس وب آرام و یا تعاملی در UI دسترسی داشته باشید.
یک وب سرویس برای تغییر تاریخ تاریخی از نتیجه تجزیه و تحلیل در مخزن نظارت اضافه شده است.
نرم افزار وب سایت است سازگار با ظروف میراث JSF ساخته شده است.
ذخیره سازی از پیکربندی در نرم افزار وب سایت تا حد زیادی بهبود یافته بود، منجر به بار بار صفحه و مقدار دهی اولیه کار را سریعتر.

چه در نسخه 3.0.2 جدید است:

هنگام راه اندازی یک شغل در برنامه های تحت وب نظارت، پنل خودکار تازه هر ثانیه برای دریافت آخرین دولت از اعدام.
datastores مبتنی بر فایل (مانند CSV و یا صفحات گسترده اکسل) با مسیرهای مطلق حال حاضر به درستی در برنامه نظارت بر وب حل شود.
بخش & quot؛ انتخاب از کلید / نقشه ارزش و & quot؛ ترانسفورماتور در حال حاضر عبارت را انتخاب کنید تو در تو مانند، & quot از؛ Address.Street و & quot؛ یا & quot؛ انتظام [0] .product.name و & quot ؛.
مکانیسم جدول مراجعه برای عملکرد بهینه سازی شده است، با استفاده از اظهارات آماده که در حال اجرا در پایگاه های داده JDBC.
Datastores و & quot؛ مدیران هم اکنون می توانید از دانلود ها & quot datastores مبتنی بر فایل به طور مستقیم. صفحه
پردازش استثنا در نرم افزار مانیتورینگ وب است بهبود یافته است کمی، و پیام های خطا دقیق تر و بصری.

چه در نسخه 3.0.1 جدید است:

در رفع اولیه در این نسخه در مورد بازگرداندن نقشه برداری از ستون ها و طبقه بندی شمارش خاص بود. به عنوان مثال در تجزیه و تحلیل کامل جدید، ما متوجه شدیم که بعد از بارگیری مجدد یک کار را نجات داد، نقشه برداری همیشه درست نیست.
علاوه بر این چند پیشرفت های داخلی ساخته شده است، و آن را آسان تر برای استقرار برنامه وب مانیتور DataCleaner در محیط با استفاده از چارچوب Spring.
تاریخ و زمان آخرین اما نه کم، تنظیمات تجسم در نرم افزار دسکتاپ بهبود یافته است به طور خودکار در نظر گرفتن نگاه کار بودن را تجسم و روشن نمی مصنوعات بر اساس اندازه صفحه نمایش و میزان جزئیات مورد نیاز برای آن را نشان می دهد به خوبی نمایش داده شود.

چه در نسخه 3.0 جدید است:

نمایش جدول زمانی و روند معیارهای کیفیت داده
مخزن متمرکز برای مدیریت و حاوی شغل، نتایج، جدول زمانی و غیره
برنامه ریزی و حسابرسی شغل DataCleaner
ارائه خدمات وب برای فراخوانی تحولات DataCleaner
امنیت و چند اجاره
هشدارها و اطلاعیه زمانی که معیارهای کیفیت داده از محدوده آسایش انتظار خود هستند.
یک تجزیه و تحلیل کامل جدید است که برای سادگی شناسایی مدارک که باید زمینه های ناقص بسیار مفید است.
شما هم اکنون می توانید نتایج DataCleaner به خوب، به دنبال HTML گزارش می دهد که شما می توانید به مدیر خود را، و یا ارسال به تجزیه کننده XML خود را!
محیط زیست نظارت جدید نیز از نزدیک با نرم افزار دسکتاپ یکپارچه شده است. بنابراین، نرم افزار دسکتاپ در حال حاضر توانایی به انتشار شغل و نتایج به مخزن مانیتور، و به عنوان یک ویرایشگر تعاملی برای محتوا در حال حاضر در مخزن استفاده می شود.
جدید تحولات تاریخ گرا حال حاضر در دسترس: فیلتر کردن محدوده تاریخ، که اجازه می دهد تا شما را به زیر مجموعه مجموعه داده بر اساس محدوده تاریخ، و تاریخ فرمت، که اجازه می دهد تا به فرمت تاریخ با استفاده از ماسک تاریخ.
عبارت منظم تجزیه کننده (که از طریق ExtensionSwap قبلا تنها در دسترس بود) در حال حاضر در DataCleaner گنجانده شده است. این باعث می شود آن را بسیار مناسب برای تجزیه و استاندارد زمینه متن غنی با استفاده از عبارات منظم.
یک متن ترانسفورماتور مورد جدید در دسترس وجود دارد. با این تحول شما به راحتی می توانید بین بالا / حروف و سرمایه مناسب از جملات و کلمات تبدیل کنید.
دو جستجوی جدید / جایگزین تحولات اضافه شده است: جستجوی ساده / جایگزین و عبارت منظم جستجو / جایگزین.
تجربه کاربر از نرم افزار دسکتاپ بهبود یافته است. ما چندین پیام در برنامه کمک اضافه شده است، ساخته شده است که رنگ های روشن تر نگاه کنید و واضح تر و بهبود مدیریت فونت.

چه در نسخه 2.5.2 جدید است:

پشتیبانی آپاچی کاوچدیبی:
ما برای حمایت از پایگاه داده های NoSQL آپاچی کاوچدیبی اضافه شده است. DataCleaner پشتیبانی از هر دو خواندن از، تجزیه و تحلیل و نوشتن به موارد کاوچدیبی خود را.
نویسنده جدول به روز رسانی:
پس از تلاشهای قبلی ما را به ویژگی های ETLightweight سبک به DataCleaner، ما یک نویسنده که به روز رسانی رکوردهای یک جدول اضافه شده است. شما می توانید این به عنوان مثال برای وارد کردن و یا به روز رسانی پرونده بر اساس شرایط خاص استفاده کنید.
مانند قرار دادن به نویسنده جدول، DataCleaner به روز رسانی جدول نویسنده جدید به پایگاه داده مبتنی بر SQL محدود نیست، اما هر نوع محل ذخیره است که پشتیبانی از نوشتن (در حال حاضر پایگاه داده های رابطه، فایل های CSV، صفحات گسترده اکسل، پایگاه داده مانگودیبی و دیتابیس های mongodb)، اما معانی همان است که با بیانیه روز رسانی جدول سنتی در SQL می باشد.
مته به جزئیات اطلاعات ذخیره شده در فایل های نتیجه:
هنگام استفاده از ویژگی های نجات نتیجه DataCleaner 2.5، برخی از کاربران تجربه که اطلاعات مته به جزئیات خود را از دست شد. در DataCleaner 2.5.2 ما در حال حاضر نیز این اطلاعات را باقی بماند، ساخت آرشیوهای DQ شما بسیار با ارزش تر در هنگام بررسی حوادث داده های تاریخی.
بهبود EasyDQ رفع خطا:
اجزای EasyDQ از لحاظ رفع خطا بهبود یافته است. اگر یک مسئله شبکه در حال حاضر رخ می دهد و یا موضوع مشابه دیگر باعث ایجاد پرونده به شکست، اجزای EasyDQ در حال حاضر به آرامی بهبود می یابند و از همه مهمتر - کار دسته ای خود را حتی به رغم اشتباهات پیروز خواهد شد.
نقشه برداری جدول برای datastores های NoSQL:
از آنجا که کاوچدیبی و مانگودیبی هستند جدول مبتنی نیست، بلکه یک ساختار پویا تر ما با ارائه دو روش به کار با آنها: به طور پیش فرض است، که به شما اجازه DataCleaner شناسائیخودکار ساختار جدول و پیشرفته است که اجازه می دهد تا شما به صورت دستی مشخص ساختار جدول مورد نظر خود را . پیش از این گزینه های پیشرفته از طریق پیکربندی XML تنها در دسترس بود، اما در حال حاضر رابط کاربری شامل تبادل مناسب برای انجام این کار به طور مستقیم در نرم افزار.

پیشرفت از ویژگی های:

چه در نسخه 2.4.1 جدید است:
ویژگی های دسته ای در حال بارگذاری ما تا حد زیادی هنگام نوشتن داده ها به جداول پایگاه داده بهبود یافته است. انتظار برای دیدن بسیاری از دستورات بهبود قدر اینجا.
نوشتن به داده شده است راحت تر در دسترس با اضافه کردن گزینه به منوی پنجره ساخته شده است.
شما هم اکنون می توانید به راحتی اجزای یک کار تغییر نام با دوبار کلیک کردن زبانه خود.
ترانسفورماتور جاوا اسکریپت در حال حاضر رنگ آمیزی نحو، به طوری که کد جاوا اسکریپت خود را راحت تر به بازرسی و تغییر دهید.
رفع اشکالات:
هنگام خواندن از و نوشتن به محل ذخیره همان (به عنوان مثال DataCleaner منطقه ی عملیاتی) ما مطمئن هستیم که کش جدول که محل ذخیره تجدید ساخته شده است. قبلا برخی از حالات به شما اجازه مشاهده یک نمای خارج از تاریخ از جداول.
بن بست بالقوه هنگام راه اندازی برنامه حل شد. این بن بست یک نتیجه از یک موضوع در JVM بود، اما ما در اطراف آن با هماهنگ سازی تمام تماسها به API خاص در جاوا کار کرده است.

چه در نسخه 2.4 جدید است:

را کپی تشخیص است که به رایگان استفاده کنید تا 500،000 ارزش (با نام مستعار حذف رکوردهای تکراری و یا فازی تطبیق سوابق.).
نشانی اعتبار سنجی داده ها و پاکسازی. این اجازه می دهد تا به شما برای بررسی اگر آدرس وجود داشته باشد، اگر آنها به درستی فرمت شده و حتی به پیشنهاد اصلاحات در مورد شما اشتباه می کنند.
نام و نام خانوادگی اعتبار سنجی داده ها و پاکسازی. با خدمات نام و نام خانوادگی، EasyDQ نه تنها نام خود را فرمت به طور مداوم، بلکه برای غلط املائی چک و تفسیر قطعات نام.
ایمیل و اعتبار تلفن و پاکسازی. این خدمات با چک کردن ایمیل و تلفن داده، مطمئن شوید که دامنه های ایمیل وجود داشته باشد، که کدهای کشور صحیح و خیلی بیشتر است.

چه در نسخه 2.3 جدید است:

پشتیبانی داده های بین المللی:
اگر شما در حال کار با داده های بین المللی، و سپس شما ممکن مجموعه کاراکتر های مختلف در داده های خود را، برای مثال چینی یا عبری است. ما شخصیت مجموعه ای از تجزیه و تحلیل توزیع است، که یک گزینه پروفایل که به شما امکان کشف کردن که مجموعه کاراکتر در داده های خود استفاده می شود اضافه شده است.
کار با داده های حاوی مجموعه کاراکتر های مختلف می تواند مشکل ساز باشد. با استفاده از ترانسفورماتور بحرف جدید شما هم اکنون می توانید رشته از سیستم های نوشتن های مختلف به کاراکتر های لاتین است بحرف.
همچنین یک تظاهرات پخش جدید وجود دارد، با تمرکز بر قابلیت داده های بین المللی از DataCleaner 2.3 در بخش اسناد و مدارک است.
گروه بندی نتایج تجزیه و تحلیل توسط یک ستون ثانویه:
تجزیه و تحلیل الگوی حال حاضر قادر به الگوهای گروه بر اساس یک ستون ثانویه. این برای تجزیه و تحلیل مانند مفید است:
مطلع الگوهای از شماره تلفن، گروه بندی توسط کشور است.
مطلع الگوهای نام کاربری ایمیل بر اساس دامنه ایمیل.
چیزی مشابه نیز برای تجزیه و تحلیل ارزش توزیع انجام شده است. این اجازه می دهد تا برای تجزیه و تحلیل از قبیل:
همه نام شهرستان متمایز، که توسط کد پستی گروه بندی می شوند؟
توزیع جنسیتی در انواع مشتری خاص چیست؟
نمودار بهبود:
نتایج الگو یاب هم اکنون می توانید در یک نمودار نشان داده شود. این باعث می شود توزیع قابل مشاهده است و نشان می دهد که چه مقدار از یک & quot؛ طولانی دم و & quot؛ از الگوهای است.
خروجی از تجزیه و تحلیل توزیع ارزش شده است در چند مناطق بهبود یافته:
خوانایی از چارت بهبود یافته است.
تعداد مقادیر مختلف است که در ردیف وجود دارد: این تعداد کل ردیف و تعداد متمایز بیش از این ردیف را نشان می دهد. این کمک می کند تا در بدانند که چگونه اغلب مقادیر تکراری وجود داشته باشد.
اگر رشته خالی وجود دارد، ما با استفاده از کلمه کلیدی برای آن، به طوری که آن را آسان تر این است که آنها را تشخیص دهد.
خروجی:
بعد به فرمت های در حال حاضر موجود خروجی (فایل های CSV و datastores H2) ما اضافه شده نوشتن خروجی به صفحات گسترده اکسل.
پس از نوشتن به محل ذخیره، آن است که در حال حاضر امکان پیش نمایش خروجی، به طوری که شما می توانید بررسی کنید که آیا خروجی با توجه به انتظارات شما است.
در حال حاضر نیز امکان برای اضافه کردن خروجی به عنوان محل ذخیره جدید، به طوری که می توان آن را به عنوان ورودی برای یک کار جدید استفاده می شود.
دیگر پیشرفت:
مستندات شده است به طور کلی بهبود یافته است. به طور خاص، ورود به سیستم و رابط خط فرمان توصیف اضافه شده است.
مکانیسم توسعه شده است ماژولار چند قطعه از نرم افزار و معرفی گوگل Guice به عنوان یک چارچوب تزریق وابستگی طور کلی در دسترس برای توسعه دهندگان افزونه بهبود یافته است.
و البته ما بیش از بیست بهبود و رفع اشکال کوچک است.

چه در نسخه 2.2 جدید است:

راننده اصلی برای این نسخه است یک داستان در مورد توسعه بوده است. هنگام انتشار این نرم افزار است ما simultaniously انتشار یک وب سایت یک DataCleaner جدید که ویژگی های یک منطقه مهم جدید: ExtensionSwap. ایده از این ExtensionSwap است که اجازه به اشتراک گذاری از پسوند به DataCleaner و نصب و راه اندازی به سادگی با کلیک یک دکمه در مرورگر!
گسترش API DataCleaner تا به بسیاری بهبود یافته است در این نسخه، و آن را ممکن است برای ایجاد ترانسفورماتور خود، تجزیه و تحلیل و فیلترهای خود را. اگر شما احساس می افزودنی خود را می تواند مورد توجه را به کاربران دیگر، لطفا آن را به اشتراک در ExtensionSwap و ما ارائه یک کانال را برای شما به راحتی آن را به هزاران نفر از کاربران توزیع کنید. از API فرمت و ExtensionSwap است که بیشتر در تظاهرات پخش جدید ما برای توسعه دهندگان و کارشناسان فن آوری های دیگر با توجه به توضیح داده شده.
ما همچنین آزاد مجموعه ای از افزونه های اولیه در ExtensionSwap ها: HIquality اطلاعات تماس برای ساخت DataCleaner فراهم می کند که نام پیشرفته، تلفن و ایمیل پاک کننده، بر اساس استنباط بشر زبان طبیعی خدمات وب پردازش DQ. ما همچنین حمل و نقل پسوند نمونه که به عنوان مثال برای توسعه دهندگان مایل به سعی کنید از توسعه پسوند خود خدمت می کنند. در ماه های آینده ما مطمئن شوید برای ارسال پسوند حتی بیشتر نشات گرفته از نمونه کارها داخلی ما از ابزار است که ما در تیم جمع آوری دانش استنتاج بشر استفاده کنید.
علاوه بر توسعه ما نیز در embeddability تمرکز. ما می خواهم که قادر به جاسازی DataCleaner راحتی به برنامه های دیگر را به پروفایل و تجزیه و تحلیل داده ها ممکن است در هر نقطه! ما یک API بوت جدید که اجازه می دهد تا برنامه های کاربردی به بسته نرم افزاری DataCleaner و راه انداز آن را با یک پیکربندی پویا و یا اجرای آن را در یک & quot ایجاد کرده اید؛ حالت محل ذخیره واحد و & quot ؛، که در آن نرم افزار است که به سمت فقط بازرسی یک محل ذخیره واحد تنظیم (معمولا توسط نرم افزار تعریف شده که تعبیه DataCleaner). ما در حال حاضر برخی از موارد واقعا جالب تعبیه DataCleaner در آثار - هر دو در دیگر برنامه های متن باز و همچنین برنامه های کاربردی تجاری.
ما برای حمایت از تجزیه و تحلیل مجموعه داده های SAS اضافه شده است. این چیزی است که ما بسیار افتخار از ما، دانش ما، اولین نرم افزار عمده منبع باز برای ارائه چنین قابلیت، در نهایت آزادسازی بسیاری از کاربران SAS هستید است. بخش قابلیت همکاری SAS به عنوان یک پروژه جداگانه، SassyReader ایجاد شد، بنابراین ما انتظار داریم تا تصویب در جوامع منبع باز تعریف DataCleaner به زودی بیش از حد!
ثابت فایل های با عرض: ما همچنین پشتیبانی برای نوع دیگری از محل ذخیره اضافه شده است. فایل ثابت عرض فایل های متنی که در آن هر ستون دارای پهنای ثابت می باشد. هیچ جداکننده و یا نقل قول شخصیت، مانند فایل های CSV وجود دارد، به جای هر خط در طول برابر هستند و هر خط خواهد شد با توجه به مجموعه ای از طول ارزش token ها.
یک گزینه به & quot؛ شکست در تناقضات و & quot؛ به فایل CSV و ثابت datastores فایل عرض اضافه شده است. این پرچم اضافه کردن چک فرمت یکپارچگی هنگام استفاده از این datastores فایل متنی است.
اشکال، ثابت شد که باعث تنظیمات CSV جدا در رابط کاربر، حفظ نمی شود در هنگام ویرایش یک محل ذخیره CSV.
ژاپنی و دیگر شخصیت ها در رابط کاربری پشتیبانی نمی شود. این و & quot؛ اشکال و & quot؛ یک ماده از بررسی فونت های موجود بر روی سیستم و انتخاب یک فونت است که می تواند شخصیت های خاص ارائه شده است. در اکثر سیستم های مدرن وجود خواهد فونت قادر دسترس است، اما در برخی از شاخه های یونیکس / لینوکس وجود دارد هنوز هم ممکن است محدودیت باشد.
بخش اسناد و مدارک به روز شده است! از زمان اولیه 2.0 انتشار اسناد و مدارک به مراتب پشت بوده است، اما ما در نهایت موفق به آن را دریافت به روز است. هنوز تکه های گم شده در اسناد وجود دارد، اما قطعا باید برای استفاده اساسی و همچنین به عنوان یک مرجع برای اکثر موضوعات مفید باشد.
زمان راه اندازی نرم افزار توسط مواز بارگذاری پیکربندی و با به تأخیر انداختن مقدار دهی اولیه از آن قسمت از پیکربندی هستند که برای نمایش پنجره اولیه مورد نیاز نیست بهبود یافته است.
تجزیه و تحلیل شباهت یاب آوایی از توزیع اصلی حذف شده است، به عنوان این کاملا تجربی بود و بیشتر به عنوان یک اثبات مفهوم و اشتها آور به جامعه برای ایجاد تجزیه و تحلیل تطبیق پیشرفته تر عمل می کند. شما هم اکنون می توانید پیدا کردن و نصب یاب شباهت آوایی در ExtensionSwap.
لغو و یا دست زدن به errornous کار بهبود یافته و رابط کاربر پاسخ صحیح تر با غیر فعال کردن دکمه ها و شاخص های پیشرفت، اگر یک کار را متوقف کرده است.
ثابت چند مسائل جزئی UI مربوط به اندازه جدول و استفاده از پیمایش.

پیشرفت:

چه در نسخه 2.1.1 جدید است:
اضافه شدن یک رشته متن جستجو / فیلتر در فهرست datastores. این شما را قادر به سرعت پیدا کردن محل ذخیره خود را اگر شما datastores بیش از دسترس بر روی صفحه نمایش ثبت نام کرده اند.
داده های مرجع برای کدهای کشور به توزیع استاندارد اضافه شده است، به لطف به گراهام ریند برای ارائه این.
اضافه شدن یک نوار اسکرول افقی به داده پیش نمایش پنجره ها از بیش از 10 ستون وجود دارد.
امکان اضافه کردن یک بسته توسعه با قابلیت های جدید در گفتگوی گزینه در زمان اجرا. بیشتر تمرکز بر روی برنامه های افزودنی در نسخه های آینده به دنبال خواهد داشت.
ما یک پیش نمایش اولیه خط فرمان ما رابط (CLI) اجازه می دهد شما به استناد برنامه با در معرض ام و & quot؛ طریقه استفاده و & quot؛ پارامتر که گزینه های CLI را نشان می دهد.
اضافه شده شماره گزینه های قالب بندی به & quot؛ را تبدیل به شماره و & quot؛ تبدیل کننده.
رفع اشکالات:
ثابت است که شماره های خارج از حافظه زمانی که پرس و جو جداول با بسیاری از ستون (150+).
ثابت است که شماره که باعث و & quot؛ تجزیه و تحلیل محدود و & quot؛ جعبه چک به درستی بررسی نشده می شود زمانی که یک کار دوباره باز شد پس از صرفه جویی.
نه واقعا یک BUGFIX آن را به عنوان هرگز از ویژگی های رسمی، اما در حال حاضر ما از بازگرداندن تنظیمات کاربر (فایل userpreferences.dat) از نسخه های قبلی DataCleaner.

چه در نسخه 2.1 جدید است:

بود مقدار زیادی از کار انجام شده در رابط کاربری (صفحه رسانه را ببینید) وجود دارد:
ما تصمیم به حذف پنجره سمت چپ حاوی گزینه های پیکربندی محیط زیست است.
به جای همه این گزینه در حال حاضر به پنجره ساختمان کار منتقل شده است به طوری که کاربر تنها به تمرکز بر روی یک پنجره برای تمام فعل و انفعالات مورد نیاز برای ساخت یک کار.
گفت و گو خوش آمدید / ورود نیز به نفع یک پنل گسسته است که می تواند در کشیده و یا پنهان از پنجره اصلی حذف شده است.
انتخاب محل ذخیره و مدیریت در نظر گرفته است فعالیت برای اولین بار در این برنامه، که به همین دلیل آن را نیز اولین گام برای رسیدگی در پنجره اصلی.
شما هم اکنون می توانید متوقف شغل در مورد شما تصمیم به تغییر چیزی قبل از آن انجام شده است.
نوار و نمودار خط به بسیاری از صفحه نمایش نتیجه تجزیه و تحلیل، از جمله تجزیه و تحلیل رشته، تجزیه و تحلیل شماره، تاریخ / تجزیه و تحلیل زمان و توزیع روز هفته (صفحه رسانه را ببینید) اضافه شد.
همه & quot؛ داده های پیش نمایش و & quot؛ ویندوز در حال حاضر حاوی کنترل های صفحه بندی، بنابراین شما می توانید به عقب و جلو در مجموعه داده ها حرکت می کند.
اکثر رانندگان پایگاه داده مشترک (خروجی، PostgreSQL، اوراکل، MS SQL سرور و Sybase) به مجموعه ای به طور پیش فرض از رانندگان اضافه شده است.
پیکربندی از تابع تجزیه و تحلیل سریع در گفتگوی گزینه.
رفع اشکالات مختلف جزئی.
ترانسفورماتور برای استخراج قطعات تاریخ (سال، ماه، روز و غیره) از ستون تاریخ.

چه در نسخه 2.0.2 جدید است:

تب ها و دکمه در میز کار از کار افتاده است زمانی که هیچ ستون منبع انتخاب شده اند.
منبع و & quot؛ ویجت های خاص به گروه & quot اضافه شده است. تب، و آن را بسیار آسان به درخواست نمونه بر اساس تعداد ردیف از داده های ورودی.
در صورت امکان، فیلتر در حال حاضر توانایی برای بهینه سازی پرس و جو از یک کار (با نام مستعار. فشار پایین بهینه سازی). این برای اجرا گردید، و & quot؛ حداکثر ردیف و & quot ؛، & quot؛ را برابر و & quot؛ و & quot؛ تهی نیست و & quot؛ فیلتر.
مقدار رو به رشد ترانسفورماتور باعث یک لیست طولانی در & quot؛ افزودن ترانسفورماتور و & quot؛ پنجره. بنابراین ترانسفورماتور در حال حاضر توسط دسته گروه بندی شده و نمایش داده درآمده است.
تصویر سازی از جریان اعدام در حال حاضر اجازه می دهد تا از بین بردن موارد ستون و اقلام نتیجه فیلتر، ساخت نمودار فهم تر، به ویژه برای شغل بسیار بزرگ است.
بخش & quot؛ یکی شدن رشته ها & quot؛ ترانسفورماتور در حال حاضر یک & quot؛ رشته خالی به عنوان پوچ و & quot در نظر بگیرید. پرچم، است که به ویژه زمانی مفید است که با فایل های CSV.
لغت نامه های مبتنی بر متن و کاتالوگ مترادف خواهد شد ارزش ذخیره سازی خود را برافروخته، در صورتی که فایل آنها را از تغییرات به عنوان خوانده شده.
بخش & quot؛ تبدیل به تاریخ و & quot؛ ترانسفورماتور در حال حاضر شامل توانایی برای مشخص ماسک تاریخ خود را، اگر رشته تاریخ آن نیاز دارد.
یک اشکال که عبور مقادیر null به standardizer ایمیل ثابت شد.








تصاویر

datacleaner-315902_1_315902.png
datacleaner-315902_2_315902.png
datacleaner-315902_3_315902.png

نرم افزار های مشابه

MyFSys
MyFSys

11 May 15

Qore Tibae Module
Qore Tibae Module

20 Feb 15

mongoctl
mongoctl

20 Feb 15

نرم افزار های دیگر از توسعه دهنده -

Stellarium
Stellarium

17 Aug 18

Vala
Vala

16 Aug 18

Poppler
Poppler

11 Mar 16

Particle Text
Particle Text

30 Oct 15

نظرات به DataCleaner

نظر یافت نشد
اضافه کردن نظر
روشن کردن تصاویر!