در این است که اساسا یک کتابخانه پایتون برای نگاشتکاهش نوشته شده در Cython
ویژگی ها:.
در رابط مشابه به عنوان API Hadoop (الگوهای طراحی قابل استفاده بین رابط های پایتون / جاوا)
سازگاری عمومی با dumbo به کاربران اجازه تغییر دهید به جلو و عقب
قابل استفاده در خوشه Hadoop بدون پایتون و یا دسترسی مدیر
تبدیل سریع و پردازش
اقامت و کارهای کوچک و به خوبی مستند
شفاف با چه می گذرد می باشد
دسته برنامه ها با. پس پیچیده است، ctypes، و الحاقات
کد نوشته شده برای هک-توانایی
دسترسی ساده HDFS (به عنوان مثال، خواندن، نوشتن، LS)
پشتیبانی (و تکرار نیست) اکوسیستم Hadoop بیشتر (به عنوان مثال، Oozie، غژغژ کردن)
خودکار موازی کار 'خودکار oozie' موجود در پروژه جریان hadoopy (حفظ از شاخه)
اعدام محلی از کار نگاشتکاهش اصلاح نشده با launch_local
خواندن فایل های / نوشتن از TypedBytes به طور مستقیم به HDFS از پایتون (readtb، writetb)
اجازه می دهد تا چاپ را به stdout و stderr در وظایف Hadoop بدون ایجاد مشکلات (با استفاده از روش "لوله رقص، هر دو در دسترس در stderr کار هستند)
کار بر روی خوشه و بدون هر گونه نصب و راه اندازی اضافی، پایتون، و یا هر کتابخانه پایتون (با استفاده از Pyinstaller است که در این درخت منبع شامل)
کار بر روی OS X
مسیر بحرانی در Cython است
دسترسی HDFS ساده (readtb و LS) در داخل پایتون، حتی شغل در داخل در حال اجرا
رابط تست واحد
گزارش با استفاده از موقعیت و شمارنده (و چاپ اظهارات! بدون نیاز به آنها در Hadoopy ترسم شود)
پشتیبانی از الگوهای طراحی در لین و دایر کتاب
پشتیبانی Typedbytes (بسیار سریع)
پشتیبانی Oozie
در مورد نیاز:
Cython 0.13 یا بالاتر
نظر یافت نشد