آپاچی پارکت یک "ستونی" فرمت ذخیره سازی داده که به طور خاص برای خانواده آپاچی Hadoop پروژه ایجاد شده است.
در پارکت توصیه می شود برای با داده های بزرگ استفاده می شود، عمدتا به دلیل آن استفاده از یک سیستم فشرده سازی داده های پیچیده، با تکیه بر مجموعه ای از الگوریتم رکورد ریز و دوباره مونتاژ بهینه شده است.
داده
این اجازه می دهد تا به پایین شکسته شود، سازمان یافته در یک فرمت تو در تو، و دوباره بهم وصل هر زمان که تردید است.
در فرمت پارکت نیز می تواند در خارج از اکوسیستم هادوپ استفاده می شود، که به طور خاص طراحی شده است که به عنوان اگنوستیک که ممکن است، کار با هر نوع مدل ذخیره سازی چارچوب پردازش داده ها و داده ها.
چه در این نسخه جدید است:
تغییر نام بسته و MAVEN مختصات به org.apache
اضافه کردن آمار پشتیبانی می کند به ColumnMetaData
API صرفه جویی جریان
انواع جدید منطقی
چه در نسخه 2.3.0 جدید است:
تغییر نام بسته و MAVEN مختصات به org.apache
اضافه کردن آمار پشتیبانی می کند به ColumnMetaData
API صرفه جویی جریان
انواع جدید منطقی
محدودیت ها:
این پروژه هنوز در حال توسعه در مخزن آپاچی رشد و ممکن است به شدت از نسخه به نسخه تغییر دهید.
نظر یافت نشد