Apache Hive

نرم افزار تصویر:
Apache Hive
جزئیات نرم افزار:
نسخه: 1.2.1 به روز شده
ها تاریخ: 21 Jul 15
توسعه دهنده: Apache Software Foundation
پروانه: رایگان
محبوبیت: 30

Rating: nan/5 (Total Votes: 0)

در آپاچی کندو اول به عنوان یک زیر پروژه آپاچی Hadoop برای ارائه مدیران از Hadoop با آسان برای استفاده، زبان پرس و جو ماهر برای داده های خود را توسعه داده شد.
به این دلیل، کندو از آغاز توسعه داده شد برای کار با مقدار بسیار عظیمی از اطلاعات را برای هر پرس و جو و کاملا برای پایگاه داده های مقیاس بزرگ و محیط کسب و کار اقتباس شده است.
ابزار برای راحتی حال بارگذاری، استخراج و تبدیل داده ها شامل، در حالی که ساختارهای داده های سفارشی را می توان بر یک مجموعه گسترده ای از فرمت های داده را مجبور.
از آنجا که این یک پروژه از Hadoop مربوط به این پروژه HDFS و HBase نیز به طور خودکار پشتیبانی می شود.
HiveQL است، احتمالا بهترین بخشی از پروژه، ارائه یک زبان پرس و جوی ساده، ابتکاری و کارآمد، در حالی که همچنین قادر به تحمل نقشه کشان و گیربکس در شرایطی که به نحو مادری SQL می توانید داده های مورد نظر را دریافت نمی شود.

چه در این نسخه جدید است:

پشتیبانی استعلام های ناهمبسته در بند که در آن
اضافه کردن NULL تعریف شده به عنوان به ردیف مشخصات قالب
پایگاه داده Ccreate / قطره باید ورودی ها / خروجی جمعیت و بررسی همزمانی و کاربران اجازه
پشتیبانی مقیاس مشخص و دقیق با کندو نوع اعشاری
اجازه دهید وجود داشته از Tez
یک تابع است که شامل منفجر موقعیت آیتم را در آرایه
اضافه کردن نوع داده char
درست جمع آوری UDF و قابل استفاده مجدد ارزیاب
گسترش نویسنده ضبط و ORC خواننده / نویسنده رابط به ارائه آمار
پیاده سازی آمار ارائه ORC نویسنده و خواننده رابط
حاشیه نویسی کندو درخت اپراتور با آمار از metastore
ارائه آمار ستون سطح نوار در ORC
پشتیبانی زیر پرس و جو: عدم اجازه تودرتو از استعلام های
پشتیبانی زیر پرس و جو: اجازه می دهد عبارت زیر پرس و جو در دستور HAVING
پشتیبانی زیر پرس و جو: تست های بیشتر
پشتیبانی پارکت بومی در کندو
کندو باید قادر به جست و خیز سربرگ و پاورقی ردیف در هنگام خواندن فایل داده برای یک جدول باشد
اضافه کردن تاریخ، زمان، اعشاری، انواع CHAR، VARCHAR در HCat حمایت
استفاده از نقشه پیوستن اشاره به کش نتیجه میانی
اضافه کردن UDF برای محاسبه فاصله بین مختصات جغرافیایی

جدید در نسخه 1.2.0 است:

پشتیبانی استعلام های ناهمبسته در عبارت WHERE
اضافه کردن NULL تعریف شده به عنوان به ردیف مشخصات قالب
پایگاه داده Ccreate / قطره باید ورودی ها / خروجی جمعیت و بررسی همزمانی و کاربران اجازه
پشتیبانی مقیاس مشخص و دقیق با کندو نوع اعشاری
اجازه دهید وجود داشته از Tez
یک تابع است که شامل منفجر موقعیت آیتم را در آرایه
اضافه کردن نوع داده char
درست جمع آوری UDF و قابل استفاده مجدد ارزیاب
گسترش نویسنده ضبط و ORC خواننده / نویسنده رابط به ارائه آمار
پیاده سازی آمار ارائه ORC نویسنده و خواننده رابط
حاشیه نویسی کندو درخت اپراتور با آمار از metastore
ارائه آمار ستون سطح نوار در ORC
پشتیبانی زیر پرس و جو: عدم اجازه تودرتو از استعلام های
پشتیبانی زیر پرس و جو: اجازه می دهد عبارت زیر پرس و جو در دستور HAVING
پشتیبانی زیر پرس و جو: تست های بیشتر
پشتیبانی پارکت بومی در کندو
کندو باید قادر به جست و خیز سربرگ و پاورقی ردیف در هنگام خواندن فایل داده برای یک جدول باشد
اضافه کردن تاریخ، زمان، اعشاری، انواع CHAR، VARCHAR در HCat حمایت
استفاده از نقشه پیوستن اشاره به کش نتیجه میانی
اضافه کردن UDF برای محاسبه فاصله بین مختصات جغرافیایی

جدید در نسخه 1.1.0:

پشتیبانی استعلام های ناهمبسته در عبارت WHERE
اضافه کردن NULL تعریف شده به عنوان به ردیف مشخصات قالب
پایگاه داده Ccreate / قطره باید ورودی ها / خروجی جمعیت و بررسی همزمانی و کاربران اجازه
پشتیبانی مقیاس مشخص و دقیق با کندو نوع اعشاری
اجازه دهید وجود داشته از Tez
یک تابع است که شامل منفجر موقعیت آیتم را در آرایه
اضافه کردن نوع داده char
درست جمع آوری UDF و قابل استفاده مجدد ارزیاب
گسترش نویسنده ضبط و ORC خواننده / نویسنده رابط به ارائه آمار
پیاده سازی آمار ارائه ORC نویسنده و خواننده رابط
حاشیه نویسی کندو درخت اپراتور با آمار از metastore
ارائه آمار ستون سطح نوار در ORC
پشتیبانی زیر پرس و جو: عدم اجازه تودرتو از استعلام های
پشتیبانی زیر پرس و جو: اجازه می دهد عبارت زیر پرس و جو در دستور HAVING
پشتیبانی زیر پرس و جو: تست های بیشتر
پشتیبانی پارکت بومی در کندو
کندو باید قادر به جست و خیز سربرگ و پاورقی ردیف در هنگام خواندن فایل داده برای یک جدول باشد
اضافه کردن تاریخ، زمان، اعشاری، انواع CHAR، VARCHAR در HCat حمایت
استفاده از نقشه پیوستن اشاره به کش نتیجه میانی
اضافه کردن UDF برای محاسبه فاصله بین مختصات جغرافیایی

جدید در نسخه 1.0.0 است:

پشتیبانی استعلام های ناهمبسته در عبارت WHERE
اضافه کردن NULL تعریف شده به عنوان به ردیف مشخصات قالب
پایگاه داده Ccreate / قطره باید ورودی ها / خروجی جمعیت و بررسی همزمانی و کاربران اجازه
پشتیبانی مقیاس مشخص و دقیق با کندو نوع اعشاری
اجازه دهید وجود داشته از Tez
یک تابع است که شامل منفجر موقعیت آیتم را در آرایه
اضافه کردن نوع داده char
درست جمع آوری UDF و قابل استفاده مجدد ارزیاب
گسترش نویسنده ضبط و ORC خواننده / نویسنده رابط به ارائه آمار
پیاده سازی آمار ارائه ORC نویسنده و خواننده رابط
حاشیه نویسی کندو درخت اپراتور با آمار از metastore
ارائه آمار ستون سطح نوار در ORC
پشتیبانی زیر پرس و جو: عدم اجازه تودرتو از استعلام های
پشتیبانی زیر پرس و جو: اجازه می دهد عبارت زیر پرس و جو در دستور HAVING
پشتیبانی زیر پرس و جو: تست های بیشتر
پشتیبانی پارکت بومی در کندو
کندو باید قادر به جست و خیز سربرگ و پاورقی ردیف در هنگام خواندن فایل داده برای یک جدول باشد
اضافه کردن تاریخ، زمان، اعشاری، انواع CHAR، VARCHAR در HCat حمایت
استفاده از نقشه پیوستن اشاره به کش نتیجه میانی
اضافه کردن UDF برای محاسبه فاصله بین مختصات جغرافیایی

جدید در نسخه 0.8.1 است:

ابزار برای استخراج داده ها را قادر می سازد آسان / تبدیل / بار (ETL).
مکانیزم برای تحمیل ساختار بر روی انواع فرمت های داده.
دسترسی به فایل های یا به طور مستقیم در آپاچی HDFS (TM) و یا در سیستم های ذخیره سازی داده های دیگر مانند اچبیس (TM) ذخیره می شود.
اجرای پرس و جو از طریق کاهش نگاشت.

جدید در نسخه 0.8.0 است:

ابزار برای استخراج داده ها را قادر می سازد آسان / تبدیل / بار (ETL)
مکانیزم برای تحمیل ساختار بر روی انواع فرمت های داده
دسترسی به فایل های یا به طور مستقیم در آپاچی HDFS (TM) و یا در سیستم های ذخیره سازی داده های دیگر مانند اچبیس ذخیره شده (TM)
اجرای پرس و جو از طریق کاهش نگاشت

اشکالات:

جدید در نسخه 0.7.1 است:
استثنا بر روی ویندوز هنگام استفاده از درایور JDBC. و & quot؛ IOException: این سیستم می تواند مسیر مشخص را پیدا کند و & quot ؛.
اسکریپت ایجاد طرحواره ناقص هستند از آنها را ترک کردن جداول که خاص به DataNucleus هستند.
ارتقاء:
بهبود پیام های خطا متفرقه.
بازگشت درست عمده / شماره نسخه جزیی برای درایور JDBC کندو.
اضافه کردن اجرای HivePreparedStatement بر اساس کندو در حال حاضر پشتیبانی داده از نوع.
وظایف:
کندو در Maven را.
ارائه Metastore ارتقاء اسکریپت ها و طرح واره پیش فرض برای PostgreSQL و.

در نسخه 0.7.0 چه جدید است:

ویژگی های جدید:
زیرساخت مجوز برای کندو
پیاده سازی نمایه سازی در کندو
اضافه کردن بازتاب () UDF برای نیایش بازتابی از روش جاوا
کندو TypeInfo / ObjectInspector تا در اتحاد (علاوه بر ساختار، آرایه، و نقشه)
پیاده سازی str_to_map GenericUDF
پچ برای پشتیبانی از دستور HAVING در کندو
پیگیری می پیوندد که در حال تبدیل به طور خودکار نقشه پیوستن
فرکانس و مدت زمان تماس برای معیارهای HiveMetaStore طریق JMX
حفظ lastAccessTime در metastore
بهبود:
ارائه گزینه ای برای صادرات یک ضربه
پشتیبانی از انتخاب مجزا بر روی دو یا چند ستون
توصیف جدول توسعه یافته / خروجی پارتیشن مرموز است
از دست رفته برخی از قابلیت های JDBC مانند getTables، getColumns و روش HiveResultSet.get * بر اساس نام ستون.
بهره برداری از چوب غلتکی از پروسه ی فرزند
پشتیبانی پشتهای فیلتر در مقابل جداول غیر بومی
جایگزین وابستگی به HBase API منسوخ
اضافه کردن queryid در حالی که قفل
به روز رسانی transident_lastDdlTime تنها اگر مشخص نشده است
اضافه کردن اطلاعات بیشتر اشکال زدایی برای قفل کردن کندو
HiveInputFormat یا CombineHiveInputFormat همیشه همگام بلوک از RCFile دو بار
نمایش زمان کار محلی طول می کشد
ایجاد یک نمونه جدید باغ وحش زمانی که قفل سعی مجدد، و اطلاعات بیشتر برای اشکال زدایی
اضافه کردن یک گزینه به اجرا کار به بررسی نقشه پیوستن امکان در حالت غیر محلی
اشکال زدایی بیشتر برای قفل کردن
اضافه کردن یک گزینه در درج پارتیشن پویا به یک خطا اگر 0 پارتیشن ایجاد می کند
اشکالات:
و & quot؛ LOAD DATA به INPATH محلی و & quot؛ شکست مواجه زمانی که جدول در حال حاضر شامل یک فایل با همین نام
NULL به درستی به کار گرفته نمی عضویت در
HiveInputFormat.getInputFormatFromCache و & quot؛ چلچله ها & quot؛ علت استثنا در هنگام پرتاب IOExcpetion
اضافه کردن پیشرفت در پیوستن و groupby
UDAFs ساده با بیش از 1 سقوط پارامتر در پرس و جو سطر خالی
درست UDF () کار نمی کند
درج پارتیشن پویا چپ فایل های خالی uncleaned در حالت محلی از Hadoop 0.17
رفتن ضد روز رسانی در زمانی RunningJob.getCounters () null برمی گردد

جدید در نسخه 0.5.0 است:

اجازه دهید کاربران serde مشخص برای اسکریپت های سفارشی.
اضافه کردن unhex UDF.
حذف واردات lzocodec از FileSinkOperator.
NullPointerException در درایور هنگام فراخوانی getResults بدون کامپایل است.
بهبود عملکرد برای RCFile و ColumnarSerDe در کندو.

نرم افزار های مشابه

StickySort
StickySort

13 May 15

Spidr
Spidr

12 May 15

نرم افزار های دیگر از توسعه دهنده Apache Software Foundation

Apache ZooKeeper
Apache ZooKeeper

13 Apr 15

Apache Drill
Apache Drill

9 Feb 16

Apache Helix
Apache Helix

13 Apr 15

نظرات به Apache Hive

نظر یافت نشد
اضافه کردن نظر
روشن کردن تصاویر!