اباتشي كودو

مؤلف: Laura McKinney
تاريخ الخلق: 1 أبريل 2021
تاريخ التحديث: 14 قد 2024
Anonim
Apache Kudu: Fast Analytics on Fast Data | DataEngConf SF ’16
فيديو: Apache Kudu: Fast Analytics on Fast Data | DataEngConf SF ’16

المحتوى

التعريف - ماذا يعني Apache Kudu؟

أباتشي كودو هو عضو في النظام الإيكولوجي المفتوح المصدر أباتشي Hadoop. إنه محرك تخزين مفتوح المصدر مخصص للبيانات المهيكلة التي تدعم الوصول العشوائي المنخفض الكمون مع أنماط وصول تحليلية فعالة. تم تصميمها وتنفيذها لسد الفجوة بين نظام الملفات الموزعة Hadoop الموزع (HDFS) وقاعدة بيانات HBase NoSQL المستخدمة على نطاق واسع. على الرغم من أن هذه الأنظمة قد لا تزال مفيدة ، إلا أن Apache Kudu يمكنه تلبية العديد من أعباء العمل الشائعة لأنه يمكن أن يبسط بنيانها بشكل كبير.


مقدمة إلى Microsoft Azure و Microsoft Cloud | من خلال هذا الدليل ، سوف تتعرف على الحوسبة السحابية التي تدور حولها وكيف يمكن أن يساعدك Microsoft Azure على ترحيل عملك وإدارته من السحابة.

يشرح Techopedia أباتشي كودو

تم تطوير Apache Kudu بشكل أساسي كمشروع في Cloudera. معظم المساهمات حتى الآن كانت بواسطة مطورين يعملون لدى Cloudera. أثناء إصدارها ، تم تضمين ثنائيات الراحة فقط في مستودعات Cloudera ، ومع ذلك فقد اعتمدت عملية إصدار مصدر Apache Software Foundation (ASF) عند الانضمام إلى الحاضنة. مصمم خصيصًا لحالات الاستخدام التي تتطلب تحليلات سريعة للبيانات السريعة. تم تصميمه للاستفادة من أجهزة الجيل التالي ومعالجة الذاكرة. أنه يقلل من الكمون الاستعلام بشكل كبير ل Apache Impala و Apache Spark. إنه يوزع البيانات من خلال محرك تخزين عمودي أو من خلال التقسيم الأفقي ، ثم يقوم بتكرار كل قسم باستخدام إجماع "رافت" وبالتالي يوفر وقتًا متوسطًا للوقت للاسترداد وميزات ذيل منخفضة.

على الرغم من أن كودو منتج تم تصميمه في إطار نظام Apache Hadoop البيئي ، إلا أنه يدعم أيضًا التكامل مع مشاريع تحليل البيانات الأخرى داخل ASF وخارجها.


يثبت Apache Kudu فعاليته حيث يمكنه معالجة أعباء العمل التحليلية في الوقت الحقيقي عبر طبقة تخزين واحدة ، مما يمنح المهندسين المعماريين المرونة لمعالجة مجموعة واسعة من حالات الاستخدام دون حلول غريبة.