ما هو تأثير المصدر المفتوح على نظام أباتشي Hadoop البيئي؟

مؤلف: Roger Morrison
تاريخ الخلق: 19 شهر تسعة 2021
تاريخ التحديث: 10 قد 2024
Anonim
GDPR’s Right to be Forgotten in Apache Hadoop Ozone
فيديو: GDPR’s Right to be Forgotten in Apache Hadoop Ozone

المحتوى


المصدر: فولكر شليتشينغ / Dreamstime.com

يبعد:

المصدر المفتوح هو في صميم تطوير البرمجيات ، مما يمنح المبدعين حكمًا مجانيًا. هذا صحيح بشكل خاص مع Hadoop والعديد من جوانبها.

أحد الأسباب الرئيسية لنظام Hadoop الإيكولوجي هو نجاح كبير هو أنه إطار برامج بيانات كبير مجاني ومفتوح. يمكن لمطوري البرامج الوصول إلى التعليمات البرمجية المصدر وتعديلها لإنشاء منتجات أو تطبيقات بيانات كبيرة خاصة بهم. لقد أدى Hadoop إلى إنشاء العديد من تطبيقات تحليل البيانات الكبيرة. في الوقت الذي تحدد فيه البيانات الضخمة حياتنا ، ربما يكون من العدل أن نقول إن Hadoop كانت تحدد كيفية تحليل البيانات الضخمة. كان هذا ممكنًا بشكل أساسي لأن نظام Apache Hadoop الإيكولوجي يستمد مبادئه من قيم البرامج مفتوحة المصدر. في هذا الخداع ، من المناسب تحديد المبادئ التي ألهمت نظام Hadoop البيئي. وتناقش المبادئ البارزة أدناه.

مبادئ مفتوحة المصدر البارزة التي ألهمت أباتشي Hadoop

  • الوصول إلى الكود المصدري - وفقًا لمبادئ المصدر المفتوح ، يجب أن يكون الكود المصدري للبرنامج مفتوح المصدر متاحًا لأي شخص من أجل التعديل والتحسين. يمكن لمطور البرامج إنشاء تطبيقات برامج باستخدام الكود المصدري. لذلك يتم إعادة استخدام إطار Hadoop وتعديله لتطوير العديد من تطبيقات البرامج من حوله.
  • التعاون - يتم إنشاء برنامج مفتوح المصدر عالي الجودة عندما يقوم عدة أشخاص بتجميع رؤوسهم معًا. يمكن للتعاون أن يولد أفكارًا جديدة ، وأن يحل المشكلات المعقدة التي ربما لا يستطيع شخص يعمل في صومعة اكتشافها ، ويكتشف طرقًا جديدة لعرض المشكلة.
  • لا تمييز ضد أي مصلحة - وفقًا لنظام المصادر المفتوحة ، يمكن لأي شخص تعديل التعليمات البرمجية المصدر وإنشاء تطبيق برمجي والتخلي عنه مجانًا أو بيعه أو استخدامه لأغراض بحثية. يلهم هذا المبدأ إنشاء العديد من تطبيقات البرامج التي تكون متاحة مجانًا أو متوفرة تجاريًا.
  • الترخيص محايد من الناحية التكنولوجية - لا تفضل بنود وشروط الترخيص المفتوح المصدر أي تقنية أو لغة برمجة محددة. يمكن استخدام شفرة المصدر لتطوير تطبيقات البرمجيات على أي منصة.
  • لا توجد قيود على البرامج المستخدمة - يتمتع أي شخص يقوم بالوصول إلى الكود المصدري وتطوير تطبيق برنامج آخر بحرية استخدام البرامج الأخرى أو أكواد المصدر الأخرى.

تأثير المصدر المفتوح على Hadoop Ecosystem

نظام Hadoop البيئي هو ترتيب شامل جيد التنظيم يجعل تحليل البيانات الضخمة بسيطًا ودقيقًا. يتكون النظام البيئي Hadoop من عدة تطبيقات برمجية ، يتخصص كل منها في مهمة محددة. ومع ذلك ، في حين أن النظام الإيكولوجي بأكمله عبارة عن مزيج من أدوات البرمجيات ، فإن كل أداة من الأدوات في حد ذاتها قادرة على القيام بعمل متخصص بشكل مستقل. هذا يعني أنه يمكنك اختيار واختيار الأدوات المحددة اللازمة لتحقيق غرضك - Hadoop هي تلك المرونة. Hadoop لا تلزمك بالقواعد التي تجبرك على استخدام البرنامج بطريقة معينة. يمكنك استخدام شفرة المصدر بأي طريقة تريد.


دعونا نلقي نظرة على نظرة عامة على كيفية عمل النظام البيئي Hadoop وكذلك كيف يحتضن مبادئ مفتوحة المصدر على طول الطريق.

لنبدأ مع تعريف أساسي Hadoop. وفقًا لشركة IBM ، "Apache Hadoop هو مشروع برمجيات مفتوح المصدر يتيح المعالجة الموزعة لمجموعات البيانات الكبيرة عبر مجموعات من خوادم السلع الأساسية. وهي مصممة لتوسيع نطاقها من خادم واحد إلى آلاف الأجهزة ، مع درجة عالية جدًا من التسامح مع الأعطال. بدلاً من الاعتماد على الأجهزة المتطورة ، تأتي مرونة هذه الكتل من قدرة البرامج على اكتشاف ومعالجة حالات الفشل في طبقة التطبيق. "

كيف يعمل Hadoop؟ يتكون النظام البيئي Hadoop من وحدات مختلفة وكل وحدة تؤدي وظيفة مختلفة. الوحدات المختلفة هي:

  • Hadoop Distributed Filesystem (HDFS) - يعد HDFS نظام تخزين بيانات كبير Hadoops. يمكنك تخزين كميات هائلة من البيانات واستخراج البيانات في وقت المعالجة. لتخزين البيانات ، يستخدم Hadoop إطار عمل موزع حيث يتم تخزين البيانات عبر عدد من خوادم السلع الأساسية. الترتيب هو أنه حتى لو كان الخادم غير متصل بالإنترنت ، فإنه لا يزعج الإعداد بأكمله ؛ يسير العمل بالشكل المعتاد. هذا ما يجعل Hadoop مثل هذا النظام المرن. على الرغم من أن HDFS هو مرفق تخزين البيانات الخاص بهادووب ، فإنه يمكن أيضًا استخدام أنظمة الملفات الخارجية لتخزين البيانات.
  • MapReduce - يقوم تطبيق MapReduce بتحليل ومعالجة البيانات الكبيرة التي يخزنها HDFS. فهو يسحب البيانات من HDFS دون الحاجة إلى استخدام لغة الاستعلامات البنيوية SQL القياسية أو لغات الاستعلام الأخرى. يستخدم MapReduce تطبيقات أخرى تستند إلى Java لمعالجة البيانات.

يوفر النظام البيئي Hadoop السرعة والموثوقية لأن تخزين البيانات وتحليلها لا يعتمد على أي من خوادم السلع الأساسية العديدة التي تستضيف البيانات. يتم تخزين البيانات الكبيرة وكذلك HDFS و MapReduce في كل خادم سلعي. لذلك ، حتى إذا تعطل واحد أو أكثر من الخوادم ، فلن يتم تعطيل العمل. الافتراض هنا هو أن الخوادم يمكن أن تتعطل في أي وقت ولا يمكن إيقاف ذلك. لذلك ، يجب أن يكون النظام في مكانه للتأكد من عدم توقف العمل في حالة حدوث خلل في الخادم.


ميزة كبيرة من Hadoop هي مرونته. لتطوير تطبيقات البرمجيات ، لا يحتاج مستخدمو Hadoop بالضرورة إلى استخدام HDFS أو MapReduce. على سبيل المثال ، قام نظام Amazon Web Services بتكييف نظام ملفات S3 الخاص به مع Hadoop دون الحاجة إلى استخدام HDFS. وبالمثل ، يعد DataStax Brisk تطبيق Hadoop لا يستخدم HDFS. إنه بدلاً من ذلك يستخدم Apache Cassandras CassandraFS. لذلك يمكنك أن ترى بالفعل كيف ألهمت مبادئ نظام مفتوح المصدر نظام Hadoop البيئي.

ليس من الصعب تحديد مدى تأثير المصدر المفتوح على Hadoop. ربما يكون من الآمن القول أن النظام البيئي Hadoop سوف يكتب قواعد كيفية معالجة البيانات الضخمة في المستقبل. سيكون هذا هو الحال طالما بقيت Hadoop متوافقة مع قيم البرامج مفتوحة المصدر. المصدر المفتوح هو روح وروح النظام البيئي Hadoop. بغض النظر عن مدى قوة أداة البرنامج أو ذكائها ، فإنها لا يمكن أن تحظى بقبول عالمي دون إعطاء أو مشاركة مع مجتمع البرامج العالمي.

No Bugs، No Stress - دليلك خطوة بخطوة لإنشاء برامج لتغيير الحياة دون تدمير حياتك

لا يمكنك تحسين مهارات البرمجة لديك عندما لا يهتم أحد بجودة البرنامج.

خاتمة

تعد البرامج مفتوحة المصدر حاليًا نقطة جذب رئيسية لجميع مجتمعات البرمجيات. يعد Apache Hadoop واحدًا من أنجح المنصات مفتوحة المصدر. وتستند منتجات النظام البيئي Hadoop المرتبطة أيضا على البرمجيات مفتوحة المصدر. من المؤكد أن تكتسب فلسفة المصادر المفتوحة شعبية في المستقبل القريب ، مما يعني أنه يمكننا التطلع إلى العديد من منصات البرامج الجديدة.