المصدر المفتوح تحليلات البيانات الكبيرة

مؤلف: Laura McKinney
تاريخ الخلق: 1 أبريل 2021
تاريخ التحديث: 14 قد 2024
Anonim
Openlookeng Heuristic Index Framework Architecture Analysis And Application Practice
فيديو: Openlookeng Heuristic Index Framework Architecture Analysis And Application Practice

المحتوى

التعريف - ماذا تعني البيانات المفتوحة المصدر لتحليل البيانات؟

تشير تحليلات البيانات الكبيرة مفتوحة المصدر إلى استخدام برامج وأدوات مفتوحة المصدر لتحليل كميات هائلة من البيانات من أجل جمع المعلومات ذات الصلة والقابلة للتنفيذ التي يمكن أن تستخدمها المنظمة لتعزيز أهداف أعمالها. يعد Apaches Hadoop أكبر لاعب في تحليلات البيانات الكبيرة مفتوحة المصدر - فهو مكتبة البرامج الأكثر استخدامًا لمعالجة مجموعات البيانات الضخمة عبر مجموعة من أجهزة الكمبيوتر باستخدام عملية موزعة للتوازي.


مقدمة إلى Microsoft Azure و Microsoft Cloud | من خلال هذا الدليل ، سوف تتعرف على الحوسبة السحابية التي تدور حولها وكيف يمكن أن يساعدك Microsoft Azure على ترحيل عملك وإدارته من السحابة.

تشرح Techopedia تحليلات البيانات الكبيرة مفتوحة المصدر

تستخدم تحليلات البيانات الكبيرة مفتوحة المصدر برامج وأدوات مفتوحة المصدر من أجل تنفيذ تحليلات البيانات الضخمة إما باستخدام نظام أساسي برمجي كامل أو أدوات متعددة المصادر مفتوحة لمهام مختلفة في عملية تحليل البيانات. يعد Apache Hadoop أكثر الأنظمة المعروفة لتحليلات البيانات الكبيرة ، ولكن هناك حاجة إلى مكونات أخرى قبل أن يتم تجميع نظام تحليلات حقيقي.

Hadoop هو تطبيق مفتوح المصدر لخوارزمية MapReduce رائدة من قِبل Google و Yahoo ، لذلك فهو أساس معظم أنظمة التحليل اليوم. تستخدم العديد من أدوات تحليل البيانات الكبيرة المصادر المفتوحة ، بما في ذلك أنظمة قواعد البيانات القوية مثل MongoDB مفتوح المصدر ، وقاعدة بيانات NoSQL متطورة وقابلة للتطوير ومناسبة للغاية لتطبيقات البيانات الكبيرة ، وكذلك غيرها.


تشمل خدمات تحليل البيانات الكبيرة مفتوحة المصدر:

  • نظام جمع البيانات
  • مركز تحكم لإدارة ومراقبة الكتل
  • آلة التعلم واستخراج البيانات المكتبة
  • خدمة تنسيق التطبيق
  • حساب المحرك
  • إطار التنفيذ