المحتوى
- التعريف - ماذا تعني البيانات المفتوحة المصدر لتحليل البيانات؟
- مقدمة إلى Microsoft Azure و Microsoft Cloud | من خلال هذا الدليل ، سوف تتعرف على الحوسبة السحابية التي تدور حولها وكيف يمكن أن يساعدك Microsoft Azure على ترحيل عملك وإدارته من السحابة.
- تشرح Techopedia تحليلات البيانات الكبيرة مفتوحة المصدر
التعريف - ماذا تعني البيانات المفتوحة المصدر لتحليل البيانات؟
تشير تحليلات البيانات الكبيرة مفتوحة المصدر إلى استخدام برامج وأدوات مفتوحة المصدر لتحليل كميات هائلة من البيانات من أجل جمع المعلومات ذات الصلة والقابلة للتنفيذ التي يمكن أن تستخدمها المنظمة لتعزيز أهداف أعمالها. يعد Apaches Hadoop أكبر لاعب في تحليلات البيانات الكبيرة مفتوحة المصدر - فهو مكتبة البرامج الأكثر استخدامًا لمعالجة مجموعات البيانات الضخمة عبر مجموعة من أجهزة الكمبيوتر باستخدام عملية موزعة للتوازي.
مقدمة إلى Microsoft Azure و Microsoft Cloud | من خلال هذا الدليل ، سوف تتعرف على الحوسبة السحابية التي تدور حولها وكيف يمكن أن يساعدك Microsoft Azure على ترحيل عملك وإدارته من السحابة.
تشرح Techopedia تحليلات البيانات الكبيرة مفتوحة المصدر
تستخدم تحليلات البيانات الكبيرة مفتوحة المصدر برامج وأدوات مفتوحة المصدر من أجل تنفيذ تحليلات البيانات الضخمة إما باستخدام نظام أساسي برمجي كامل أو أدوات متعددة المصادر مفتوحة لمهام مختلفة في عملية تحليل البيانات. يعد Apache Hadoop أكثر الأنظمة المعروفة لتحليلات البيانات الكبيرة ، ولكن هناك حاجة إلى مكونات أخرى قبل أن يتم تجميع نظام تحليلات حقيقي.
Hadoop هو تطبيق مفتوح المصدر لخوارزمية MapReduce رائدة من قِبل Google و Yahoo ، لذلك فهو أساس معظم أنظمة التحليل اليوم. تستخدم العديد من أدوات تحليل البيانات الكبيرة المصادر المفتوحة ، بما في ذلك أنظمة قواعد البيانات القوية مثل MongoDB مفتوح المصدر ، وقاعدة بيانات NoSQL متطورة وقابلة للتطوير ومناسبة للغاية لتطبيقات البيانات الكبيرة ، وكذلك غيرها.
تشمل خدمات تحليل البيانات الكبيرة مفتوحة المصدر:
- نظام جمع البيانات
- مركز تحكم لإدارة ومراقبة الكتل
- آلة التعلم واستخراج البيانات المكتبة
- خدمة تنسيق التطبيق
- حساب المحرك
- إطار التنفيذ