اباتشي سبارك

مؤلف: Eugene Taylor
تاريخ الخلق: 8 أغسطس 2021
تاريخ التحديث: 1 تموز 2024
Anonim
What Is Apache Spark? | Introduction To Apache Spark | Apache Spark Tutorial | Simplilearn
فيديو: What Is Apache Spark? | Introduction To Apache Spark | Apache Spark Tutorial | Simplilearn

المحتوى

التعريف - ماذا يعني Apache Spark؟

Apache Spark هو برنامج مفتوح المصدر يستخدم لتحليل البيانات. جزء من مجموعة أكبر من الأدوات ، بما في ذلك Apache Hadoop وغيرها من الموارد مفتوحة المصدر لمجتمع التحليلات اليوم.


يصف الخبراء هذا البرنامج المفتوح المصدر الجديد نسبيًا بأنه أداة حوسبة لمجموعة تحليلات البيانات. يمكن استخدامه مع نظام الملفات الموزعة Hadoop (HDFS) ، والذي يعد مكون Hadoop معين يسهل معالجة الملفات المعقدة.

يصف بعض محترفي تكنولوجيا المعلومات استخدام Apache Spark كبديل محتمل لمكون Apache Hadoop MapReduce. MapReduce هي أيضًا أداة تجميع تساعد المطورين على معالجة مجموعات كبيرة من البيانات. يشير أولئك الذين يفهمون تصميم Apache Spark إلى أنه يمكن أن يكون أسرع عدة مرات من MapReduce ، في بعض الحالات.

مقدمة إلى Microsoft Azure و Microsoft Cloud | من خلال هذا الدليل ، سوف تتعرف على الحوسبة السحابية التي تدور حولها وكيف يمكن أن يساعدك Microsoft Azure على ترحيل عملك وإدارته من السحابة.

تيكوبيديا تشرح أباتشي سبارك

يظهر أولئك الذين يكتبون عن الاستخدام الحديث لـ Apache Spark أن الشركات تستخدمه بطرق مختلفة. الاستخدام الشائع هو تجميع البيانات وتنظيمها بطرق أكثر دقة. يمكن أن يكون Apache Spark مفيدًا أيضًا في عمل تحليلات التعلم الآلي أو تصنيف البيانات.


عادةً ما تواجه المؤسسات تحدي تنقية البيانات بطريقة فعالة ومؤتمتة إلى حد ما ، حيث يمكن استخدام Apache Spark لهذه الأنواع من المهام. يشير البعض أيضًا إلى أن استخدام Spark يمكن أن يساعد في توفير الوصول إلى من هم أقل دراية بالبرمجة ويرغبون في المشاركة في التعامل مع التحليلات.

يتضمن Apache Spark واجهات برمجة التطبيقات لبايثون ولغات البرامج ذات الصلة.