ما هو الفرق بين البيانات الكبيرة واستخراج البيانات؟

مؤلف: Judy Howell
تاريخ الخلق: 5 تموز 2021
تاريخ التحديث: 23 يونيو 2024
Anonim
البيانات الضخمة Big Data.. أين تذهب بياناتنا على الانترنت ومن يستفيد منها؟ | معنى تك
فيديو: البيانات الضخمة Big Data.. أين تذهب بياناتنا على الانترنت ومن يستفيد منها؟ | معنى تك

المحتوى

Q:

ما هو الفرق بين البيانات الكبيرة واستخراج البيانات؟


أ:

البيانات الكبيرة واستخراج البيانات هما شيئان مختلفان. كلاهما يتعلق باستخدام مجموعات البيانات الكبيرة للتعامل مع جمع أو الإبلاغ عن البيانات التي تخدم الشركات أو المستلمين الآخرين. ومع ذلك ، يتم استخدام المصطلحين لعنصرين مختلفين من هذا النوع من العمليات.

البيانات الكبيرة هي مصطلح لمجموعة بيانات كبيرة. مجموعات البيانات الضخمة هي تلك التي تتفوق على النوع البسيط من بنيات قواعد البيانات ومعالجة البيانات التي تم استخدامها في أوقات سابقة ، عندما كانت البيانات الضخمة أعلى تكلفة وأقل جدوى. على سبيل المثال ، يمكن الإشارة إلى مجموعات البيانات الكبيرة جدًا بحيث لا يمكن التعامل معها بسهولة في جدول بيانات Microsoft Excel على أنها مجموعات بيانات كبيرة.

يشير تعدين البيانات إلى نشاط الانتقال عبر مجموعات البيانات الكبيرة للبحث عن المعلومات ذات الصلة أو ذات الصلة. هذا النوع من النشاط هو في الحقيقة مثال جيد على البديهية القديمة "تبحث عن إبرة في كومة قش". الفكرة هي أن الشركات تجمع مجموعات هائلة من البيانات التي قد تكون متجانسة أو يتم جمعها تلقائيًا. يحتاج صانعو القرار إلى الوصول إلى أجزاء أصغر وأكثر تحديدًا من هذه المجموعات الكبيرة. يستخدمون التنقيب عن البيانات للكشف عن أجزاء المعلومات التي من شأنها أن تُعلم القيادة وتساعد في رسم مسار النشاط التجاري.


يمكن أن يشمل استخراج البيانات استخدام أنواع مختلفة من حزم البرامج مثل أدوات التحليل. يمكن أن يكون آلياً ، أو يمكن أن يكون كثيف الاستخدام لليد العاملة ، حيث يقوم العمال الأفراد باستفسارات محددة للحصول على معلومات إلى أرشيف أو قاعدة بيانات. بشكل عام ، يشير التنقيب عن البيانات إلى العمليات التي تنطوي على عمليات بحث معقدة نسبيًا تؤدي إلى نتائج محددة ومحددة. على سبيل المثال ، قد تبحث أداة استخراج البيانات خلال عشرات السنين من المعلومات المحاسبية للعثور على عمود محدد من المصروفات أو الحسابات المدينة لسنة تشغيل محددة.

باختصار ، البيانات الكبيرة هي استخراج البيانات والبيانات هي "المعالج" الذي يستخدم لتوفير نتائج مفيدة.