ينبع تحدي البيانات الكبيرة اليوم من التنوع وليس من الحجم أو السرعة

مؤلف: Judy Howell
تاريخ الخلق: 28 تموز 2021
تاريخ التحديث: 1 تموز 2024
Anonim
سوار تعيش يوم كامل ام
فيديو: سوار تعيش يوم كامل ام

المحتوى


يبعد:

يلقي الكثير من أقسام تكنولوجيا المعلومات كل ما لديهم في مسائل حجم البيانات وسرعتها ، متناسين معالجة القضية الأساسية المتمثلة في مجموعة متنوعة من البيانات.

يكمن التحدي المتمثل في إدارة البيانات الكبيرة والاستفادة منها في ثلاثة عناصر ، وفقًا لدوغ لاني ، نائب رئيس الأبحاث في شركة Gartner. لاحظت لاني لأول مرة منذ أكثر من عقد من الزمان أن البيانات الضخمة تشكل مثل هذه المشكلة للمؤسسة لأنها تقدم حجمًا وسرعة وتنوعًا يصعب إدارتهما. تكمن المشكلة في أن العديد من أقسام تكنولوجيا المعلومات ترمي كل شيء لديها على مسائل حجم البيانات وسرعتها ، متناسين معالجة القضية الأساسية المتمثلة في مجموعة متنوعة من البيانات.

في عام 2001 ، كتب لاني أن "الشركات الرائدة ستستخدم بشكل متزايد مستودع بيانات مركزي لتحديد مفردات العمل المشتركة التي تعمل على تحسين التعاون الداخلي والخارجي." لا تزال مسألة تلك المفردات - والتنوع الذي يمنع الشركات من إنشائها - هي الجانب الأقل معالجة في لغز البيانات الضخمة اليوم. (راجع ما يقوله الخبراء الآخرون. راجع خبراء البيانات الضخمة لمتابعة).


ثلاثة مقابل البيانات الكبيرة

لقد وجدت العديد من الشركات طرقًا لتسخير زيادة حجم البيانات وسرعتها. على سبيل المثال ، يمكن تحليل كميات هائلة من البيانات. بالطبع ، يتم تقديم هذه البيانات مرارًا وتكرارًا ضمن نفس المعلمات. أدى هذا إلى ابتكارات تقنية مثل قواعد بيانات الأعمدة ، والتي تستخدم الآن على نطاق واسع من قبل الشركات الأخرى التي تواجه مخازن كبيرة على قدم المساواة من عناصر البيانات المماثلة.

فيما يتعلق بترويض السرعة ، يساعد بائعون مثل Splunk الشركات على تحليل البيانات التي تم إنشاؤها بسرعة من خلال ملفات السجل التي تلتقط عدة آلاف من الأحداث في الثانية. يستهدف هذا التحليل للأحداث الكبيرة الحجم حالات استخدام الأمان ومراقبة الأداء. كما هو الحال مع تحدي حجم البيانات ، تم التعامل مع تحدي السرعة إلى حد كبير من خلال تقنيات الفهرسة المتطورة وتحليلات البيانات الموزعة التي تتيح قدرة المعالجة على التوسع مع زيادة سرعة البيانات.

عندما يتعلق الأمر بالتنوع ، على الرغم من ذلك ، لا تزال العديد من الشركات تواجه مشكلة كبيرة في نهجها لتحليل البيانات الضخمة. هذه المشكلة مدفوعة بثلاثة عوامل: أولاً ، بسبب النمو والاستحواذ والابتكارات التكنولوجية التي تضيف أنظمة جديدة إلى البيئة ، تخوض الشركات بيئة غير متجانسة للغاية ويزداد هذا التجانس مع مرور الوقت. تحتاج الشركات إلى تتبع عدد كبير من أنواع الأنظمة وإدارة عشرات الآلاف من أنواع البيانات ، وكذلك البيانات نفسها التي يتم تمثيلها باستخدام تسميات وتنسيقات مختلفة.


ثانياً ، تشير هذه الأنظمة وأنواع البيانات في العديد من الحالات إلى المعلومات والمعلومات ذات الصلة التي يمكن تصفيتها بأمان باعتبارها غير مهمة للمشكلة التي تتم معالجتها. هناك حاجة لتحديد المعلومات المؤثرة بشكل موثوق.

البعد الثالث لتحدي التنوع هو التغير المستمر أو التغيير في البيئة. تتم ترقية الأنظمة ، وإدخال أنظمة جديدة ، وإضافة أنواع جديدة من البيانات وإدخال تسمية جديدة. هذا يجهد قدرتنا على ترويض تحدي تنوع البيانات. هذا يضيف طبقة إضافية للتحدي متنوعة. (لمزيد من التبصر ، تحقق من البيانات الضخمة: كيف تم الاستيلاء عليها وتقطيعها واستخدامها لاتخاذ القرارات التجارية).

معالجة مشكلة تنوع البيانات

لمعالجة مشكلة تنوع البيانات ، يجب أن تبدأ المؤسسات بنطاق تكنولوجيا المعلومات ، لأنها تمثل في كثير من الأحيان أسوأ المجرمين وأسوأ ضحايا لمشكلة التنوع. الخطوة الأولى هي البدء بتعريف أو تصنيف شامل لجميع عناصر أو أصول تكنولوجيا المعلومات. يوفر هذا الأساس أو الأساس للإشارة إلى أي شيء في تكنولوجيا المعلومات أو حولها ويمكّن المؤسسات من إدارة عدم التجانس المتزايد مقابل تصنيف أو مصطلحات معروفة.

No Bugs، No Stress - دليلك خطوة بخطوة لإنشاء برامج لتغيير الحياة دون تدمير حياتك

لا يمكنك تحسين مهارات البرمجة لديك عندما لا يهتم أحد بجودة البرنامج.

تتمثل الخطوة التالية في تحديد الطرق العديدة التي يتم تمثيل الكائن نفسه بها عبر أنظمة تسجيل مختلفة. يتيح ذلك لمتخصصي تكنولوجيا المعلومات إمكانية النظر عبر بيئتهم غير المتجانسة وتصفية البيانات وضغطها بشكل كبير في مجموعات ذات صلة ويمكن التحكم فيها.

أخيرًا ، يجب على مديري تقنية المعلومات اعتماد عملية فحص مستمر للبيئة لإجراء تغييرات مثل الأنواع الجديدة من العناصر التي يتم تقديمها أو تسمية جديدة للإشارة إلى نفس العنصر.

من خلال هذه الخطوات ، يمكن لمؤسسات تكنولوجيا المعلومات إدارة مشكلة التنوع واستنباط رؤى عميقة تعرقلت فرق تقنية المعلومات من الناحية التاريخية. علاوة على ذلك ، تعمل إدارة مشكلة التنوع على تحسين عائد الاستثمار بشكل كبير في الأدوات والتقنيات التي تعالج مشكلات البيانات الضخمة التقليدية من حيث الحجم والسرعة.