التعدين البيانات غير منظم

مؤلف: Eugene Taylor
تاريخ الخلق: 13 أغسطس 2021
تاريخ التحديث: 10 قد 2024
Anonim
Data - البيانات - Part 1 - تنقيب البيانات - Data Mining
فيديو: Data - البيانات - Part 1 - تنقيب البيانات - Data Mining

المحتوى

التعريف - ماذا يعني تعدين البيانات غير المهيكلة؟

استخراج البيانات غير المهيكلة هو ممارسة النظر إلى البيانات غير المهيكلة نسبيًا ومحاولة الحصول على مزيد من مجموعات البيانات المكررة منها. وغالبًا ما يتكون من استخراج البيانات من المصادر غير المستخدمة تقليديًا في أنشطة استخراج البيانات.

مقدمة إلى Microsoft Azure و Microsoft Cloud | من خلال هذا الدليل ، سوف تتعرف على الحوسبة السحابية التي تدور حولها وكيف يمكن أن يساعدك Microsoft Azure على ترحيل عملك وإدارته من السحابة.

يشرح Techopedia تعدين البيانات غير المهيكلة

بشكل عام ، يعد التنقيب عن البيانات ممارسة تمشيط عبر مجموعات البيانات ومحاولة الحصول على بتات المعلومات الأكثر قيمة في تنسيق محدد. هذا هو عادة أكثر صعوبة مع البيانات غير منظم نسبيا. يعرّف خبراء تقنية المعلومات البيانات غير المهيكلة بأنها بيانات ليست بتنسيق محدد ، أو بيانات "ثقيلة" أو بيانات "مخفية" في مستندات غير دقيقة لا يتم طلبها رسميًا لتقديم معلومات تقنية.

مثال على مستند غير منظم سيكون خطاب أو مراسلات بين طرفين أو أكثر. في التنقيب غير المنظم للبيانات ، ستقوم التقنيات بتفكيك تلك الرسالة ، وتبحث عن محددات محددة وبتات من المعلومات مثل أسماء الأطراف ذات الصلة ، وتواريخ إرسال الرسائل ، وأسماء الشركات المعنية ، ومبالغ العملة أو غيرها من المقاييس الكمية. بت من البيانات ، أو الرموز المخصصة لمنتجات أو خدمات أو صفقات معينة. يتم استخراج هذه الأنواع من البيانات ثم وضعها في تنسيق يمكن للشركات أو الأطراف الأخرى استخدامها كمرجع سريع أو لتطبيقات ذكاء الأعمال المتقدمة.