لماذا التعبئة في تعلم الآلة تقلل من التباين؟

مؤلف: Roger Morrison
تاريخ الخلق: 26 شهر تسعة 2021
تاريخ التحديث: 9 قد 2024
Anonim
Machine Learning | Ensemble, Bagging, & Random Forest
فيديو: Machine Learning | Ensemble, Bagging, & Random Forest

المحتوى

Q:

لماذا التعبئة في تعلم الآلة تقلل من التباين؟


أ:

يقلل تجميع الإقلاع أو "التعبئة" في التعلم الآلي من التباين من خلال إنشاء نماذج أكثر تقدماً من مجموعات البيانات المعقدة. على وجه التحديد ، يُنشئ نهج التعبئة مجموعات فرعية تتداخل غالبًا لنمذجة البيانات بطريقة أكثر ارتباطًا.

أحد الأفكار المثيرة للاهتمام والمباشرة حول كيفية تطبيق التعبئة هو أخذ مجموعة من العينات العشوائية واستخراج المتوسط ​​البسيط. ثم ، باستخدام نفس مجموعة العينات ، قم بإنشاء العشرات من المجموعات الفرعية التي تم إنشاؤها كأشجار قرارات لمعالجة النتائج النهائية. يجب أن يظهر الوسط الثاني صورة حقيقية عن كيفية ارتباط تلك العينات الفردية ببعضها البعض من حيث القيمة. يمكن تطبيق نفس الفكرة على أي خاصية لأي مجموعة من نقاط البيانات.


نظرًا لأن هذا النهج يدمج الاكتشاف في حدود أكثر تحديدًا ، فإنه يقلل من التباين ويساعد في التجهيز الزائد. التفكير في scatterplot مع نقاط البيانات الموزعة إلى حد ما. باستخدام طريقة التعبئة ، يقوم المهندسون "بتقليص" التعقيد وتوجيه خطوط الاكتشاف لتنعيم المعلمات.

يتحدث البعض عن قيمة التعبئة على أنها "فرق تسد" أو نوع من "الاستدلال المساعد". تكمن الفكرة في أنه من خلال نمذجة المجموعات ، مثل استخدام الغابات العشوائية ، يمكن لأولئك الذين يستخدمون التعبئة كأسلوب أن يحصلوا على نتائج بيانات أقل في التباين. من حيث تقليل التعقيد ، يمكن أن يساعد التغليف أيضًا في التجهيز. فكر في نموذج يحتوي على الكثير من نقاط البيانات: على سبيل المثال ، نقطة اتصال تضم 100 نقطة غير محاذاة. سيكون خط البيانات المرئية الناتج خشنة وديناميكية ومتقلبة. ثم "استنفد" الفرق من خلال تجميع مجموعات من التقييمات. في التعلم التجميعي ، غالبًا ما يُعتقد أن هذا ينضم إلى العديد من "المتعلمين الضعفاء" لتقديم نتيجة تعاونية "التعلم القوي". والنتيجة هي وجود خط بيانات أكثر سلاسة وأكثر إحيطًا وأقل تباينًا في النموذج.


من السهل أن نرى كيف يمكن تطبيق فكرة التعبئة على أنظمة تكنولوجيا المعلومات الخاصة بالمؤسسات. غالبًا ما يريد قادة الأعمال رؤية "طيور العين" لما يحدث مع المنتجات والعملاء ، وما إلى ذلك. يمكن للنموذج المجهز أن يُرجع بيانات أقل هضمًا ، ونتائج "مبعثرة" أكثر ، حيث يمكن للتعبئة "تثبيت" نموذج وجعله أكثر فائدة للمستخدمين النهائيين.