4 أساطير حول بدء مشروع التعلم الآلي

مؤلف: Laura McKinney
تاريخ الخلق: 3 أبريل 2021
تاريخ التحديث: 15 قد 2024
Anonim
ايش وظيفة كل البلوكات الجديدة في تحديث 1.14 للعبة ماينكرافت | IA Plays
فيديو: ايش وظيفة كل البلوكات الجديدة في تحديث 1.14 للعبة ماينكرافت | IA Plays

المحتوى


المصدر: monsitj / iStockphoto

يبعد:

تعرف على هذه الأساطير الخاصة بالتعلم الآلي للحصول على اتجاه أفضل لتبني المؤسسات.

لا ينبغي الاستخفاف به - لا شك أن البدء بمشروع تعلّم آلي يمكن أن يكون عملية شاقة للمديرين التنفيذيين الذين يرغبون في الاستفادة من اتجاه تكنولوجيا المعلومات هذا ولكن قد يفتقرون إلى المعرفة الداخلية لفهم فعليًا مزايا ومزايا ما الذي يجعل الآلة مشاريع التعلم القراد.

هنا سنتحدث عن بعض المفاهيم الخاطئة الأساسية التي لها تأثير على كيفية تطوير الشركات لتقنيات التعلم الآلي في سوق سريع التغير. (علوم البيانات هي عبارة عن شركات ميدانية أخرى تنفذها ، ولكن كيف يختلف الأمر عن ML؟ اكتشف في علم البيانات أو التعلم الآلي؟ هيريس كيفية اكتشاف الاختلاف.)

الأسطورة رقم 1: المزيد من البيانات دائمًا أفضل

هذا هو حقا واحدة من أكبر الخرافات من التعلم الآلي. يعتقد الناس أن المزيد من البيانات يعني المزيد من القدرة على التركيز على الأفكار القابلة للتنفيذ. في بعض الحالات ، يكونون على حق ، ولكن في أغلب الأحيان ، يكون العكس صحيحًا.


يكون المزيد من البيانات أفضل فقط إذا كانت البيانات ذات الصلة تضيف إلى الصورة بأكملها. يجب أن تتناسب البيانات مع نموذج التعلم الآلي ، أو يمكن أن يعاني البرنامج من شيء يسمى "التجاوز" حيث لا تظهر نتائج التعلم الآلي بالطرق التي ينبغي لها.

"سبب الأداء الضعيف في التعلم الآلي هو إما تجهيز البيانات أو تجهيزها" ، كتب جيسون براونلي في برنامج "التعلم الآلي".

في الإحصائيات ، يشير الملاءمة إلى مدى تقريبي لوظيفة مستهدفة. يعد هذا المصطلح جيدًا لاستخدامه في التعلم الآلي ، لأن خوارزميات التعلم الآلي الخاضعة للإشراف تسعى إلى تقريب وظيفة التعيين الأساسية غير المعروفة لمتغيرات الإخراج نظرًا لمتغيرات الإدخال. غالبًا ما تصف الإحصائيات جودة الملاءمة التي تشير إلى المقاييس المستخدمة لتقدير مدى مطابقة تقريب الوظيفة للوظيفة المستهدفة.

ببساطة ، يمكن أن تسبب البيانات الدخيلة مشاكل خطيرة. قبل إعداد مشروع التعلم الآلي للعمل ، يحتاج المديرون التنفيذيون وغيرهم من أصحاب المصلحة إلى تبادل الأفكار ومعرفة أنواع الأنواع المحددة من البيانات التي ستوفر الأساس الصحيح للمضي قدمًا.


الأسطورة رقم 2: البيانات التي لدينا هي جيدة بما فيه الكفاية

مرة أخرى ، تعمل عمليات التعلم الآلي على نماذج بيانات دقيقة للغاية. البيانات ليست جيدة بما فيه الكفاية ما لم تكن مستهدفة بشكل واضح ، وتم إعدامها أو تقييمها لحساب أشياء مثل التحيز والتباين.

No Bugs، No Stress - دليلك خطوة بخطوة لإنشاء برامج لتغيير الحياة دون تدمير حياتك

لا يمكنك تحسين مهارات البرمجة لديك عندما لا يهتم أحد بجودة البرنامج.

شيء واحد تسمع الكثير عنه في عالم التعلم الآلي هو التحيز غير المنضبط. يأخذ التعلم الآلي التحيزات البشرية لدينا ويضخمها عن طريق تغيير البيانات التي يحصل عليها البرنامج في نتائج محتملة.

هذا يعني أن البيانات يجب أن تكون مستهدفة بشكل إضافي للتعويض عن هذا الاتجاه.

الأسطورة رقم 3: إنه مبكر جدًا بالنسبة لنا!

تشعر بعض الشركات بالقلق من أنه من السابق لأوانه أن تدخل في التعلم الآلي. ولكن إذا تحدثت مع الكثير من المبدعين ورجال الأعمال ، فسيقولون إن هذا هو الوقت المناسب للدخول إلى الطابق الأرضي.

أينما كان اتجاه تكنولوجيا المعلومات هذا ، فأنت تريد أن تكون في المقدمة. في الطليعة هو أفضل موقف. في انتظار الحصول على كل شيء مثالي ، قد يكلفك العمل على المدى الطويل. (لمعرفة المزيد من الأسباب لعدم قيام الشركات بتطبيق ML حتى الآن ، راجع 4 حواجز طرق تعطل تبني التعلم الآلي.)

الأسطورة رقم 4: التعلم الآلي هو نفسه دائمًا

هناك بالتأكيد مجموعة واسعة من برامج التعلم الآلي.

بعضها ينطلق بشكل أساسي من خوارزمية واحدة - فهي مقروءة وشفافة رياضيا. يمكن للمهندسين معرفة مدى ارتباط البيانات الجارية بما يخرج من النظام.

عمليات التعلم الآلي الأخرى أكثر تفصيلاً وأصعب في الفهم. يمكن أن تصبح الشبكات العصبية المكونة من الخلايا العصبية الاصطناعية "صندوقًا أسودًا" حيث يواجه حتى أفضل المهندسين صعوبة في تتبع البيانات من خلال النظام أو شرح كيفية عمل الخوارزميات.

يقول أرييل بلايشر من مجلة Scientific American ، والذي يتناول جوانب من هذا اللغز الأساسي: "إن أكثر التقنيات قدرة - أي الشبكات العصبية العميقة - معروفة بغموض ، وتقدم القليل من الأدلة حول كيفية التوصل إلى استنتاجاتها".

تأخذ أدوات مثل شبكات حالة الارتداد فكرة الصندوق الأسود هذه وتعمل معها. وهذا يجعل الأمر أكثر صعوبة للتأكد تمامًا من كيفية عمل هذه الأنظمة.

الأسطورة رقم 5: تعلم الآلة يعمل فقط مع بيانات منظمة بعناية

في حين أن النقطة أعلاه حول البيانات الدقيقة لا تزال صحيحة ، هناك نوعان مختلفان من التعلم الآلي يعملان على أساس مختلف تمامًا.

هناك نوع واحد من التعلم الآلي يسمى التعلم الآلي الخاضع للإشراف يتعامل مع البيانات ذات العلامات - تحتوي بيانات التدريب بالفعل على علامات لوصف خصائصها وفئاتها.

يسمى نوع آخر من التعلم الآلي التعلم غير الخاضع للإشراف. إنه يتعامل مع البيانات غير المسماة.

يأخذ تعلم الآلة غير الخاضع للرقابة البيانات الأولية ، ويقوم الجهاز بتحليلها بشكل أساسي للخصائص ويجمعها في فئات بمفردها. هناك الكثير من الإمكانات في كلا النوعين من التعلم الآلي ، ولكن من الأسهل إعداد برنامج يحتوي على بيانات ذات علامات للتعلم الآلي الخاضع للإشراف. تعلم الآلة بدون رقابة هو نوع من المياه المجهولة للعديد من الشركات.

هذه هي بعض الاعتبارات التي قد تكون لديكم ، والمفاهيم الخاطئة حول التعلم الآلي التي يمكن أن تسبب مشاكل في اعتماد المؤسسات. نأمل أن يكون هذا قد ساعد في توضيح بعض الالتباسات حول مشاريع التعلم الآلي.