تعزيز التعلم يمكن أن يعطي سبين ديناميكي لطيف للتسويق

مؤلف: Roger Morrison
تاريخ الخلق: 1 شهر تسعة 2021
تاريخ التحديث: 9 قد 2024
Anonim
تعزيز التعلم يمكن أن يعطي سبين ديناميكي لطيف للتسويق - تقنية
تعزيز التعلم يمكن أن يعطي سبين ديناميكي لطيف للتسويق - تقنية

المحتوى



المصدر: Juliatimchenko / Dreamstime.com

يبعد:

تعلم التعزيز هو مجموعة فرعية من الذكاء الاصطناعي والتعلم الآلي الذي يمكنه التنبؤ بالنتائج ومساعدة المستخدمين على اتخاذ قرارات أفضل.

يبحث المسوقون باستمرار عن حلول قابلة للتطوير وذكية عند محاولة الحصول على ميزة في ظروف التسويق المتزايدة المنافسة. لا عجب أن الذكاء الاصطناعي (الذكاء الاصطناعي) والتعلم الآلي (ML) يتم اعتمادهما بشكل جماعي من قبل العلامات التجارية ومنظمات التسويق الخاصة بها. (لمعرفة المزيد عن أساسيات ML ، راجع Machine Learning 101.)

بالنسبة للمبتدئين ، يمكن اعتبار الذكاء الاصطناعي بشكل عام تقنية عندما يقوم الكمبيوتر بأتمتة المهام المحددة التي قد يقوم بها الإنسان. التعلم الآلي ، كمجال وظيفي داخل الذكاء الاصطناعى ، هو عندما يتم إعطاء الكمبيوتر هدفًا نهائيًا ، لكنه يحتاج إلى حساب أفضل طريق من تلقاء نفسه.

اليوم ، نشاهد هذه التقنيات - خاصةً التعلم الآلي - يتم نشرها في العديد من مجالات التسويق ، بما في ذلك الكشف عن الاحتيال في الإعلان والتنبؤ بسلوك المستهلك وأنظمة التوصية والتخصيص الإبداعي وغير ذلك الكثير.


على الرغم من أن كل هذا جيد وجيد ، إلا أن هناك تقنية جديدة للفروع ، والتي بالنسبة إلى المسوقين ، ستوفر حقًا الطلب الذي يخلقه التعلم الآلي. يطلق عليه "التعلم التعزيز" (RL).

ما هو التعلم التعزيز؟

التغيير خطوة من ML إلى RL هو أكثر من مجرد حرف. تتضمن معظم المهام التي تم تسليمها إلى التعلم الآلي استخدام خطوة واحدة ، مثل "التعرف على هذه الصورة" أو "فهم محتوى الكتاب" أو "التقاط الاحتيال". بالنسبة إلى المسوِّق ، فإن هدف العمل مثل "جذب المستخدمين والاحتفاظ بهم وإشراكهم" هو بطبيعتها متعددة الخطوات وطويلة الأجل ، لا يتحقق بسهولة مع التعلم الآلي.

هذا هو المكان الذي يأتي فيه تعلم التعزيز. خوارزميات RL تدور حول تحسين رحلة متغيرة ومتغيرة باستمرار - حيث تحدث مشاكل ديناميكية. من خلال استخدام "دالة المكافأة" الرياضية لحساب نتائج كل التقليب ، يمكن أن يرى RL في المستقبل ويقوم بالاتصال الصحيح.

اليوم ، يمكن رؤية أفضل النماذج لهذه التقنية المتطورة في الألعاب والسيارات ذاتية القيادة. عندما تغلب نظام AlphaGo من Google على أفضل لاعب في العالم في لعبة Go العام الماضي ، كانت الصلصة السرية هي التعلم المعزز. في حين أن الألعاب وضعت قواعد ، فإن خيارات اللاعب للاتجاه نحو النصر تتغير ديناميكيًا بناءً على حالة اللوحة. مع التعلم المعزز ، يقوم النظام بحساب جميع التباديل المحتملة التي قد تتغير بناءً على كل خطوة تالية.


وبالمثل ، تسير سيارة ذاتية القيادة في رحلة تظل فيها قواعد الطريق وموقع الوجهة ثابتة ، ولكن المتغيرات على طول الطريق - من المشاة إلى حواجز الطرق - راكبي الدراجات - تتغير ديناميكيًا. لهذا السبب ، تستخدم OpenAI ، المؤسسة التي أسسها Tesla's Elon Musk ، خوارزميات RL المتقدمة لسياراتها.

No Bugs، No Stress - دليلك خطوة بخطوة لإنشاء برامج لتغيير الحياة دون تدمير حياتك


لا يمكنك تحسين مهارات البرمجة لديك عندما لا يهتم أحد بجودة البرنامج.

آلات للمسوقين

ماذا يعني أي من هذا بالنسبة للمسوقين؟

تنشأ التحديات الأساسية للعديد من المسوقين من حقيقة أن حالة العمل تتغير طوال الوقت. يمكن أن تصبح استراتيجية الحملة الفائزة غير مواتية بمرور الوقت ، في حين أن الاستراتيجية القديمة يمكن أن تكتسب قوة جديدة. RL هي خطوة نحو محاكاة الذكاء البشري الحقيقي حيث نتعلم من نجاح و / أو فشل نتائج متعددة ، ونشكل استراتيجية رابحة للمستقبل. اسمحوا لي أن أقدم بعض الأمثلة:

1. تعزيز مشاركة المستخدم

دعنا نركز على مشاركة العملاء في سلسلة مطاعم ، وهدفنا مضاعفة هذا الرقم بمقدار عشرة أضعاف خلال العام المقبل. اليوم ، قد تتضمن الحملة التسويقية تحية عيد ميلاد مع عرض خصم ، وربما حتى بناءً على تفضيلات الطعام. هذا هو التفكير الخطي حيث حدد المسوق نقطة البداية والنهاية.

في عالم مزدحم ، تتغير حياة العملاء باستمرار في الوقت الفعلي - وأحيانًا يكونون أكثر انشغالًا ، وأحيانًا أقل. في التعلم المعزز ، يقوم النظام باستمرار بإعادة معايرة أي التكتيكات في مستودع التسويق ، في أي لحظة ، تكون لديه أفضل فرصة لتحريك المستلم نحو الهدف النهائي وهو إشراك 10x.

2. تخصيص ميزانية ديناميكية

الآن تخيل سيناريو الإعلان الذي لديك ميزانية 1 مليون دولار وتحتاج إلى إنفاق بعض كل يوم حتى نهاية الشهر ، وتخصيصها عبر أربع قنوات مختلفة: التلفزيون ، والترويج الولاء ، وجوجل. كيف يمكنك التأكد من إنفاق الميزانية بالطريقة المثلى؟ تعتمد الإجابة على اليوم والمستخدمين المستهدفين وسعر المخزون ومجموعة من العوامل الأخرى.

في التعلم المعزز ، ستستخدم الخوارزميات بيانات نتائج الإعلانات التاريخية لكتابة وظائف المكافآت التي تسجل بعض قرارات الإنفاق. ولكنه يفسر أيضًا عوامل في الوقت الفعلي مثل التسعير واحتمال الاستقبال الإيجابي من عضو الجمهور المستهدف. من خلال التعلم التكراري ، سيتغير تخصيص الإنفاق الإعلاني طوال الشهر ديناميكيًا. على الرغم من تحديد الهدف النهائي ، فسيخصص RL ميزانية في أفضل طريقة ممكنة من خلال جميع السيناريوهات. (لمعرفة المزيد عن الذكاء الاصطناعي في التسويق ، راجع كيف ستحدث الذكاء الاصطناعي ثورة في صناعة المبيعات.)

قريبا

يقر تعلم التعزيز بالتعقيد ويعترف بأن الأشخاص غير متجانسين ويحسبون هذه الحقائق ، مما يحسن كل إجراء تالي مع مرور الوقت مع تغير أجزاء لوحة اللعبة الخاصة بك حوله.

تعلم التعزيز لا يزال إلى حد كبير الحفاظ على المشاريع البحثية والجهات الرائدة في تبنيها. كان مفهوم الرياضيات وتقنية موجودة منذ أكثر من 40 عامًا ، لكن لم يكن من الممكن نشرها حتى وقت قريب نسبيًا ، وذلك بفضل ثلاثة اتجاهات:

  1. انتشار قوة الحوسبة من خلال وحدات معالجة الرسومات عالية الطاقة (GPUs).

  2. توفر الحوسبة السحابية طاقة المعالج المتطورة بجزء بسيط من تكلفة شراء وحدات معالجة الرسومات نفسها ، مما يسمح للأطراف الخارجية باستئجار وحدة معالجة الرسومات لتدريب طراز RL الخاص بهم لعدة ساعات أو أيام أو أسابيع بسعر منخفض نسبيا.

  3. تحسن في الخوارزميات العددية أو الاستدلال الذكية. بعض الخطوات العددية الحرجة في خوارزمية RL أصبحت الآن قادرة على الالتقاء بوتيرة أسرع بكثير. بدون هذه الحيل العددية السحرية ، فإنها لا تزال غير ممكنة حتى مع أجهزة الكمبيوتر القوية اليوم.

التفكير الاكبر

كل هذا يعني أن القوى الجديدة لتعلم التعزيز ستتوفر قريبًا على نطاق واسع للعلامات التجارية والمسوقين. ومع ذلك ، فإن احتضانها يتطلب نقلة في التفكير. بالنسبة لمدير التسويق ، تعني هذه التكنولوجيا القدرة على رفع أيديهم عن عجلة القيادة.

كل عمل له هدف ، ولكن عندما تكون في عمق الخنادق ، يمكن أن تصبح الإجراءات اليومية المتخذة تجاه هذا الهدف غامضة. الآن ستسمح تقنية RL لصناع القرار بتحديد الهدف ، مع وجود ثقة أكبر في أن الأنظمة ستحدد مسارها الأفضل نحو ذلك.

في الإعلانات ، على سبيل المثال ، في هذه الأيام ، يدرك العديد من الناس أن المقاييس مثل نسبة النقر إلى الظهور (CTR) هي مجرد وكلاء لنتائج الأعمال الحقيقية ، ويتم حسابها فقط لأنها قابلة للعد. سوف تعمل أنظمة التسويق المعتمدة على RL على إلغاء التأكيد على مثل هذه المقاييس الوسيطة وجميع الأحمال الثقيلة المرتبطة بها ، مما يسمح لأصحاب العمل بالتركيز على الأهداف.

سيتطلب ذلك من الشركات التفكير في مشكلاتها الكبيرة بطريقة أكثر استباقية وطويلة الأجل. عندما تنضج التكنولوجيا ، سوف يحققون هدفهم.

الطريق إلى التبني

تعلم التعزيز ليس جاهزًا للاستخدام الكامل من قبل العلامات التجارية ؛ ومع ذلك ، يجب أن يأخذ المسوقون الوقت الكافي لفهم هذا المفهوم الجديد الذي يمكن أن يحدث ثورة في الطريقة التي تعمل بها العلامات التجارية في التسويق ، مما يحقق بعض الوعود المبكرة للتعلم الآلي.

عندما تصل الطاقة ، ستأتي في برنامج تسويقي بواجهة مستخدم ، لكن المهام المطلوبة بواسطة هذا البرنامج سيتم تبسيطها بشكل جذري. بالنسبة للموظفين ، سيكون هناك مفاتيح أقل تحريكًا وأرقام إدخال ، بالإضافة إلى قراءة تقارير تحليلات أقل والعمل بها. خلف لوحة القيادة ، ستقوم الخوارزمية بمعالجة معظم ذلك.

من غير المحتمل أن تتطابق RL مع الذكاء البشري خارج البوابة مباشرة. تعتمد سرعة تطوره على الملاحظات والاقتراحات المقدمة من المسوقين. يجب علينا التأكد من أننا نطلب من جهاز الكمبيوتر حل المشكلة الصحيحة ، ومعاقبتها عندما لا يتم حلها. يبدو وكأنه كيف تعلم طفلك ، أليس كذلك؟