12 نصائح أساسية لتعلم علوم البيانات

مؤلف: Laura McKinney
تاريخ الخلق: 3 أبريل 2021
تاريخ التحديث: 1 تموز 2024
Anonim
علم البيانات - data science كيف تتعلم
فيديو: علم البيانات - data science كيف تتعلم

المحتوى


المصدر: Artinspiring / Dreamstime.com

يبعد:

من الواضح أن علماء البيانات يحتاجون إلى مهارات قوية في الرياضيات والترميز ، ولكن التواصل والمهارات اللينة الأخرى ضرورية أيضًا للنجاح.

يصنف عالم البيانات كأفضل وظيفة لعام 2019 في أمريكا على Glassdoor. نظرًا لأن متوسط ​​الراتب الأساسي هو 108،000 دولارًا وبمعدل رضاء وظيفي قدره 4.3 من أصل 5 ، بالإضافة إلى عدد لا يستهان به من الفرص المتاحة ، فإن هذا ليس مفاجئًا. السؤال هو: ما الذي يتعين على المرء فعله للحصول على المسار الصحيح للتأهل لهذه الوظيفة؟

لمعرفة ذلك ، بحثنا عن النصيحة المقدمة لأولئك الذين يسعون للحصول على هذا المسار الوظيفي. الكثير يأتي إلى المهارات الصعبة في الترميز والرياضيات. لكن هذا الحساب القوي وحده لا يقطعه. يحتاج علماء البيانات الناجحون أيضًا إلى أن يكونوا قادرين على التحدث إلى رجال الأعمال بشروطهم الخاصة ، الأمر الذي يستدعي القدرات المرتبطة بالمهارات الناعمة والقيادة. (لمعرفة المزيد حول واجبات عالم البيانات ، راجع الدور الوظيفي: عالم بيانات.)

بناء المؤسسة التعليمية: ثلاث نصائح أساسية

يؤكد دريس زان ، عالم البيانات في أكاديمية علوم البيانات في مدينة نيويورك ، على الحاجة إلى مؤسسة تعليمية تتضمن أساسيات القدرة على الترميز والرياضيات:


  1. ص / بيثون + مزود. إذا لم يكن لديك مهارات الترميز ، فأنت بحاجة إلى الكثير من قوة التواصل ومجالات أخرى لتعزيز هذا العجز. لقد رأيت علماء البيانات ذوي الرياضيات الضعيفة وتجربة مجال قليلة ولكنهم دائمًا ما يكونوا قادرين على القيام بالترميز. بيثون مثالية ولكن آر هو أداة تراجع كبيرة. من الأفضل أن يكون كلاهما في ترسانتك. مزود هو أيضا مهم للغاية بالنسبة لمحلل البيانات.

  2. مهارات الرياضيات قوية. وجود فهم جيد لعدد قليل من الطرق الشائعة الاستخدام: النماذج الخطية المعممة ، وشجرة القرارات ، والوسائل K ، والاختبارات الإحصائية أفضل من وجود صورة واسعة لمختلف النماذج أو التخصص مثل RNN.

هذه هي المهارات الأساسية للبناء عليها ، على الرغم من أن بعض الخبراء يضيفون إليها. على سبيل المثال ، تتضمن قائمة KDnuggets مكونات الترميز التي ذكرها Zhan وتضيف على بعض الأشياء المفيدة الأخرى التي يجب معرفتها على الجانب التقني ، بما في ذلك Hadoop platform Apache Spark ، وتصور البيانات ، والبيانات غير المهيكلة ، والتعلم الآلي ، والتعلم الآلي.

لكن إذا أخذنا إشاراتنا من دراسة استقصائية حول الأدوات الأكثر استخدامًا التي تم تحديدها للاستخدام في الحياة الحقيقية من خلال مسح Kaggle ، فإننا نحصل على نتائج مختلفة إلى حد ما. كما ترون من الرسم البياني للخيارات الخمسة عشر الأولى أدناه ، فإن Python و R و SQL تصنع بسهولة المراكز الثلاثة الأولى ، لكن الرابع هو Jupyter notebook ، يليه TensorFlow ، و Amazon Web Services ، و Unix shell ، و Tableau ، و C / C ++ ، و NoSQL ، MATLAB / Octave و Java ، كل ذلك قبل Hadoop و Spark. إضافة أخرى قد تفاجئ الناس ، هي Microsoft Excel Data Mining.


الصورة من باب المجاملة Kaggle

تتضمن قائمة KDnuggets أيضًا نصيحة بخصوص التعليم الرسمي. يمتلك معظم علماء البيانات شهادات متقدمة: 46 في المائة يحملون شهادات الدكتوراه ، و 88 في المائة يحملون درجة الماجستير على الأقل. يتم تقسيم الدرجات الجامعية التي يحملونها عمومًا بين المجالات ذات الصلة. حوالي الثلث في الرياضيات والإحصاء ، وهو الأكثر شعبية في هذا المسار الوظيفي. التالي الأكثر شعبية هو درجة علوم الكمبيوتر ، التي حصلت عليها 19 في المئة ، والهندسة ، واختيار 16 في المئة. بالطبع ، لا تدرس الأدوات التقنية الخاصة بعلم البيانات في برامج الدرجات العلمية بل في معسكرات التمهيد المتخصصة أو من خلال الدورات التدريبية عبر الإنترنت.

أكثر من الدورات: اثنان نصائح أخرى

ينصح هانك يون ، مساعد باحث في قسم الرئة في طب وايل كورنيل وطالب في أكاديمية علوم بيانات مدينة نيويورك ، علماء البيانات الطموحين بالتخطيط حول ما سيعملون عليه وإيجاد معلمه. هو قال:

No Bugs، No Stress - دليلك خطوة بخطوة لإنشاء برامج لتغيير الحياة دون تدمير حياتك

لا يمكنك تحسين مهارات البرمجة لديك عندما لا يهتم أحد بجودة البرنامج.

لا ترتكب الخطأ الذي ارتكبته عندما أخبرت نفسك أنك تعرف علم البيانات لأنك درست دورة وحصلت على شهادة. هذه بداية رائعة ، ولكن عندما تبدأ الدراسة ، فضع مشروعًا في الاعتبار. ثم ابحث عن مرشد في هذا المجال وابدأ مشروع العاطفة على الفور! عندما تكون جديدًا ، لا تعرف ما لا تعرفه ، لذا فهو يساعد عندما يكون هناك شخص ما لإرشادك إلى ما هو مهم بالنسبة لك وما هو غير ذلك. لا تريد أن تقضي وقتًا طويلاً في الدراسة دون أن تظهر أي شيء مقابل ذلك!

معرفة الأداة التي يمكنك إخراجها من صندوق الأدوات: نصيحة للبقاء في مقدمة المنحنى

بالنظر إلى التباين في ترتيب أدوات علم البيانات ، فقد يشعر البعض بالحيرة إزاء ما يجب التركيز عليه. يعالج سيليست فراليك ، كبير علماء البيانات في شركة برامج الأمان McAfee ، المشكلة في مقال لمديري المعلومات (CIO) ينظر إلى المهارات الأساسية لعالم البيانات ، معلنًا ، "يحتاج عالم البيانات إلى البقاء أمام المنحنى في البحث ، وكذلك فهم التكنولوجيا التي يجب تطبيقها عند ذلك. "هذا يعني عدم إغراء" مثير "والجديد ، عندما تكون المشكلة الفعلية" تتطلب شيئًا أكبر بكثير. "إن إدراك التكلفة الحاسوبية للنظام الإيكولوجي ، والتفسير ، والكمون ، وعرض النطاق الترددي ، وظروف حدود النظام الأخرى - وكذلك نضج العميل - يساعد في حد ذاته عالم البيانات على فهم التكنولوجيا التي يجب تطبيقها."

المهارات الأساسية الأساسية: ستة نصائح أخرى

تتعلق النقطة التي يجلبها Fralick بالمهارات غير الفنية التي تتطلبها وظيفة عالم البيانات. لهذا السبب تتضمن قائمة KDnuggets الأربعة: الفضول الفكري والعمل الجماعي ومهارات الاتصال وفطنة العمل. قام زان أيضًا بتضمين المهارات الأساسية في نصائحه لعلماء البيانات ، وتحديد "مهارات الاتصال" مثل KDnuggets ، ولكن باستخدام "خبرة المجال" بدلاً من "فطنة العمل". وأيا كان يطلق عليه ، فإنه يشير إلى التطبيق العملي لعلوم البيانات على اعمال. (لمعرفة المزيد حول مهارات الاتصال ، راجع أهمية مهارات الاتصال للمهنيين التقنيين.)

قدمت أوليفيا بار رود دورها الخاص في هذا الموضوع ، مضيفة بمهاراتين أكثر مرونة ، مع التركيز على دور الإبداع ، مؤكدة ، "أعتقد أن علم البيانات كفن بقدر العلم" ، وهو أمر يتطلب الاعتماد على قوة كلا الجانبين من الدماغ. يتحدث الكثير من الناس عن علم البيانات كمهنة يستخدمون الدماغ الأيسر بشكل أساسي. لقد وجدت أنه لكي ينجح ، يجب على علماء البيانات استخدام عقولهم بالكامل. "

وأوضحت أن التقدم في هذا المجال لا يتطلب الكفاءة الفنية فحسب ، بل الإبداع والرؤية اللازمة للقيادة:

يمكن أن تكون معظم المهام اليسرى / الدماغية مؤتمتة أو خارجية. لتقديم ميزة تنافسية كعلماء بيانات ، يجب أن نكون قادرين على التعرف على الأنماط وتوليف كميات كبيرة من المعلومات باستخدام كلا الجانبين من الدماغ. ويجب أن نكون مفكرين مبتكرين. العديد من أفضل النتائج ناتجة عن تكامل الدماغ الأيمن والأيسر.

وأكدت أيضًا على أهمية توصيل الرؤية بوضوح:

كعلماء بيانات ، هدفنا هو استخدام البيانات لمساعدة عملائنا على زيادة أرباحهم. معظم المديرين التنفيذيين لا يفهمون ما نقوم به أو كيف نفعل ذلك. لذلك نحن بحاجة إلى التفكير كقادة وإبلاغ نتائجنا وتوصياتنا بلغة يفهمها ويثق بها أصحاب المصلحة لدينا.

البيانات دزينة

تتضمن النصائح الرئيسية عددًا أكبر من الأدوات والمهارات والقدرات التقنية ، بالإضافة إلى صفات أقل قابلة للقياس الكمي مثل الاستعداد للإبداع والقيادة. في النهاية ، ليست مجرد لعبة أرقام. نظرًا لأن علم البيانات لا يقتصر فقط على إنشاء نماذج في فراغ ، بل الخروج بتطبيقات عملية لحل مشاكل الحياة الحقيقية للشركات ، فإن أولئك الذين سينجحون في هذا المجال لا يحتاجون إلى إتقان التكنولوجيا فحسب ، بل لمعرفة مجال أعمالهم وفهم احتياجاتهم. مختلف أعضاء الفريق في العمل.