7 خطوات لتعلم استخراج البيانات وعلوم البيانات

مؤلف: Eugene Taylor
تاريخ الخلق: 12 أغسطس 2021
تاريخ التحديث: 12 قد 2024
Anonim
كورس تعليم تحليل البيانات كامل
فيديو: كورس تعليم تحليل البيانات كامل

المحتوى


المصدر: بول فليت / Dreamstime.com

يبعد:

من الأفضل تعلم علم البيانات من خلال العمل ، لكن الأساس الجيد للإحصاءات والتعلم الآلي مهم للغاية.

سئلت كثيرًا عن كيفية تعلم استخراج البيانات وعلوم البيانات. هنا هو ملخص بلدي.

يمكنك تعلم استخراج البيانات وعلوم البيانات بأفضل طريقة ممكنة ، لذا ابدأ في تحليل البيانات بأسرع ما يمكن! ومع ذلك ، لا تنس أن تتعلم النظرية ، لأنك بحاجة إلى أساس إحصائي وتعلم آلي جيد لفهم ما تفعله ولإيجاد شذرات حقيقية ذات قيمة في ضوضاء البيانات الضخمة.

فيما يلي سبع خطوات لتعلم استخراج البيانات وعلوم البيانات. على الرغم من ترقيمها ، يمكنك القيام بها بالتوازي أو بترتيب مختلف.

  1. اللغات: تعلم R و Python و SQL
  2. الأدوات: تعلم كيفية استخدام أدوات استخراج البيانات والتصور
  3. الكتب: قراءة الكتب التمهيدية لفهم الأساسيات
  4. تعليم: شاهد ندوات عبر الإنترنت ، خذ دورات ودرس شهادة أو شهادة في علم البيانات (اقرأ المزيد في Ben Loricas كيفية رعاية عالم البيانات.)
  5. البيانات: تحقق من موارد البيانات المتاحة وابحث عن شيء هناك
  6. المسابقات: المشاركة في مسابقات استخراج البيانات
  7. التفاعل مع علماء البيانات الآخرين ، عبر الشبكات الاجتماعية والمجموعات والاجتماعات

في هذه المقالة ، يمكنني استخدام التنقيب عن البيانات وعلوم البيانات بالتبادل. انظر العرض التقديمي ، نظرة عامة حول صناعة التحليلات ، حيث أنظر إلى تطور وشعبية المصطلحات المختلفة مثل الإحصاءات واكتشاف المعرفة واستخراج البيانات والتحليلات التنبؤية وعلوم البيانات والبيانات الضخمة.


1. تعلم اللغات

وجد استطلاع حديث لـ KDnuggets أن اللغات الأكثر شعبية لاستخراج البيانات هي R و Python و SQL. هناك العديد من الموارد لكل منها ، على سبيل المثال:

  • كتاب إلكتروني مجاني عن علوم البيانات باستخدام R
  • الشروع في العمل مع بيثون لعلوم البيانات
  • بيثون لتحليل البيانات: أدوات رشيقة لبيانات العالم الحقيقي
  • بيثون الذي لا غنى عنه: مصادر البيانات لعلوم البيانات
  • W3 مدارس التعلم مزود

2. الأدوات: برامج استخراج البيانات وعلوم البيانات والتصور

هناك العديد من أدوات استخراج البيانات للمهام المختلفة ، ولكن من الأفضل معرفة كيفية استخدام مجموعة استخراج البيانات التي تدعم عملية تحليل البيانات بأكملها. يمكنك البدء باستخدام أدوات مفتوحة المصدر (مجانية) مثل KNIME و RapidMiner و Weka.

ومع ذلك ، بالنسبة للعديد من وظائف التحليلات ، تحتاج إلى معرفة SAS ، وهي الأداة التجارية الرائدة والمستخدمة على نطاق واسع. تشمل برامج التحليل والبيانات الشائعة الأخرى MATLAB و StatSoft STATISTICA و Microsoft SQL Server و Tableau و IBM SPSS Modeler و Rattle.


No Bugs، No Stress - دليلك خطوة بخطوة لإنشاء برامج لتغيير الحياة دون تدمير حياتك

لا يمكنك تحسين مهارات البرمجة لديك عندما لا يهتم أحد بجودة البرنامج.

التصور هو جزء أساسي من أي تحليل البيانات. تعرّف على كيفية استخدام Microsoft Excel (جيد للعديد من المهام الأبسط) ، ورسومات R ، (وخاصة ggplot2) ، وكذلك Tableau - حزمة ممتازة للتصور. تشمل أدوات التصور الجيدة الأخرى TIBCO Spotfire و Miner3D.

3. الكتب

هناك العديد من كتب استخراج البيانات وعلوم البيانات المتاحة ، ولكن يمكنك التحقق من هذه:

  • تعدين البيانات وتحليلها: المفاهيم الأساسية والخوارزميات ، تنزيل PDF مجانًا (مسودة) ، بقلم محمد زكي وفاغنر ميرا جونيور
  • تعدين البيانات: أدوات وأساليب تعلم الآلة العملية ، من إعداد إيان ويتن وإيبي فرانك ومارك هول ، من مؤلفي Weka ، واستخدام Weka على نطاق واسع في الأمثلة
  • عناصر التعلم الإحصائي ، استخراج البيانات ، الاستدلال والتنبؤ ، تأليف تريفور هاستي ، روبرت تيبشيراني ، جيروم فريدمان. مقدمة رائعة للالموجهة رياضيا
  • LIONbook: التعلم والتحسين الذكي ، بقلم روبرتو باتيتي وماورو بروناتو ، متاحان مجانًا على الويب ، فصل تلو الآخر
  • كتاب تعدين مجموعات البيانات الضخمة ، بقلم أ. راجارامان ، ج. أولمان
  • StatSoft Electronic Statistics book (free) ، يتضمن العديد من مواضيع استخراج البيانات

4. التعليم: ندوات عبر الإنترنت ، دورات ، شهادات ودرجات

يمكنك البدء بمشاهدة بعض الندوات عبر الإنترنت والبث عبر الإنترنت المجانية حول أحدث الموضوعات في التحليلات والبيانات الضخمة واستخراج البيانات وعلوم البيانات.

هناك أيضًا العديد من الدورات التدريبية عبر الإنترنت ، قصيرة وطويلة ، والعديد منها مجاني. (انظر دليل التعليم KDnuggets على الانترنت.)

تحقق على وجه الخصوص من هذه الدورات:

  • التعلم الآلي ، في كورسيرا ، يدرسه أندرو نغ
  • التعلم من البيانات في EDX ، قام بتدريسه الأستاذ ياسر أبو مصطفى من معهد كاليفورنيا للتكنولوجيا
  • فتح دورة عبر الإنترنت في علوم البيانات التطبيقية ، من Syracuse iSchool
  • تعدين البيانات مع Weka ، دورة مجانية على الإنترنت
  • تحقق أيضًا من الشرائح المجانية عبر الإنترنت من "دورة تعدين البيانات" ، وهي عبارة عن دورة تمهيدية لفصل دراسي طويل في استخراج البيانات

أخيرًا ، فكر في الحصول على شهادات في استخراج البيانات وعلوم البيانات أو الشهادات المتقدمة ، مثل درجة الماجستير في علم البيانات.

5. البيانات

ستحتاج إلى بيانات لتحليلها - راجع دليل مجموعات بيانات KDnuggets لاستخراج البيانات ، بما في ذلك:

  • مواقع الحكومة ، الفيدرالية ، الولاية ، المدينة ، مواقع البيانات المحلية والعامة والبوابات
  • واجهات برمجة التطبيقات للبيانات والمحاور والأسواق والمنصات والبوابات ومحركات البحث
  • مجموعات البيانات العامة المجانية

6. المسابقات

مرة أخرى ، سوف تتعلم أفضل من خلال العمل ، لذلك المشاركة في مسابقات Kaggle. ابدأ بمسابقات المبتدئين ، مثل التنبؤ باستخدام Titanic Survival باستخدام Machine Learning.

7. التفاعل: الاجتماعات والمجموعات والشبكات الاجتماعية

يمكنك الانضمام إلى العديد من مجموعات الأقران. راجع أفضل 30 مجموعة من مجموعات LinkedIn للتحليلات والبيانات الضخمة واستخراج البيانات وعلوم البيانات.

AnalyticBridge هو مجتمع نشط للتحليلات وعلوم البيانات.

يمكنك حضور بعض الاجتماعات والمؤتمرات العديدة حول التحليلات والبيانات الضخمة واستخراج البيانات وعلوم البيانات واكتشاف المعرفة.

أيضا ، النظر في الانضمام إلى ACM SIGKDD ، الذي ينظم مؤتمر KDD السنوي - المؤتمر البحثي الرائد في هذا المجال.

هذه المادة هي القصب من KDNuggets.com. تم استخدامه بإذن من المؤلف.