استخراج تحويل الحمل (ETL)

مؤلف: Randy Alexander
تاريخ الخلق: 28 أبريل 2021
تاريخ التحديث: 1 يونيو 2024
Anonim
3 - ETL Tutorial | Extract Transform and Load
فيديو: 3 - ETL Tutorial | Extract Transform and Load

المحتوى

تعريف - ماذا يعني تحميل تحويل الحمل (ETL)؟

استخراج تحويل الحمل (ETL) هي عملية الاستخراج والتحويل والتحميل أثناء استخدام قاعدة البيانات ، ولكن بشكل خاص أثناء استخدام تخزين البيانات. ويشمل العمليات الفرعية التالية:


  • استرداد البيانات من مصادر تخزين البيانات الخارجية أو نقلها
  • تحويل البيانات إلى تنسيق يمكن فهمه ، حيث يتم عادةً تخزين البيانات مع رمز اكتشاف الأخطاء وتصحيحها لتلبية الاحتياجات التشغيلية
  • نقل البيانات وتحميلها إلى الطرف المتلقي

مقدمة إلى Microsoft Azure و Microsoft Cloud | من خلال هذا الدليل ، سوف تتعرف على الحوسبة السحابية التي تدور حولها وكيف يمكن أن يساعدك Microsoft Azure على ترحيل عملك وإدارته من السحابة.

تيكوبيديا تشرح استخراج تحويل الحمل (ETL)

تركز المرحلة الأولى من عملية ETL على استرداد البيانات من مصدر التخزين. معظم مشاريع تخزين البيانات تدمج البيانات الواردة من أنظمة المصدر المختلفة. يجوز لكل نظام فردي استخدام مؤسسة أو تنسيق بيانات منفصل. هياكل مصدر البيانات الشائعة هي قواعد البيانات العلائقية وملفات البيانات الخالصة. قد تتضمن أيضًا أنماط قواعد البيانات غير العلائقية مثل أنظمة إدارة المعلومات أو هياكل البيانات الأخرى مثل طريقة الوصول إلى التخزين الظاهري (VSAM) أو طريقة الوصول التسلسلي المفهرسة (ISAM). يمكن أن تتضمن مصادر البيانات مصادر خارجية مثل البيانات الواردة من الإنترنت أو من خلال نظام المسح.


تستخدم مرحلة التحويل سلسلة من القواعد أو العمليات لاسترداد البيانات الخالصة من المصدر لتسليم البيانات في شكلها النهائي للمعالجة في الطرف المتلقي. تحتاج بعض مصادر البيانات إلى معالجة بيانات قليلة للغاية أو لا تحتاج إلى أي معالجة. في بعض الأحيان ، قد يكون إجراء تحويل واحد أو أكثر أمرًا بالغ الأهمية لمطابقة متطلبات الأعمال والمتطلبات الفنية لقاعدة البيانات الهدف.

تهدف مرحلة التحميل أو الإرسال إلى نقل البيانات إلى الطرف المتلقي ، والذي من المحتمل أن يكون تخزين البيانات. وفقًا لاحتياجات التطبيق ، قد تكون هذه العملية بسيطة جدًا أو معقدة للغاية. قد تستبدل بعض طرق تخزين البيانات البيانات القديمة بالبيانات التراكمية. يتم عادةً تحديث البيانات المستخرجة على أساس دوري.