الزخم إلى الأمام: الانتقال إلى ما وراء التقليدية

مؤلف: Louise Ward
تاريخ الخلق: 6 شهر فبراير 2021
تاريخ التحديث: 26 يونيو 2024
Anonim
learn wing chun (chum kiu) randy williams
فيديو: learn wing chun (chum kiu) randy williams

يبعد: يناقش المضيف إريك كافانوغ الابتكارات في تكنولوجيا قواعد البيانات مع الخبراء ديز بلانشفيلد وروبن بلور وبيرت سكالزو.



أنت لم تسجل الدخول حاليًا. يرجى تسجيل الدخول أو التسجيل لمشاهدة الفيديو.

إريك كافانا: سيداتي سادتي ، إنه الأربعاء ، الساعة الرابعة بالتوقيت الشرقي. أنا في نيو أورليانز ، الصيف قادم ، هذا يعني أن الجو حار! لقد حان الوقت لشركة Hot Technologies ، نعم بالفعل ، نعم بالفعل. اسمي إريك كافانا ، سأكون مضيفك. سأقوم بركل الكرة هنا من أجل Hot Technologies. الموضوع اليوم هو "الزخم الأمامي: الانتقال إلى ما بعد التقليدية". الناس ، لدينا ثلاثة خبراء في قاعدة البيانات على الهاتف اليوم ، لذلك فإن أي أسئلة لديك ، منهم الصعبة ، لا تخجل. لدينا مجموعة من المحتوى الجيد اصطف لك اليوم. هناك بقعة لك حقا ، بما فيه الكفاية عني. بالطبع ، هذا العام حار. نتحدث عن التقنيات الساخنة في هذا المعرض ، وهي شراكة مع أصدقائنا من Techopedia. ونحن ننتقل إلى أساس إدارة المعلومات اليوم ، وهي بالطبع قاعدة البيانات. سنتحدث عن كيف وصلنا إلى هنا ، وما يحدث اليوم ، وما يحدث في المستقبل. الكثير من الأشياء المثيرة للاهتمام للغاية يحدث.


من الواضح أن لدينا بعض الابتكار الجاد في مساحة قاعدة البيانات. كان نوعًا من الهدوء لفترة من الوقت. إذا كنت تتحدث مع بعض المحللين في مجال الأعمال التجارية ، فأنا سأقول على الأرجح من عام مثل 2005 إلى 2009 أو 10 ، لا يبدو أن هناك الكثير مما يحدث من حيث الابتكار.وفجأة اندلعت للتو ، مثل الهروب من السجن أو أي شيء ، والآن هناك كل أنواع الأشياء المثيرة التي تحدث. يرجع الكثير من ذلك إلى حجم الويب ، وجميع خصائص الويب الرائعة التي تقوم بأشياء مختلفة ومثيرة للاهتمام. هذا هو المكان الذي جاء منه مفهوم NoSQL. وهذا يعني شيئين مختلفين: هذا يعني عدم وجود SQL ، كما أنه لا يدعم SQL ، كما أنه لا يعني SQL فقط. هناك مصطلح "NewSQL" استخدمه بعض الأشخاص. لكن من الواضح أن SQL - لغة الاستعلام المهيكلي - هي حقًا الأساس ، إنها قاعدة الاستفسار.

ومن المثير للاهتمام أن كل محركات NoSQL هذه ، ماذا حدث؟ حسنًا ، لقد خرجوا ، وكان هناك الكثير من الإثارة حول هذا الموضوع ، وبعد ذلك بسنوات قليلة ، ماذا بدأنا جميعًا في السماع؟ أوه ، SQL على Hadoop. حسنًا ، بدأت جميع هذه الشركات في فرض واجهات SQL على أدوات NoSQL الخاصة بها ، ويعرف أي شخص في عالم البرمجة أن هذا سيؤدي إلى بعض التحديات وبعض الصعوبات ، وبعض الأسلاك المتقاطعة وما إلى ذلك. لذلك سوف نكتشف الكثير من هذه الأشياء اليوم.


يوجد ثلاثة من مقدمي العروض: تلقينا دعوة من Dez Blanchfield من سيدني ، وروبن بلور الخاص بنا الموجود في تكساس ، وكذلك بيرت سكالزو ، وهو في تكساس أيضًا. لذلك ، بادئ ذي بدء ، سوف نسمع من Dez Blanchfield. الناس ، سنقوم بالتغريد على علامة التجزئة #HotTech ، لذلك لا تتردد في تعليقاتك ، أو أسئلتك من خلال عنصر الأسئلة والأجوبة من وحدة التحكم في البث الشبكي ، أو حتى من خلال نافذة الدردشة. ومع ذلك ، ديز بلانشفيلد ، خذها بعيدا.

ديز بلانشفيلد: شكرا يا اريك مرحباً بالجميع. لذلك سأحاول إعداد المشهد من وجهة نظر 30،000 قدم من نوع ما حدث في العقد الماضي ، والتحولات المهمة التي شهدناها - أو على الأقل عقد ونصف العقد على أي حال - من أنظمة إدارة قواعد البيانات ، وبعض التأثيرات من وجهة نظر تجارية أو تقنية ، وبعض الاتجاهات التي تحملناها في وقت متأخر ، وتقودنا إلى المحادثة التي نوشك أن نجريها اليوم حول الموضوع.

صورة الغلاف الخاصة بي هنا هي كثبان رملية ، وهناك ريح تهب قطعًا صغيرة صغيرة من الرمال أعلىها. ونتيجة لذلك ، ما يحدث هو أن الكثبان الرملية تسير ببطء من مكان إلى آخر. إنها ظاهرة مذهلة ، حيث تتحرك هذه الجبال الضخمة الضخمة التي يتراوح ارتفاعها بين 40 و 50 قدمًا فعليًا. وهم يتحركون ببطء شديد ، لكنهم يتحركون بثبات ، وبينما يتحركون ، يغيرون المشهد. إنه شيء يجب مشاهدته إذا كنت تقضي أي وقت على الإطلاق في منطقة تعد الكثبان الرملية فيها أمرًا طبيعيًا. نظرًا لأنك تستطيع أن تنظر إلى النافذة في يوم من الأيام ، وتدرك أن هذا الجبل الضخم من الرمال ، تحركت حبيبات صغيرة صغيرة من تلقاء نفسها ، وأن الريح تنقلها ببطء من مكان إلى آخر.

وأعتقد من نواح كثيرة أن هذا هو عالم أنظمة قواعد البيانات لبعض الوقت. حتى وقت قريب جدًا ، كان هذا التحول الصغير جدًا في شكل حبيبات رملية يحرك جبلًا كبيرًا من الرمال على شكل كثيب رملي. ظهرت بعض التحولات في منصات قواعد البيانات على مر السنين ، وكانت بيئة مستقرة إلى حد ما ومتينة حول أنظمة ومنصات قواعد البيانات ، من خلال الإطار الرئيسي للعصر المتوسط ​​المدى. ولكن في الآونة الأخيرة ، كان لدينا بعض الأشياء المهمة إلى حد ما تحدث لاحتياجاتنا التجارية والسائقين التقنيين. سوف أسير بيننا.

لدي رأي مفاده أن المفهوم الأساسي لقاعدة البيانات ، كما عرفناها لسنوات عديدة ، وكما قد تكون سمعت في المزاح السابق للعرض ، فإن خبرائنا اللذين كانا على اتصال معي اليوم أمضينا فترة حياة في هذا الفضاء وهم محقون في مشاركة حقوق المفاخرة للوجود عندما بدأ كل شيء في أوائل الثمانينيات. لكننا رأينا هذا التحول الهائل في العقد الماضي وقليلا ، وسأنظر بنا بسرعة قبل تسليمه إلى الدكتور روبن بلور.

لقد مررنا بهذا ما أسميه "تجربة أكبر وأفضل وأسرع وأرخص". كما قلت ، لقد تغير تعريف قاعدة البيانات. المناظر الطبيعية التي كان على منصات قواعد البيانات لمعالجة الأداء ، والمتطلبات الفنية والتجارية قد تحولت كذلك. لقد رأينا هذه الزيادة في الطلب على حلول للتعامل مع المتطلبات الفنية التجارية المعقدة أو المعقدة. وهكذا فإن نظرة سريعة حقًا من خلال ما يعنيه هذا في الواقع ، في رأيي ، هي أننا وصلنا إلى فترة التسعينيات ، ورأينا تقنية قواعد البيانات تتأثر بإدخال الإنترنت ، ونوع ما نسميه آنذاك الإنترنت مقياس. نحن لا نتحدث فقط عن الأشخاص الذين يجلسون أمام المحطات ، في الأصل أمثال المحطات الطرفية التي تحتوي على ers المادية والمضمنة فيها و 132 عمودًا من الخروج في ورقة. ثم محطات الشاشة الخضراء في وقت مبكر ، واللكم مع لوحات المفاتيح.

لكنك تعلم أن عالمنا كان عبارة عن محطات وكابلات تسلسلية أو كابلات شبكة تتحدث إلى أجهزة الكمبيوتر لفترة طويلة. بعد ذلك جاءت الإنترنت ، وهذا النمو الهائل في الاتصال ، الذي لم تعد بحاجة إلى توصيله بالكمبيوتر بعد الآن. للوصول إلى نظام قاعدة البيانات ، كنت بحاجة فقط إلى متصفح ويب. لذلك كان يتعين على تقنية قاعدة البيانات أن تتغير بشكل كبير ، للتعامل مع حجم كل شيء من تقنيات محرك البحث الأساسية التي كانت تستخدم لفهرسة العالم ، وتخزين فهرس المعلومات ، في مثال مقياس تنسيق قاعدة البيانات. وقدم أشخاص مثل Google وغيرهم منصة للقيام بذلك. وتم إنتاج جميع الأنواع الجديدة من تخزين قواعد البيانات والاستعلام عنها وفهرستها. ثم كان لدينا مواقع الموسيقى ومواقع الأفلام تأتي جنبا إلى جنب.

ثم في العقد الأول من القرن العشرين ، شهدنا طفرة dot-com ، والتي أحدثت انفجارًا دراماتيكيًا أكبر في عدد الأشخاص الذين يستخدمون أنظمة كانت تعمل دائمًا بواسطة قاعدة بيانات من بعض الأشكال. في هذه المرحلة ، لا تزال قواعد البيانات العلائقية تتعامل مع معظم العبء ، لقد وضعناها في صفائح أكبر ، وذهبنا إلى حد كبير في الأنظمة متوسطة المدى الكبيرة جدًا التي تشغل منصات Unix من أشخاص مثل IBM و Sun وما إلى ذلك. . جعل ازدهار dot-com الأشياء أكبر وأسرع من الأجهزة ، وجهة نظر الأداء ، وكانت هناك بعض التغييرات المهمة في محركات قاعدة البيانات ، ولكن بالنسبة للجزء الأفضل ، كان لا يزال نفس الشيء الذي رأيناه وقت طويل.

وبعد ذلك وصلنا إلى عصر الويب 2.0 ، كما نشير إليه. وكان هذا تحولا وحشيا ، لأننا فجأة كنا بحاجة إلى منصات قاعدة بيانات أبسط بكثير ، وكان لابد من وجود مقياس في شكل أفقي. وكان هذا تحولًا كبيرًا في الطريقة التي تناولنا بها فكرة قاعدة البيانات. ما زلنا الآن في اللحاق بالركب من وجهة نظري. والآن نحن نتعامل مع هذا المستنقع كله ، وأنا أقول أنه مع تدور إيجابي ، وليس دلالة سلبية ، هذا المستنقع لما نشير إليه على أنه بيانات كبيرة ، وانفجار هائل ، وأعني انفجار. هذا التحول الفاحش عموديًا على الرسم البياني لعدد الخيارات المتاحة لدينا عندما نتحدث عن قاعدة بيانات ، وشكل من أشكال القدرة على الاستعلام العلائقي.

ومن المثير للاهتمام ، أنا شخصياً أرى أن البيانات الضخمة هي في الحقيقة مجرد غيض من فيض. نحن نميل إلى التحمس قليلاً بشأن تأثير البيانات الضخمة وأنواع الخيارات المتاحة لدينا الآن. لقد حصلنا على كل شيء من محركات NoSQL ، ولدينا محركات رسوم بيانية ، ولدينا جميع هذه الأنواع المختلفة من المنصات التي يمكننا أن نلقي البيانات عليها ونفعل الأشياء معها. حتى إلى الحد الذي كان في الواقع ، كان أحد المحادثات الأولى التي أجريتها مع إريك كافاناغ ، الموجود معنا هنا اليوم ، حول محادثة تتعلق بشيء يسمى Apache Drill ، وهو مشروع مفتوح المصدر يسمح لك بالاستعلام البيانات داخل طراز أنواع البيانات المختلفة: كل شيء بدءًا من ملفات CSE الخام الموجودة على القرص الصلب ، وصولاً إلى أنظمة ملفات HDFS على مقياس بيتابايت. كما تعلمون ، إنها تتيح لك القيام بهذه الاستعلامات على غرار SQL الخاصة بالبيانات المنظمة وغير المهيكلة لجميع أنواع النباتات المثيرة.

نحن على وشك أن نرى "المبنى الذكي" يصبح شيئًا ، ونود أن نعتقد أن لدينا مباني ذكية للأمن وإدارة الحرارة ، لكنني أتحدث عن مبان ذكية تعرف الكثير عن شخصيتك وأين أنت عندما تدخل ، وتنفذ جميع أنواع الأشياء الدقيقة على هذا المستوى ، وصولاً إلى المدن الذكية - النظم الإيكولوجية بأكملها على مستوى المدينة - التي تعرف كيفية القيام بالأشياء بذكاء. علاوة على ذلك ، لقد حصلنا على هذا الشيء المذهل الذي لا أعتقد أن أي شخص في العالم يدرك تمامًا ، وهذا هو شكل إنترنت الأشياء. كانت هناك كل هذه التغييرات المختلفة خلال العقد الماضي ، وقد يكون هناك بعض الشيء ، ربما عقدين تقريبًا ، إذا قمنا بتجميعه ، فقد أثر هذا في العالم على ما نعتبره قواعد البيانات ، في رأيي.

كان هناك بضعة أشياء مهمة جعلت هذا ممكنًا. لقد انخفضت تكلفة محركات الأقراص الصلبة بشكل كبير ، وهذا من خلال العديد من الطرق هو الذي جعل من الممكن قيادة بعض بنيات المرجع مثل طراز Hadoop ، حيث نأخذ الكثير من البيانات ونشرها على الكثير من محركات الأقراص الصلبة ، و تفعل أشياء ذكية معها. وفي الواقع ، ما أصبح يتقاسم ، في رأيي ، قاعدة البيانات العلائقية أو نموذج وحدة DB التقليدية. لقد حصلت ذاكرة الوصول العشوائي (RAM) على تكلفة رخيصة للغاية ، مما أتاح لنا فرصة جديدة تمامًا للعب مع بنى مرجعية مختلفة مثل الذاكرة ، والقيام بأشياء مثل تقسيم مجموعات كبيرة جدًا من البيانات.

وهذا أعطانا هذه الصورة الصغيرة التي ننظر إليها الآن ، وهو رسم بياني يوضح أنواع الأنظمة الأساسية المتاحة إذا كنت في مشهد البيانات الكبير. ومن الصعب جدًا قراءتها ، والسبب في ذلك ، هناك الكثير من المعلومات حول هذا الموضوع. هناك الكثير من خيارات التصميم والنماذج والتصنيع الخاصة بطرق وضع البيانات في أنظمة قواعد البيانات بأي شكل من الأشكال ، والاستعلام عنها ، والقيام بالكتابة التقليدية. وهي ليست جميعها متوافقة ، في الواقع فإن عددًا قليلاً منهم يتوافق حتى مع أي معيار نمط أساسي ، لكنهم ما زالوا يعتبرون أنفسهم قاعدة بيانات. وسأعرض عليك شاشتين في الثانية لإعطائك بعض الحيرة حول ما أعنيه بالتحول من التسعينيات ومقياس الإنترنت ، إلى الويب 2.0 ، ثم النمو الكامل من خلال البيانات الضخمة. إذا كنا نعتقد أن هذا الرسم البياني لتكنولوجيا البيانات الضخمة يعد أمرًا مثيرًا نظرًا لوجود العديد من الخيارات عليه ، فلنلقِ نظرة فقط على مفتاح رأسي واحد.

لنلقِ نظرة على تكنولوجيا التسويق. فيما يلي الخيارات لأنظمة إدارة قواعد البيانات ، أو إدارة البيانات داخل مساحة التكنولوجيا الفائقة ، وكذلك التكنولوجيا المتعلقة بالتسويق. الآن كان هذا في عام 2011 ، منذ بضع سنوات ؛ قبل خمس سنوات ، هذا ما بدا عليه المشهد. إذا عدت للتو شريحة واحدة لفترة وجيزة ، هذا ما يبدو عليه مشهد البيانات اليوم في مختلف العلامات التجارية والعروض التي لدينا في تقنيات قواعد البيانات. هذا ما بدا عليه شكل رأسي قبل خمس سنوات ، فقط في تكنولوجيا التسويق.

الآن إذا ذهبت إلى وجهة نظر اليوم ، هذا ما يبدو عليه ، وهو لا يمكن اختراقه تمامًا. إنه مجرد جدار من العلامات التجارية والخيارات ، إنه الآلاف والآلاف من مجموعات البرامج التي تعتبر نفسها في فئة قاعدة البيانات ، والتي يمكنها التقاط البيانات أو إنشائها أو تخزينها واستردادها في أشكال مختلفة. وأعتقد أننا ندخل الآن وقتًا ممتعًا للغاية وشيقًا للغاية ، حيث يمكنك أن تعرف ذات مرة العلامات التجارية الكبرى ، ويمكنك معرفة خمسة أو ستة منصات مختلفة من Oracle و Informix و DB2 وما إلى ذلك ، وتكون تقريبا خبير في جميع العلامات التجارية التي كانت متاحة منذ حوالي 20 عاما. قبل عشر سنوات ، أصبح الأمر أسهل بعض الشيء لأن بعض العلامات التجارية سقطت ، ولم تستطع جميع العلامات التجارية التعامل مع حجم طفرة dot-com ، وانتهت بعض الشركات للتو.

اليوم ، من المستحيل تمامًا أن تكون خبيرًا في كل تكنولوجيا قواعد البيانات الموجودة ، سواء أكانت قواعد بيانات علائقية ، أو منصات أساسية لإدارة قواعد البيانات التي عرفناها خلال العقدين الأخيرين. أو على الأرجح ، فإن المحركات الأكثر حداثة مثل Neo4j وتلك الأنواع. وبالتالي أعتقد أننا ندخل في عالم شجاع للغاية حيث تتوفر الكثير من الخيارات ، ولدينا منصات على نطاق واسع على أساس أفقي ، سواء في الذاكرة أو على القرص الآن. لكنني أعتقد أنه وقت صعب بالنسبة لصانعي القرار في مجال التكنولوجيا والأعمال ، لأنهم يحتاجون إلى اتخاذ بعض القرارات الكبيرة جدًا بشأن مجموعات التكنولوجيا ، والتي كانت موجودة في بعض الحالات فقط لمدة شهور أساسية. عمر ثمانية عشر شهراً ليس رقمًا مخيفًا الآن بالنسبة لبعض منصات قواعد البيانات مفتوحة المصدر الأكثر إثارة وجديدة. ويبدأون في دمج المنصات ويصبحون أكثر حداثة وأكثر إثارة.

أعتقد أننا سنجري محادثة رائعة اليوم حول كيفية تأثير هذا كله على منصات قواعد البيانات التقليدية وكيف يستجيبون لها ، وأنواع التقنيات التي يتم طرحها على ذلك. ومع أخذ ذلك في الاعتبار ، سأنتقل الآن إلى الدكتور روبن بلور ، وأحصل على أفكاره. روبن ، أكثر لك.

روبن بلور: حسنًا ، شكرًا على ذلك. نعم ، هذا موضوع كبير جدًا. أعني ، إذا كنت قد التقطت للتو قطعة من الرسوم التوضيحية التي أظهرها لك Dez للتو ، يمكنك إجراء محادثة طويلة حول أحد الشظايا. لكنك تعلم أنه يمكنك الذهاب إلى قاعدة بيانات - لقد كنت أبحث في قواعد البيانات ، لا أعرف ، منذ الثمانينيات ، ويمكنك البحث في قاعدة البيانات بطرق مختلفة. وأحد الأشياء التي اعتقدت أنني سأفعلها ، مجرد إلقاء نظرة على المحادثة اليوم ، كان الحديث عن سبب حدوث أشياء مزعجة على مستوى الأجهزة. وعليك أن تضع في اعتبارك أن هناك الكثير من الأشياء المدمرة التي حدثت بالفعل على مستوى البرامج أيضًا ، لذلك ليست هذه هي الصورة الكاملة لأي شيء ، إنها مجرد شيء يتعلق بالأجهزة.

لم أكن أتحدث لفترة طويلة أيضًا ، أردت فقط أن أعطيك صورة الأجهزة. كانت قاعدة البيانات هي قدرات لاسترجاع البيانات تمتد على وحدة المعالجة المركزية والذاكرة والقرص ، وهذا يتغير بشكل كبير. والسبب في ذلك هو أنني تعلمت أن أفهم قاعدة البيانات من منظور ما قمت به بالفعل. كما تعلمون ، يوجد اختلاف في زمن الوصول بين البيانات الموجودة فعليًا على وحدة المعالجة المركزية والبيانات التي يتم سحبها إلى وحدة المعالجة المركزية من الذاكرة والبيانات التي يتم سحبها من القرص إلى الذاكرة ومن خلال وحدة المعالجة المركزية. وكانت هياكل قاعدة البيانات القديمة تحاول فقط موازنة ذلك. كما تعلمون ، لقد كانوا يقولون فقط ، "حسنًا ، هذا أمر بطيء جدًا ، وسنقوم بتخزين البيانات الموجودة على القرص في ذاكرة مؤقتة. سنحاول القيام بذلك بطريقة دقيقة بالفعل بحيث تكون نسبة جيدة من البيانات التي نطلبها موجودة بالفعل في الذاكرة. وسنقوم بنقل البيانات إلى وحدة المعالجة المركزية بأسرع ما يمكن ".

وقواعد البيانات كانت مكتوبة في الأيام الخوالي تمت كتابة آلات للمجموعات الصغيرة. والآن ، لجهل التوازي. لأنه إذا كنت ستحصل على بعض الأداء من مجموعة ، فسوف يتعين عليك القيام بأشياء مختلفة بشكل متوازٍ. التوازي جزء من اللعبة ، لا يشبه ما هو عليه الآن. سوف أتجول في ما حدث.

بادئ ذي بدء ، القرص. حسنا القرص قد انتهى ، حقا. لقد انتهى الأمر كثيرًا فيما يتعلق بقواعد البيانات. أعتقد أن هناك عددًا من سلبيات أرشفة البيانات ، وحتى بحيرات البيانات الكبيرة جدًا التي تعمل على Hadoop ، من المحتمل أن يكون قرص الغزل الأسوأ قابلاً للتطبيق في الوقت الحاضر. حقًا ، كانت مشكلة القرص الدوار هي أن سرعات القراءة لم تتحسن كثيرًا. وعندما كانت وحدة المعالجة المركزية ترتفع بسرعة قانون مور ، وهو نوع من الحجم ، أسرع كل ست سنوات. وكانت الذاكرة تتابع نوعًا ما في أعقابها ، ثم كان الاثنان يواكبان بعضهما البعض بشكل معقول ، ولم يكن الأمر سلسًا تمامًا ، لكنهما فعلا ذلك.

لكن القراءة العشوائية إلى القرص حيث يطير الرأس حول القرص ، أعني ، بصرف النظر عن أي شيء آخر ، أنها حركة فعلية. وإذا كنت تقوم بالقراءة العشوائية للقرص ، فسيكون بطيئًا بشكل لا يصدق مقارنة بالقراءة من الذاكرة ، فهو أبطأ من 100،000 مرة. ومؤخراً إلى حد ما ، فإن معظم تصميمات قواعد البيانات التي نظرت إليها بأي عمق كانت بالفعل مجرد قراءة متسلسلة من الأقراص. تريد حقًا ، بطريقة أو بأخرى ، تخزين ذاكرة التخزين المؤقت قدر الإمكان من القرص ، وقم بسحبه من هذا الجهاز البطيء ووضعه على جهاز سريع. وهناك الكثير من الأشياء الذكية التي يمكنك القيام بها في هذا الصدد ، لكن الأمر انتهى.

وأقراص الحالة الصلبة ، أو محركات أقراص الفلاش ، في الحقيقة ، ما هي عليه بالفعل ، تحل بسرعة كبيرة محل القرص الدوار. وهذا يتغير مرة أخرى تمامًا ، نظرًا لأن الطريقة التي يتم بها تنظيم البيانات على القرص ، يتم تنظيمها وفقًا للطريقة التي يعمل بها القرص. يتعلق الأمر في الواقع برأس يتحرك عبر سطح دوار ، في الواقع رؤوس متعددة تتحرك عبر أسطح الغزل المتعددة ، وتلتقط البيانات كما هي. محرك الحالة الصلبة هو مجرد كتلة من الأشياء التي يمكنك قراءتها. أعني ، أول شيء هو أن جميع قواعد البيانات التقليدية تم تصميمها من أجل قرص الغزل ، ويتم الآن إعادة تصميمها من أجل SSD. من المحتمل أن قواعد البيانات الجديدة - يمكن لأي شخص يكتب قاعدة بيانات جديدة في الوقت الحالي أن يتجاهل قرص الغزل ، وليس التفكير في الأمر على الإطلاق. لكن Samsung ، الشركة المصنعة الكبرى لمحركات الأقراص الصلبة ، تخبرنا أن محركات أقراص الحالة الثابتة هي بالفعل في منحنى قانون مور.

أعتقد أنهما كانا أسرع بثلاث أو أربع مرات من القرص الدوار ، لكنهما سيحصلان الآن بشكل أسرع كل 18 شهرًا ، بشكل أساسي. مضاعفة السرعة ، و 10 مرات بسرعة تصل إلى حوالي ست سنوات. ومع ذلك ، إذا كان الأمر كذلك ، فلن يكون الأمر كذلك ، كما سأخبرك في لحظة. القرص الغزل بالطبع أصبح وسيلة أرشفة.

عن الذاكرة. أول الأشياء أولا ، ذاكرة الوصول العشوائي. تزداد نسبة وحدة المعالجة المركزية (RAM) بين ذاكرة الوصول العشوائي (RAM) لكل وحدة CPU في كل وقت. وهذا بالطبع ، بطريقة ما ، يوفر المزيد من السرعة الفظيعة ، لأن مساحة الذاكرة التي يمكن أن تمتلكها الآن يمكن أن تخزن الكثير. ما يفعله هذا في الواقع هو أنه يخفف الضغط على تطبيقات MLTP أو تطبيقات القراءة العشوائية ، لأنه من الأسهل تلبية هذه التطبيقات ، لأنك تمتلك الآن الكثير من الذاكرة ، وبهذه الطريقة ، يمكنك تخزين أي شيء مخبأ من المرجح أن تقرأ في الذاكرة. لكنك تواجه مشكلات مع كومة بيانات أكبر ، لذا فإن البيانات الضخمة ليست بهذه البساطة في الحقيقة.

ثم لدينا Intel مع 3D Xpoint ، و IBM مع ما يسمونه PCM ، وهو ذاكرة التغيير التدريجي ، يقدمون شيئًا يعتقدون أنه - حسنًا ، إنه أسرع 10 مرات على الأقل من محركات الأقراص الصلبة الحالية ، ويعتقدون أنها ستحصل قريبة جدا من أن تكون بنفس سرعة RAM. وبالطبع فهي أقل تكلفة. في السابق ، كان لديك بنية قاعدة البيانات هذه من وحدة المعالجة المركزية والذاكرة والقرص ، ونحن الآن نتحرك نحو هيكل يحتوي على أربع طبقات. إنه يحتوي على وحدة المعالجة المركزية والذاكرة أو ذاكرة الوصول العشوائي ، ثم هذا النوع من الذاكرة الأسرع من SSD ، والتي هي في الواقع غير متقلبة ، ثم SSD. وهذه التقنيات الجديدة غير متقلبة.

كما أن هناك معالي HP ​​، وهو ما لم تعرفه بعد ، لأنه تم الإعلان عنه منذ حوالي سبع سنوات ، لكنه لم يظهر بعد. لكن الشائعات التي أسمعها هي أن HP ستغير اللعبة قليلاً مع أحد المذكرات أيضًا ، لذلك واجهت وضعًا جديدًا في الذاكرة. هذا يشبه أننا حصلنا على أشياء أسرع ، وهذا مثل أن لدينا طبقة جديدة تمامًا. ثم حصلنا على حقيقة أن الوصول إلى SSD ، يمكنك قراءتها بالتوازي. لا يمكنك قراءة قرص الغزل بالتوازي ، باستثناء وجود الكثير من أقراص الغزل المختلفة. لكن كتلة من SSD ، يمكنك أن تقرأ فعلا بالتوازي. ونظرًا لأنه يمكنك قراءة ذلك بشكل متوازٍ ، فإنه يتم بشكل أسرع من سرعات القراءة البسيطة ، إذا قمت بالفعل بإعداد عمليات متعددة عبر العمليات المختلفة على وحدة معالجة مركزية واحدة ، وقمت فقط باستخدام SSD.

تشير التقديرات إلى أنه يمكنك الحصول على سرعات RAM تقريبًا عن طريق القيام بذلك. وكل ما يقوله هذا هو أن مستقبل بنية الذاكرة غير واضح. أعني ، أن الواقع هو أن البائعين المهيمنين المختلفين ، أيا كان دورهم ، سيحددون على الأرجح اتجاه الجهاز. لكن لا أحد يعرف إلى أين يحدث في هذه المرحلة الزمنية. لقد تحدثت إلى بعض مهندسي قواعد البيانات الذين يقولون: "لا أخاف مما يحدث" ، لكنهم لا يعرفون كيفية تحسينه من البداية. وقد فعلت ذلك دائمًا ، لذلك هذا مثير للاهتمام.

ثم هناك وحدة المعالجة المركزية. حسنًا ، لم تكن وحدات المعالجة المركزية متعددة النواة مجرد وحدات المعالجة المركزية متعددة النواة. لدينا أيضًا أحجام كبيرة من ذاكرة التخزين المؤقت L1 و L2 و L3 ، خاصةً L3 ، والتي لا تصل إلى عشرات الميجابايت. يمكنك وضع الكثير هناك ، كما تعلمون. وبالتالي ، يمكنك بالفعل استخدام الشريحة كوسيلة للتخزين المؤقت. بحيث غيرت اللعبة. وبالتأكيد ، معالجة المتجهات وضغط البيانات ، قام عدد من البائعين بالفعل بذلك ، وسحبوا هذه الأشياء إلى وحدة المعالجة المركزية لجعلها تسير بشكل أسرع في وحدة المعالجة المركزية. ثم تحصل على حقيقة مفادها أن وحدات المعالجة المركزية (CPU) المزودة بوحدات معالجة الرسومات (GPU) جيدة حقًا في تسريع التحليلات. كما أنها جيدة جدًا في أنواع معينة من الاستعلامات ، ويعتمد ذلك فقط على ماهية استفسارك.

يمكنك إما إنشاء لوحات مع وحدات المعالجة المركزية ووحدات معالجة الرسومات ، أو كما تفعل AMD الآن ، أنت تنتج شيئًا ما يسمى APU ، وهو نوع من الزواج بين وحدة المعالجة المركزية ووحدة معالجة الرسومات ؛ إنه يمتلك كلا النوعين من القدرات. هذا هو نوع مختلف من المعالج. وبعد ذلك الإعلان الأخير من شركة إنتل بأنها ستضع FPGA على الرقاقة ، هذا النوع من الأمور رأسي فيها. كنت أفكر ، "كيف يحدث هذا على الأرض؟" لأنك إذا حصلت على إمكانية وحدة المعالجة المركزية ، وحدة معالجة الرسومات ، وكنت قد حصلت على إمكانية وحدة المعالجة المركزية ، FPGA - وبالمناسبة ، إذا كنت تريد حقا ، على اللوحة نفسها ، يمكنك وضع وحدة المعالجة المركزية ، وحدة معالجة الرسومات ، و FPGA. ليس لدي أي فكرة عن كيفية تشغيل أي شيء بهذه الطريقة في الواقع ، لكنني أعرف الشركات التي تقوم بأشياء مثل هذه ، وأنها تحصل على إجابات سريعة للغاية للاستعلام. هذا ليس شيئًا سيُتجاهل ، وهذا شيء سيُستخدم من قبل البائعين المعروفين ، وربما من قِبل البائعين الجدد. كانت قواعد إدارة قواعد البيانات (DBMS) متوازية دائمًا ، ولكن الآن الإمكانيات المتوازية قد انفجرت للتو ، لأن هذا يسمح لك بموازاة ذلك مع ذلك ، مع ذلك بعدة طرق.

وأخيرا ، لتوسيع نطاق أو توسيع نطاق؟ إن التوسع هو الحل الأفضل حقًا ، ولكن لشيء واحد. يمكنك الحصول على أداء عقدة أفضل بكثير إذا كان يمكنك فقط تحسين أداء وحدة المعالجة المركزية والذاكرة الموجودة على القرص على عقدة واحدة. وسوف تستخدم عددًا أقل من العقد ، لذا ستكون أرخص ، أليس كذلك؟ وسيكون من الأسهل إدارتها. لسوء الحظ ، إنه تصميم يعتمد على الأجهزة ، ومع تغير الأجهزة ، يصبح القيام بذلك أقل وأقل ، ما لم يكن مهندسونك قادرين على العمل بأسرع ما يتغير الجهاز. وأنت تواجه مشكلات في عبء العمل ، لأنه عندما تقوم بتوسيع النطاق ، فأنت تقوم بافتراضات مختلفة حول ما سيكون عليه عبء العمل.

إذا قمت بالتدريج ، أي إذا ركزت الهندسة المعمارية الخاصة بك على التدريج قبل التوسع - في الواقع يجب عليك القيام بهما معًا ، فهذا فقط هو الذي تؤكد عليه. ستحصل بعد ذلك على أداء أفضل للشبكة ، لأن البنية ستتعامل معها. سيكون أكثر تكلفة من حيث الأجهزة لأنه سيكون هناك المزيد من العقد ، ولكن سيكون هناك عدد أقل من مشاكل عبء العمل ، وسيكون هناك تصميم أكثر مرونة.

لقد ظننت أنني سأطرح هذا الأمر ، لأنه إذا كنت تفكر فعليًا في كل التغييرات في الأجهزة ، فقد أشرت للتو إلى إصبعي ، ثم فكرت في كيفية توسيع نطاق هذه الأشياء وتوسيع نطاقها؟ ثم تدرك أن مهندسي قاعدة البيانات ، في رأيي على الأقل ، يحصلون على رواتب جيدة. لذلك إذا كنت تفكر فقط في طبقة الأجهزة ، تكون تحديات قاعدة البيانات واضحة. أنتقل الآن إلى بيرت ، الذي سيجعلنا جميعًا نشعر بالتعليم.

إريك كافانا: هذا هو! بيرت؟

بيرت سكالزو: شكرا جزيلا لك. اسمحوا لي فقط الحصول على مباشرة في هذه الشرائح. لدي الكثير من الشرائح التي يمكنني المرور بها ، لذا فقد أذهب بسرعة إلى عدد قليل منها. سنتحدث عن "الزخم الأمامي: الانتقال إلى ما وراء التقليدية". لم تعد قاعدة بيانات والدك بعد الآن. لقد تغيرت الأمور ، وكما قال متحدث سابق ، خلال السنوات الست إلى السبع الماضية ، تغير المشهد بشكل جذري.

بنفسي ، لقد كنت أقوم بعمل قواعد بيانات منذ منتصف الثمانينات. لقد كتبت كتبًا عن Oracle و SQL Server وقياس الأداء وغير ذلك الكثير من الأشياء الأخرى. "العالم يتغير بسرعة كبيرة. سوف كبيرة لا تغلب صغيرة بعد الآن. سيكون ذلك سريعًا في التغلب على البطيء. "لقد أضفت" للتكيف ". وكان ذلك من روبرت مردوخ. أعتقد حقا أن هذا سيكون صحيحا. لن تكون قادرًا على القيام بأشياء في قاعدة البيانات كما فعلت منذ 10 أو 15 أو 20 عامًا. سيتعين عليك القيام بذلك بالطريقة التي تريدها الشركة الآن.

سأحاول أن أبقى عامًا قليلاً في ما سأقدمه ، لكن معظم الميزات التي أتحدث عنها ستجدها في Oracle ، وستجدها في SQL Server ، و MySQL ، و MariaDB ، وبعض الميزات الأخرى الكبيرة اللاعبين. ثورة قاعدة البيانات العلائقية ، وأنا أتفق مرة أخرى مع المتحدثين السابقين. إذا نظرت جيدًا في حوالي عام 2010 ، فقد انتقلنا من سيارة السباق الحمراء إلى سيارة السباق الصفراء. كان هناك تغيير كبير ، ومع حلول عام 2020 ، أعتقد أنك ستشهد تغييرًا جذريًا آخر. نحن في وقت ممتع للغاية.

الآن ، هذه الشريحة أساسية ، ولهذا وضعت مفتاحًا هناك. يحدث كل هذا التغيير ، وعلى الجانب الأيسر ، حصلت على التكنولوجيا ، وعلى الجانب الأيمن ، حصلت على عمل. والسؤال هو ، ما الذي يسبب أي واحد ، وأي واحد يدعم أي؟ لدينا كل هذه التغييرات في الأجهزة: الأقراص تنخفض ، ارتفاع حجم القرص ، أنواع جديدة من الأقراص ، بحيث تمت تغطيتها بواسطة السماعات السابقة. سعر إسقاط الذاكرة ، كل هذه الإصدارات الأحدث من قواعد البيانات. لكن على الجانب الأيمن ، حصلنا على حماية البيانات والامتثال لها ، تخزين البيانات ، ذكاء الأعمال ، التحليلات ، الاحتفاظ بالبيانات الإلزامية. كلا جانبي المعادلة يقودان ، وسيستخدم كلا جانبي المعادلة كل هذه الميزات الجديدة.

أولاً وقبل كل شيء ، لقد حصلنا على قرص SAS النموذجي للغزل ، فهو يصل إلى 10 تيرابايت الآن. إذا لم تشاهد ، Western Digital ، فإن HGST لديها ما يسمونه محرك الهيليوم الخاص بهم ، والذي يصل إلى حوالي 10 تيرابايت في الوقت الحالي. تكاليف القرص الغزل أصبحت منخفضة جدا. كما ذكرنا سابقًا ، يمكنك الحصول على أقراص صلبة تصل إلى حوالي 2 تيرابايت ، ولكن لدى سامسونج وحدة 20 تيرابايت قريبًا. التكاليف أصبحت معقولة. شيء واحد سأتحدث عنه هو أن الآخر لم يكن هو مفهوم أقراص الفلاش. PCIe ، ذلك PCI Express ، مقابل NVMe ، ربما تكون قد سمعت أو لا سمعت عن هذا التعبير السريع عن الذاكرة غير المتطايرة. في الأساس ، ستكون NVMe بديلاً عن SAS و SATA ، وهي بالفعل بروتوكول اتصال أكثر من أي شيء آخر. ولكن هذه الأقراص تصل إلى حوالي ثلاثة تيرابايت الآن.

ربما تكون قد رأيت أيضًا أن بعض محركات أقراص SAS تأتي الآن مع موصلات U.2 ، والتي هي عبارة عن موصل مختلف عن SAS أو SATA ، والتي تدعم NVMe مع قرص قياسي - على القرص أن يدعمها أيضًا بالطبع. ثم SATA مع موصلات M.2 ، وتلك التي بدأت في الحصول على NVMe. في الواقع ، هناك الآن بائعي أجهزة كمبيوتر محمولة يقومون ببيع أجهزة الكمبيوتر المحمولة التي تحتوي على قرص فلاش NVMe ، وستظهر هذه الأشياء مقارنة بالتقنية التي استخدمتها من قبل.

كثير من الناس لا يعرفون ما هي كل هذه الهبات المختلفة. إذا نظرت إلى أسفل الزاوية اليمنى ، فهذا مثال على M.2. يمكنك القول ، "حسنًا ، يبدو الأمر أشبه بمحرك mSATA إلى يسارها". لكن كما ترون ، توجد فجوات في المسامير مقابل واحدة ، وهي أكبر قليلاً. وأيضا ، يمكن أن يأتي M.2 بثلاثة أحجام مختلفة.

ثم فلاش PCI Express ، وفلاش NVMe. الآن ، يعد فلاش NVMe هو أيضًا PCI Express ، لكن PCI Express لا يزال عادةً خوارزمية تحكم SAS- أو SATA-type التي تمت كتابتها من أجل قرص الغزل ، و NVMe هي الخوارزميات أو التقنيات التي تمت كتابتها خصيصًا للفلاش. ومرة أخرى ، سوف ترى كل هذه الأشياء.

يقدم NVMe عددًا قليلاً من الأشياء. أعتقد أن أكبر اثنين من التحسينات ، في أعلى الزاوية اليمنى ، يتم تقليل الكمون بنسبة تصل إلى 70 في المائة. لقد رأيت بالفعل أعلى من ذلك. بالإضافة إلى ذلك ، إذا نظرت إلى الركن الأيمن السفلي ، عندما يتحدث نظام التشغيل الخاص بك إلى قرص NVMe ، فإنه يمر بمستويات أقل بكثير من البرامج. بشكل أساسي ، تمر عبر برنامج تشغيل NVMe المضمّن الآن مع نظام التشغيل ، ويتحدث مباشرةً مع الوسائط. هناك الكثير من الأسباب التي تجعل هذه التكنولوجيا تغير جذريًا في عالم قواعد البيانات.

وفي كثير من الأحيان ، سيقول الناس ، "حسنًا ، ما مدى سرعة NVMe؟" كما تعلمون ، الأيام الخوالي ، قبل عام 2004 وما قبله ، شعرنا بالإثارة إذا كان لدينا Ultra-320 SCSI ، 300 ميجابايت في الثانية. سرعات اليوم ، الكثير منكم ربما على الألياف أو InfiniBand ، وهذا النوع من أعلى خارج. NVMe هناك على اليمين ، يبدأ من حيث تنتهي التقنيات الحالية. ما أحصل عليه هو ، يبدأ PCI Express 3.0 مع وصلة ذات ثمانية حارات في حوالي 8000 ، وسوف يرتفع كلما حصلنا على إصدارات أحدث من PCI Express ، الإصدارات الأربعة وما إلى ذلك. NVMe ليس لديه مكان يذهبون إليه باستثناء ما يصل.

الآن ، ما هي بعض الأشياء المتغيرة في قاعدة البيانات؟ الآن في الركن الأيمن العلوي من الشرائح الخاصة بي ، وضعت أسباب العمل التي أعتقد أن التكنولوجيا ظهرت بها. في هذه الحالة ، وبسبب تخزين البيانات وبسبب الأسباب التنظيمية للاحتفاظ الإلزامي بالبيانات ، بدأت قواعد البيانات في توفير الضغط فيها. الآن ، توفر بعض قواعد البيانات ضغطًا كإضافة ، والبعض الآخر يقدمها مضمنًا في المعيار ، دعنا نقول إصدار المؤسسة من قاعدة البيانات الخاصة بهم ، وحتى بعض قواعد البيانات ، كما هو الحال في Oracle ، يمكن أن تحتوي حتى على نسخة أفضل من الضغط في ، على سبيل المثال ، منصة Exadata الخاصة بهم ، لذلك قاموا بالفعل ببناء أجهزة يمكن أن تدعم ضغطًا شديد التخصص وأن ذلك الموجود في Exadata ، على سبيل المثال ، يحصل على معدل ضغط 40x ، وهذا مهم جدًا. وأعتقد أنه الاحتفاظ الإلزامي بالبيانات ، فالناس يريدون فقط البيانات لفترة أطول. تحتاج الشركات ، من أجل إجراء التحليلات و BI ، إلى البيانات التي تبلغ قيمتها 5 و 10 و 15 عامًا.

الآن ميزة أخرى بدأت تظهر مباشرة في حوالي عام 2008 ، كانت فترة 2009 هي التقسيم. مرة أخرى ، ستجد هذا في قواعد البيانات مثل Oracle و SQL Server وفي كلتا القائمتين عليك دفع ثمنها. في Oracle ، يجب عليك شراء خيار التقسيم وفي SQL Server ، يجب أن تكون على إصدار مركز البيانات. إنها تقنية فرق تسد التقليدية الخاصة بك وما تفعله هو أن لديك مفهوم طاولة كبيرة منطقية في الجزء العلوي هناك وعندما يتم وضعها على القرص ، يتم تقسيمها في الواقع إلى مجموعات. ويمكنك أن ترى أن هذه المجموعات يتم تنظيمها بواسطة بعض معايير الفصل ، أو الرجوع إليها أو استدعاء وظيفة التقسيم الخاصة بك ، ثم يمكنك أيضًا تقسيم القسم الفرعي في بعض منصات قواعد البيانات ويمكنك الذهاب إلى أبعد من ذلك.

مرة أخرى ، أعتقد أن كل من تخزين البيانات والاحتفاظ بالبيانات الإلزامية دفعت هذا الأمر ، وفي بعض قواعد البيانات هذه يمكن أن يكون لديك ما يصل إلى 64000 قسم ، وأعتقد في بعض قواعد البيانات الأخرى حتى 64000 قسم فرعي. يسمح لك هذا بتقسيم بياناتك إلى أجزاء يمكن التحكم فيها. يمكنك أيضا تقسيم الفهارس. إنه خيار ، ليس عليك ذلك ، ولكن يمكنك تقسيم فهارسك أيضًا. قد يكون أحد أسباب ذلك هو وجود نافذة منزلقة للبيانات. تريد الاحتفاظ بقيمة 10 سنوات من البيانات ، لكن من أجل إسقاط الفهارس لتشغيل تحميل الدُفعة الليلة ، لا تحتاج إلى إسقاط الفهارس في كل صف ، فقط في الصفوف الموجودة في المجموعة الحالية. التقسيم هو في الواقع أداة إدارية جيدة للغاية على الرغم من أن معظم الناس يعتقدون أن فائدتها الكبرى تتمثل في تجنب إزالة الأقسام في خططك وبالتالي تسريع استفساراتك. إنه حقًا نوع من الجليد على الكعكة.

الآن ربما سمعت عن التقسيم وربما تعتقد ، "حسنًا ، لماذا وضعت هذه الشريحة هنا؟" هذا أحد هذه NoSQL - هذه واحدة من بيئات Hadoop هذه. أصدر Oracle 12c اثنين ، وهو ليس G8 حتى الآن ، ولكن الذي يتم عرضه أو معاينته يحتوي بالفعل على مشاركة فيه. سيكون لديك نظام قاعدة بيانات تقليدية مثل Oracle وستكون قادرًا على المشاركة كما تفعل في نموذج Hadoop ، وبالتالي سيكون لديك تقنية فرق تسد أخرى ستقسم جدول الصف إلى مجموعات في كل عقدة وهذا سيكون - تماما مثل ما تراه في بعض قواعد بيانات NoSQL الخاصة بك. وفي الواقع ، MySQL ، يمكنك فعلاً إنجاز هذا إلى حد كبير باستخدام إحدى تقنيات التجميع الخاصة بها ، لكنها تأتي إلى قاعدة بيانات تقليدية وأعتقد أن Microsoft لا تريد أن تتخلف عن الركب. لعب هذان اللعبان قفزة الضفدع مع بعضهما البعض طوال الوقت لذا أتوقع رؤية مشاركة في الإصدار التالي من SQL Server.

إدارة دورة حياة البيانات ، مرة أخرى الاحتفاظ الإلزامي بالبيانات ، ولكن أيضًا من أجل ذكاء الأعمال والتحليلات. في الحقيقة ، هذه تقنية فرق تسد ، وعادة ما تقوم DBAs بذلك يدويًا ، وهذا هو ، "سأحتفظ ببيانات هذا العام على أقراص سريعة ، بيانات العام الماضي على أقراص أبطأ قليلاً ، ربما سأذهب للاحتفاظ بالعامين الأخيرين قبل ذلك على أقراص أبطأ ، ثم سأحصل على طريقة أرشيفية. "لم يتم تسجيلها بعد الآن بشكل معتاد ، إنها عادةً - لديك نوع من التخزين المتصل بالشبكة أو جهاز يحتوي على الكثير من التخزين وهو ، كما تعلمون ، فعالة من حيث التكلفة لكنه لا يزال الغزل القرص.

والآن يمكنك فعلاً - سواء على Oracle أو SQL Server - يمكنك شراء خيار حيث يمكنك تحديد القواعد وهذا يحدث تلقائيًا في الخلفية. لم تعد مضطرًا إلى كتابة البرامج النصية بعد الآن ، وليس عليك القيام بأي شيء. وإذا كنت قد شاهدت SQL Server 2016 ، الذي صدر للتو في الأول من يونيو ، فهناك ميزة جديدة تسمى "قواعد البيانات الممتدة" والتي تتيح لك القيام - أساسًا في الزاوية اليمنى هناك - يمكنك الانتقال من طبقات متعددة مباشرةً إلى السحابة ومرة أخرى ، هذه ميزة مضمنة في قاعدة البيانات ، فأنت تقول شيئًا مثل: "إذا كان عمر البيانات أكثر من 365 يومًا ، فالرجاء نقلها إلى السحابة ، كما تعلمون ، قم بذلك تلقائيًا بالنسبة لي."

ستكون هذه ميزة رائعة حقًا ، في الواقع ، أعتقد أنها قد تكون ما سنراه في المستقبل ، حيث سيكون لديك قواعد بيانات مختلطة حيث ستحتفظ ببعض البيانات المحلية والبعض في السحابة. قبل ذلك ، كان الناس يفكرون ، "أوه ، أنا إما سأفعل على أساس فرضي أو سأفعل على السحابة." الآن نرى زواج بين التقنيتين بهذه الطريقة المختلطة. أعتقد أن هذا سيكون كبيرًا جدًا وقد حصلت Microsoft عليه أولاً.

التنقيح ، وهذا يرجع إلى حماية البيانات والامتثال. الآن في الأيام الخوالي ، ربما قلنا ، "مرحبًا ، مطور التطبيق ، عندما تعرض هذا في التقرير ، عندما تعرض هذا على الشاشة ، فهناك بعض الأشياء الأمنية التي يجب عليك فحصها والرجاء ، كما تعلمون ، عرض البيانات فقط من المفترض أن يروا أو يخفيوا أو يصقلوا البيانات التي لا يُفترض أن يراها. "حسنًا ، كما هو معتاد ، عندما تدفعها للخارج إلى التطبيق ، لا يتم تنفيذها في مكان واحد بحيث يتم تنفيذها بشكل مختلف أو لا يتم القيام به في بعض الأماكن. والآن لديك بالفعل هذه القدرة في أنظمة قواعد البيانات الخاصة بك.

الآن في SQL Server 2016 ، هذه الميزة مضمّنة ، لذا فهي ليست عنصر تكلفة اختياري حتى الآن في إضافة مركز البيانات ، على ما أعتقد ؛ وفي Oracle 12 ، يتعين عليك شراء الوظيفة الإضافية لإدارة دورة الحياة الخاصة بها ، ولكن هذا شيء جديد ومرة ​​أخرى يتم توجيهه بواسطة الشركة. خاصة وأنك تحتفظ بالكثير من البيانات الآن ، وتقوم بإجراء التنقيب عن البيانات ، وبالتالي BI والتحليلات ، عليك أن تعرف من الذي يصل إلى البيانات والتأكد من أنه لا يُسمح لهم سوى برؤية ما يسمح لهم برؤيته.

وبالمثل ، انظر مرة أخرى في ذلك ، وحماية البيانات والامتثال. ستجد أن الكثير من أنظمة قواعد البيانات تقوم الآن ببناء الضغط ، أو أنا آسف ، التشفير مباشرة في قاعدة البيانات وما هو مهم حول هذا التشفير ، إذا نظرت إلى السهم لأسفل والسهم لأعلى في الرسم البياني الذي يكتبه وصولا الى القرص مشفر ثم يقرأها مرة أخرى في الذاكرة وفك تشفيرها. هذا في الواقع نموذج واحد ، وهناك نموذج آخر من شأنه ، كما تعلمون ، أن يفعل ذلك في الواقع فقط عندما يقوم بتوصيل هذه البيانات عبر الشبكة إلى تطبيق العميل الفعلي.

في هذه الحالة ، سيظل مشفرًا على خادم قاعدة البيانات في الذاكرة ، ويمكن تشفيره وفك تشفيره فقط عند إرساله إلى تطبيق العميل. يوجد نموذجان مختلفان هنا وستجدهما في قواعد البيانات ، وفي الواقع ، كانت MariaDB في الإصدار 10.X من قواعد البيانات التي أضافت للتو هذا مؤخرًا. أعتقد أنهم في 10.1 أو 10.2 الآن. وفعلت بعض المعايير في هذا التشفير ، ومن أجل الحصول على هذا التشفير ، واجهت فقط انخفاضًا بنسبة 8 بالمائة في الإنتاجية أو السرعة. في اختبار قياس الأداء ، لم يتسبب التشفير في حدوث ذلك كثيرًا ، لذا فهو يعد ميزة مفيدة للغاية.

الآن ، ذكرنا سابقًا حول ذاكرة الفلاش ومحركات الأقراص الثابتة وأشياء من هذا القبيل. واحدة من الميزات الموجودة لديك في Oracle و SQL Server والتي لا يدركها الكثير من الأشخاص هي أنه يمكنك أخذ فلاش أو SSD موجود على خادم قاعدة البيانات ويمكنك أن تقول لقاعدة البيانات ، "استخدم هذا كما لو كانوا ذاكرة. تعامل مع ذاكرة الوصول العشوائي على أنها تفضيلية ، ولكن التظاهر مثل هذه هي الذاكرة البطيئة واستخدامها كذاكرة تخزين مؤقت ممتدة. "الآن في SQL Server 2014 ظهر هذا وكان يطلق عليه" Buffer Pool Extension "، إنه مجاني. في Oracle ، تم إصداره في 11g R2 وكان يطلق عليه "Database Flash Cache" وكان أيضًا مجانيًا هناك.

لكن نصيحتي هي اختبار قيادة هذه الميزة بعناية. في كل مرة تقوم فيها بزيادة ذاكرة التخزين المؤقت عندما تذهب لإجراء بحث ، يستغرق وقتًا أطول. إذا وضعت بطاقة فلاش بثلاث تيرابايت وقلت لقاعدة البيانات ، "أضف ذلك إلى ذاكرتك" ، فقد تجد في الواقع أن شيئًا ما قد تباطأ نظرًا لوقت النظر إليه ورؤيته في الفلاش ، هل هو متسخ أو نظيفة؟ هناك نقطة تناقص العودة. نصيحتي هي اختبار هذا الأمر مرة أخرى ، ومعرفة ما يصلح لك ، ولكن مرة أخرى ، إنه موجود في قاعدة البيانات الخاصة بك وفي حالة Oracle ، في SQL Server و Oracle ، كان هناك منذ عامين.

ثم يقودنا ذلك إلى الجد الذي كان قواعد البيانات الموجودة في الذاكرة وذلك لأن أسعار قاعدة البيانات انخفضت. السبب الآخر الذي من المحتمل أن تعتقد أن هذا قد حدث هو أن الكثير من التحليلات تتطلب أن يكون الوصول إلى البيانات سريعًا للغاية ، ولذا يجب أن تكون في الذاكرة. لاحظ أن الخوارزميات التي تستخدمها قواعد البيانات للوصول إلى هذه البيانات ، وضغطها ، وتشفيرها ، وتخزينها ، كما تعلمون في بعض الحالات ، قد تستمر بعض قواعد البيانات في تخزينها في صف واحد.

في بعض الحالات ، قد تقسم بعض قواعد البيانات هذا إلى عمود موجه والسبب في ذلك هو أنها تحصل على مستوى ضغط أعلى بكثير ، في مكان ما حول 11 إلى 12X عن طريق تخزينه في ترتيب الأعمدة مقابل ترتيب الصفوف. ظهر هذا لأول مرة في SQL Server 2014 ، وكان يطلق عليه "Hekaton". لقد تمت زيادته بشكل جذري في SQL Server 2016 ، سيرون أنه تمت الإشارة إليه بواسطة بعض الأسماء المختلفة وقد تم طرحه في Oracle 12c ؛ أقول الإصدار الثاني هنا ، وليس R2. كان هناك إصداران مختلفان من Oracle 12c ، 12.1.0.1 و 12.1.0.2. إنه الإصدار الثاني من الإصدار R1 من قاعدة البيانات.

والطريقة التي تحددها ، يشبه الكائن الموجود في الذاكرة في كلا قواعد البيانات. هنا يمكنك أن ترى في الزاوية العلوية اليمنى ، أنا بصدد إنشاء خادم SQL ويمكنك أن ترى ذلك مع الذاكرة الأمثل والمتانة يجري مخطط فقط. لن أتجاوز جميع معاني بناء الجملة هذه ، وفي Oracle أكثر بساطة ، يمكنك فقط تغيير الجدول والقول في الذاكرة أو لا يمكنك تغيير ذلك. أستطيع أن أقول اليوم أنها في الذاكرة وغدًا ليست كذلك وهكذا فهي مرنة جدًا.

لقد أجريت بعض الاختبارات على Oracle مع جداول في الذاكرة ، وأجريت بعض الاختبارات التي استغرقت 40 دقيقة تقريبًا للتشغيل ، هناك في الصف العلوي. المهم الآن هو الوقت الذي وصلت فيه إلى الصفين السفليين ، لقد قمت بزيادة وقت التشغيل أو خفضته ، يجب أن أقول ، إلى خمس دقائق تقريبًا ، وعندما نظرت إلى عامل الضغط ، كانت البيانات الموجودة في الذاكرة في الواقع 3.6 إلى 4.6 مرات أصغر. هذا مهم لأنني في هذه الحالة كنت أستخدم تنسيقًا موجهًا للأعمدة وضغطًا. لذا خمن ماذا؟ كنت في الواقع أقوم بتركيب ما يقرب من أربعة إلى خمسة أضعاف البيانات في ذاكرتي. لم أكن أحصل على ميزة الذاكرة فحسب ، بل ميزة الأعمدة ، ولكن أيضًا الاستفادة من بيانات أكثر بكثير - ما يصل إلى خمسة أضعاف البيانات الموجودة في ذاكرة التخزين المؤقت للذاكرة ، لذلك فهذه تقنية قوية جدًا. مرة أخرى Oracle و SQL Server ، تريد إلقاء نظرة على هذه ، إنها ميزات رائعة حقًا. ومع ذلك ، أعتقد أنني سأفتح الأسئلة.

إريك كافانا: حسنًا يا بيرت ، أولاً وقبل كل شيء كنت نكران الذات في كل هذا التعليم الرائع. هل يمكنك التحدث لمدة دقيقة حول ما تفعله يا رفاق؟ لأنك حصلت على بعض التكنولوجيا التمكينية التي يمكن أن تسهل ما تتحدث عنه. تحدث فقط لمدة دقيقة حول ما تفعله يا رفاق ثم دعنا نجعل Dez و Robin في المعادلة هنا.

بيرت سكالزو: نعم ، أنا أعمل في شركة تدعى IDERA. نحن في تكساس ، يقع مقرنا الرئيسي في هيوستن ، وأنا جالس بالفعل في أوستن الآن لكنني مقيم في دالاس. نحن نصنع أدوات قاعدة البيانات ونصنع أدوات قاعدة البيانات لمساعدتك في حل المشاكل. قد تكون هذه المشكلة بسيطة مثل الإنتاجية ، وفي هذه الحالة لدينا أداة تسمى DBArtisan تتيح لك القيام بالمهام الإدارية لقاعدة البيانات الخاصة بك وهي أداة واحدة تتيح لك إدارة 12 منصة مختلفة لقاعدة البيانات. يمكنني إدارة SQL Server ، يمكنني إدارة Oracle ، يمكنني إدارة MySQL ، DB2 ، Postgres ، وأنا أستخدم أداة واحدة ، واحدة قابلة للتنفيذ ، تصميم GUI واحد ومجموعة واحدة متسقة من مسارات العمل. نحن أيضًا نصنع أدوات للقيام بالامتثال ، ولدينا أداة تسمى SQL Compliance Manager لمساعدتك في تلبية احتياجات التوافق الخاصة بك. أداة أخرى تدعى SQL Security ، لذلك نحاول أن نجعل الأدوات التي من شأنها أن تساعدك على أن تكون فعالة وفعالة ، وما هو لطيف حقاً إذا ذهبت إلى موقعنا على شبكة الإنترنت ، لدينا مجموعة كاملة من البرامج المجانية هناك ، لذلك إذا لم يكن هناك شيء آخر ، فقم بالتنزيل - أعتقد أن لدينا مثل 20 أو 25 freewares. هناك بعض الأشياء المجانية الجيدة بالفعل ، مثل وجود SQL Server وفحص تعليمات Windows الذي سيبحث بشكل أساسي عما لديك ويخبرك ما إذا كان لديك مشكلات أو أشياء وهو مجاني تمامًا.

إريك كافانا: وأنت حقا نوع من

بيرت سكالزو: بالتأكيد الاشياء الاولى

إريك كافانا: أنت تتحدث إلى عدم التجانس في السوق اليوم ، فقد كان هناك نوع من المعادلة يناسب الجميع ، وفي الحقيقة أتذكر إجراء مقابلة مع الدكتور مايكل ستونبراكر في طريق عودته عندما كان في عام 2005 ، حيث استمر في دفع كبير يتحدث عن الحكم على حركة قاعدة البيانات الموجهة نحو العمود وكان يتحدث كل شيء عن كيف سيطر النموذج العلائقي مقاس واحد يناسب الجميع لسنوات عديدة ، وكان يتوقع أن يتغير كل شيء ، وكان الصبي على حق في ذلك. الآن لدينا هذه البيئة المتنوعة والمثيرة للاهتمام مع الكثير من الخيارات والفرص المختلفة ، ولكنك تحتاج إلى شخص لإدارة كل ذلك ويبدو لي أن شركتك تركز بشكل كبير للغاية على حل مشاكل الرياضيات ، وبالتالي تكون عامل تمكين لل رأس التجانس ، أليس كذلك؟

بيرت سكالزو: إطلاقا. أعني أنه سيكون هناك دائمًا DBAs الذين يقولون ، "لا أريد استخدام أداة واجهة المستخدم الرسومية ، أفعل كل شيء باستخدام البرامج النصية" ، كما تعلمون؟ إنهم يعتقدون أنهم نوع سوبرمان من ديسيبل ، وهذا أمر جيد ولكن بالنسبة لمعظمنا من الناس ، نريد فقط الانتهاء من العمل و - كما تعلمون ، أنا استخدم Microsoft Word لكتابة مستنداتي. أنا استخدم Microsoft Outlook للقيام بي. أعني ، لدي أدوات للقيام بالمهام. نحن بصدد بناء نفس النوع من المفاهيم ، ونحن بصدد إنشاء أدوات لمسؤولي قواعد البيانات ومطوريها لمساعدتهم على التركيز على ما يريدون القيام به وليس على كيفية القيام بذلك.

إريك كافانا: هذا أمر منطقي ، لكن دعني أحيلك إلى خبرائنا ، والناس يشعرون بالحرية في الغوص. لقد تلقينا بعض التعليقات الواردة من الجمهور. ربما ، ديز ، بضعة أسئلة وروبن بضعة أسئلة؟

ديز بلانشفيلد: بالتأكيد. أحد الأسئلة الأولى التي أود طرحها عليك ، بالنظر إلى المدى الهائل من الخبرة التي اكتسبتها ، هل ترى نقطة في وقت قريب عندما يتباطأ أي من هذا؟ أو هل تعتقد أننا بالفعل في نقطة الدخول لخط النمو المستمر هذا؟ أعتقد أن واحدة من أكبر المشكلات التي تواجهها الشركات ، ومن ثَمَّ الأشخاص الذين يحاولون دعم التكنولوجيا التي يتم توفيرها لتلك الشركات لإدارة أعمالهم ، هو أن معدل التغيير كبير جدًا لدرجة أنهم لا يستطيعون مواكبة الجميع تختلف الميزات والبرامج والأنظمة والأطر والبنى الجديدة والكود الجديد ، ثم هل ترى أن معدل التغير الحالي يتباطأ على الفور؟ أعني أنك تتعامل مع هذه المجموعة الواسعة من المنصات مع مجموعة IDERA بأكملها ، هل سنتباطأ قريبًا أم هل نحن في قطار الشحن السريع المجنون لفترة طويلة حتى الآن؟

بيرت سكالزو: أعتقد أننا في الـ 20 بالمائة الأولى من منحنى النمو هذا ولدينا طريق طويل لنقطعه وهناك شيئان يدفعان به. التكنولوجيا لا تزال تتطور. لقد ذكرت بعض أنواع الذاكرة الجديدة التي ستظهر ، والتي ستكون رائعة. ستحصل سامسونج على محرك أقراص فلاش بسعة 20 تيرابايت هنا في وقت قريب. هذا سيغير الأشياء. لدينا كل قواعد بيانات NoSQL وقواعد البيانات السحابية ، هذا سيستمر. الشيء الوحيد الذي يبدو مضحكا هو أنه عندما أنظر إلى قواعد البيانات مثل Oracle و SQL Server وبعض القواعد الأخرى ، فإنها لم تعد في الواقع قواعد بيانات علائقية. يمكنني وضع بيانات غير منظمة في Oracle مع الحفاظ على توافق ACID. إذا كنت قد أخبرتني أنه قبل 20 عامًا ، قلت للتو إنك تعاطى المخدرات.

ديز بلانشفيلد: نعم ، نعم ، هم رائعون. حسنًا ، حتى الآن تلك المحركات التي لديها رؤوس متخصصة لطيفة جدًا مثل GIS ، أفضل من القدرة المحلية الآن. لقد قدمت بعض التعليقات الرائعة حول التحديات التي تواجه DBAs وأوقات مختلفة من DBAs التي نأمل أن نرى في جميع أنحاء المكان ، ولكن ما هو شكل العالم مع هذا النوع من طبقة العمل الذي تتعامل معه؟ أعني ، هؤلاء هم الأشخاص الذين يستخدمون الأنظمة الأساسية المختلفة من مدير التشخيص الخاص بك ، إلى أدوات الجرد ، وصولاً إلى رفع القيود ، وكيف تتعامل DBAs مع هذا التغيير ، وكيف تعرف نوعًا ما؟ ، ماذا يفعلون بأدواتكم للتعامل مع هذا التحول المهم في المشهد؟

بيرت سكالزو: حسنًا ، سأعود إلى ما يقرب من 20 عامًا ، ثم سأقول إن DBAs يحلون دورًا محددًا للغاية في المنظمة. وهي تعمل عادةً مع نظام أساسي واحد لقاعدة البيانات ، وربما اثنين ، وقد تمكنت من إدارة عدد صغير نسبياً من قواعد البيانات. الآن سريع التقدم إلى اليوم ومسؤول قاعدة البيانات ، سيتعرف على 10 منصات لقواعد البيانات. إنه يدير ، وهذه ليست مزحة ، في بعض الحالات الآلاف من قواعد البيانات ؛ هذا أكثر في عالم SQL Server أو عالم MySQL. ولكن لا يزال في عالم أوراكل يمكنهم إدارة مئات قواعد البيانات. وبالتالي ، فقد ظهرت كل هذه الميزات الجديدة ، كما أنها حصلت على كل هذه المنصات الجديدة ، ولديها جميع قواعد البيانات هذه التي يتحملونها. يبحثون عن أدوات لتمكين إنتاجيتهم وأيضًا لمساعدتهم على تعلم بعض الأشياء.

وسأعطيك مثالًا - إذا أردت تقسيم جدول ، فهو بناء جملة غامض جدًا ، وإذا أردت تقسيمه إلى قسم ، فإن بناء الجملة يصبح أكثر صعوبة. أنا أعرف ما أريد القيام به ، أريد إنشاء دلاء. إذا كان لديّ أداة مثل DBArtisan التي تقول: "مهلاً ، إليك شاشة جميلة تتيح لك التركيز على ما تحاول القيام به بدلاً من الطريقة التي تحاول القيام بها بها ، وأو بالمناسبة ، ادفع أظهر زر SQL عندما تنتهي ، وسنعرض لك ما هي لغة SQL بحيث يمكنك البدء في تعلم هذه اللغة وإتقانها. "

يجد DBAs أن الأدوات التي تساعدهم على إنجاز المهمة ، ولكنها تساعد أيضًا في تعليمهم كل هذه الأشياء الجديدة التي يستخدمونها وسيكون الشيء نفسه صحيحًا - دعنا نقول إنني رجل Oracle وأذهب إلى MySQL وأقول ، "حسنًا ، قم بإنشاء قاعدة بيانات ، DBArtisan. الآن أرني SQL لأنني أتساءل كيف يكون إنشاء قاعدة بيانات على MySQL وتعلمت فقط بناء الجملة. "وبالتالي ، فإننا لا نساعدهم فقط على العمل عبر قاعدة البيانات ، بل نعلمهم أيضًا عبر قاعدة البيانات.

ديز بلانشفيلد: يصبح الأمر أكثر إثارة للاهتمام عند الخروج ببعض أكثر حداثة - أو ليس أكثر حداثة ، هذا ليس من العدل أن نقول - ولكن ذات مرة قاعدة بيانات هي قاعدة بيانات. في هذه الأيام ، أرى كل شيء تتحدث عنه هناك مع التحدي الإضافي المتمثل في كدسات التكنولوجيا التي نراها تقليديًا من البائعين وأنت من النوع المفتوح المصدر فيها وأيضًا أنها جيدة. لا يقتصر الأمر على التعامل مع محركات قاعدة البيانات ولغات الاستعلام ، بل يتعاملون أيضًا مع أنواع البيانات ، الهيكلية وغير المنظمة ، كما تعلمون ، التحدي المتمثل في الاضطرار إلى التعامل مع كل شيء بدءًا من الطرف البعيد لطيف HDFS متعدد البايتات البيئة لحاويات صغيرة جدا ، وملفات الحزمة وتنسيقات ملفات السجل المختلفة.

وأعتقد أن هذا شيء الآن نراه حيث لا يوجد أي إنسان ، بغض النظر عن مقدار من الرجل الخارق ، المرأة الخارقة ، بغض النظر عما قد يعتقدون أنهم ، هم جسديا ، لا يستطيعون التعامل عقليا مع هذا المعدل من التغيير و حجم الاختلافات. أعتقد أن مجموعة الأدوات التي تقدمها الآن ستصل إلى نقطة حيث ستكون في مجموعة افتراضية تقريبًا بعدة طرق بحيث لا يمكننا تشغيل بيئات قاعدة البيانات التي حصلنا عليها بدونها لأننا فعليًا لا يمكن رمي العديد من الجثث عليهم. لقد استمتعت حقا العرض التقديمي الخاص بك. سأنتقل إلى الدكتور روبن بلور ، أنا متأكد من أنه لديه الكثير من الأسئلة التي يلقيها عليك أيضًا.

روبن بلور: حسنا. حسنًا ، لدي بالتأكيد أسئلة. بيرت ، لا أعرف إلى أين أنت ذاهب - لقد أجريت محادثة مثيرة للاهتمام بالفعل قبل يومين ، حيث بدأ شخص ما في إخباري بأحدث حماية لبيانات DU ، ويبدو لي من خلال ما قالوه إنه لا يصدق قاسية من حيث الأشياء التي أصروا عليها. تساءلت عما إذا كنت قد نظرت بالفعل إلى ذلك ؛ هل هو شيء أنت على دراية به؟

بيرت سكالزو: إطلاقا. بلى.

روبن بلور: 2016 ، حسنا ، أخبرنا عن ذلك.

بيرت سكالزو: وأنا فعلا -

روبن بلور: مثيرة للاهتمام للغاية.

بيرت سكالزو: لقد عملت بالفعل لفترة من الوقت لصالح أحد موردي الفلاش ، في منطقة قاعدة البيانات الخاصة بهم ، حيث ساعدهم في بناء منتجات فلاش لقواعد البيانات ، ويمكنني أن أخبرك أن الوحشي يسير على الطريق. ما أقصده هو أنه إذا كنت تتذكر شريحة واحدة الخاصة بي ، فقلت في بعض قواعد البيانات أنها ستقوم بالتشفير ولكنها تضعها في ذاكرة الخادم وفي بعض قواعد البيانات تشفير - لا يزال يتم تشفيرها في ذاكرة الخادم ، يتم فك تشفيرها فقط عند يتم إرسالها إلى العميل. حسنًا ، ستجد أيضًا بعضًا من هذه المعايير الحكومية ، خاصة وزارة الدفاع أو الجيش هنا في الولايات المتحدة ، كما أنها تتجه إلى مستوى الفلاش ولا تريد أن تعرف فقط أنك تدعم التشفير وفك التشفير في أجهزتك ، ولكن إذا سرق شخص ما الرقائق التي - كما تعلمون ، أخرجها من الشيء ، من الخادم الخاص بك ، فإن ما يوجد هناك مشفر ، وعلى الرغم من أن لديهم سعة تخزينية ، فلن يكونوا كذلك على طول الطريق إلى الفعلي - ليس إلى جزء فلاش نفسه ولكن إلى رقائق الفردية. لقد أرادوا أن يعرفوا هذه الرقاقة بالشريحة ، فكل شيء مشفر.

روبن بلور: نجاح باهر. أعني أن هناك الكثير من الأشياء التي - كما تعلمون ، أعتقد أنها شريحة واحدة أو شريحتان قمت بإعدادها حول هذا الموضوع ، لكنه كان شيئًا ، سيناريو أعتقد أنه مثير للاهتمام حقًا. على سبيل المثال ، يجب أن يكون تنقيح المعلومات أكثر ذكاءً من مجرد إخفاء الحقول المختلفة لأنه خاصة مع التعلم الآلي في الوقت الحاضر ، يمكنك القيام بأشياء استنتاجية تسمح لك بتصفح المعلومات التي لا يمكن أن تظهر لك من قبل.

إذا كنت تحاول الحماية ، دعنا نقول المعلومات الصحية ، فهذه قواعد صارمة للغاية في الولايات المتحدة فيما يتعلق بالمعلومات الصحية ، ولكن يمكنك فعلاً ، باستخدام أساليب مختلفة للتعلم الآلي ، يمكنك في الغالب معرفة من هو شخص طبي المعلومات في الواقع هو. لقد تساءلت فقط عما إذا كان لديك أي شيء تقوله حول هذا الموضوع لأنهم يعتقدون جميعًا أن هذا مجال مثير للاهتمام.

بيرت سكالزو: نعم ، بالتأكيد ، وأنا فقط استخدم هذا كمثال ، أنا لا أحاول أن أقول أن قاعدة بيانات واحدة أفضل من قاعدة أخرى ، ولكن هذا مثال جيد للغاية على ما طلبته للتو. في Oracle ، إذا لم يُسمح لي برؤية صف من البيانات على سبيل المثال ، لا يُسمح لي برؤية السجل الطبي لجون سميث. في Oracle ، إذا قلت ، "حدد هذا السجل" ، فسوف يتم حظره أو سيتم السماح لي برؤية ما يُسمح لي برؤيته وسيتم تنقيحه. وإذا قلت ، "حدد نجمة الحساب من الجدول حيث يساوي جون سميث" ، فستحصل على صفر.

في SQL Server ، يمكن أن تفعل التنقيح ولكن لديها بعض الثقوب. إذا قلت ، "حدد نجمة الحساب من الجدول حيث تساوي جون سميث" ، فسوف أسترجع حسابًا واحدًا ، لذلك أعرف أن هناك جون سميث. واحد أكثر أمانا من الآخر. الآن أتوقع منهم إصلاح ذلك ، فهم يلعبون دائمًا قفزة قفزة مع بعضهم البعض. ومرة أخرى ، لا أحاول التمييز بين قواعد البيانات بخلاف إظهار مثال على - ما الذي نتحدث عنه الآن ، شيء بسيط مثل تحديد الحساب يجب أن يتم تخفيضه أيضًا من خلال التنقيح ، على الرغم من الناحية الفنية يتحدث ، لا يوجد شيء يجري تنقيحه غير وجود الصف.

روبن بلور: نعم صحيح. هذا نوع مثير للاهتمام. أقصد ، سؤال عام آخر لأنني لا أملك الكثير من الوقت ، يتعلق بالتحسينات.أعني أنك كنت في واحدة حيث أعرف أنك كنت تعرض لنا أمثلة على نتائج الاختبارات المختلفة التي قمت بتشغيلها - هل تعتقد أن قواعد البيانات التقليدية ، دعنا نسميها قواعد البيانات السائدة ، SQL Server و Oracle ، هل أعتقد أنهم سيبقون قبل الانتهاء؟ أو هل تعتقد أنهم سيصطادون فعلاً من قبل واحد أو آخر من أنواع مختلفة من الاضطرابات في السوق التي تخدمهم حقًا؟ ما هو رأيك؟

بيرت سكالزو: لدي رأي وهو - كما تعلمون ، سأقول مرة أخرى أنه رأيي - مايكروسوفت على سبيل المثال ، في حقبة ما بعد بالمر تثير إعجاب الجحيم الحي. أعني أن قاعدة البيانات الممتدة هذه تحصل على SQL Server على Linux ، والحصول على .NET على Linux ، والحصول على PowerShell على Linux ؛ لا أعتقد أن موردي قواعد البيانات التقليديين سيتخلفون عن الركب. أعتقد أنهم قرروا ، "مهلاً ، دعوا اللاعبين الجدد ، الشركات الناشئة تحدد شيئًا ما. اسمح لهم باكتشاف ماهية الشرح وكيف ينبغي أن يكون الكمال ، وبمجرد قيامهم بجميع البحوث والتطوير ، نحن نعرف بالضبط ما يريده المستخدمون ، والآن دعونا نضيف المشاركة إلى Oracle. "أعتقد أنهم أصبحوا أذكياء و القول ، "مهلاً ، أن تكون في المرتبة الثانية أو الثالثة ليس بالأمر السيء عندما تكون اللاعب المهيمن لأن الناس لن يهاجروا منك."

روبن بلور: نعم ، أعني أنها استراتيجية تم استخدامها. أعني أن شركة IBM اعتادت أن تفعل ذلك وكل هذا - بالنسبة إلى نطاقات منتجاتها بأكملها ، وهي جيدة بشكل معقول إلى أن يأتي شخص ما بشيء خارج الجدار تمامًا لم يفكر به أحد من قبل ، ولكن لا يمكنك التخطيط له ضد ذلك على أي حال.

أسئلة من الجمهور ، اريك؟

إريك كافانا: نعم ، لكنك حصلت على وقت أعتقد أنه لمرة واحدة وأنا أعرف أن بيرت يجب أن يركض. كان هناك شيء هنا - حسناً ، هندسة المشاركة في Oracle 12c هي أن هذا مؤشر على - أو ما هو ذلك في رأيك ، ما الذي يحدث هناك في رأيك؟

بيرت سكالزو: حسنًا ، تمتص أوراكل أو تقدم كل ما يوفره جميع موردي قواعد البيانات الآخرين. على سبيل المثال ، يمكنني وضع بيانات غير منظمة في Oracle. لا أعرف كيف يمكنك وضع بيانات غير منظمة ومن ثم نسميها قاعدة بيانات علائقية ، لذلك ليس لها أي معنى ، لكن يمكنك ذلك. والآن تضيف Oracle التقسيم ، لذلك تقول Oracle ، "هل تعرف ماذا؟ أيا كان ما يريده السوق ، سنقدم قاعدة بياناتنا لأن السوق يريد ما يريده السوق ونريد تقديم الحل ، نريدهم أن يبقوا معنا ".

أعتقد أنك سترى عناصر إضافية. لن أتفاجأ برؤية مجموعات قاعدة بيانات تشبه Hadoop ليس في حامل أوراكل أو مجموعة تطبيقات حقيقية ، ولكن بشكل أساسي في مجموعات تقليدية من نوع Hadoop تقوم بهذا التقسيم. وبالتالي أعتقد أنك ستتمكن من نشر قاعدة بيانات مثل Oracle مثلك مثل Hadoop ، وسوف يستمر هذا النوع من الاتجاهات. كبار موردي قواعد البيانات هؤلاء ، يجنيون مليارات الدولارات ولا يريدون أن يخسروا سوقهم ، لذلك هم على استعداد للتكيف مع أي شيء أو اعتماد أي شيء.

إريك كافانا: حسنًا ، كما تعلمون ، إنه أمر مضحك لأنني تابعت بائعي المصادر المفتوحة لبعض الوقت وتساءلت عن ذلك طوال الوقت الذي سيكون له تأثير كبير على تقنية الأبواب المغلقة التقليدية ، ولأنه من المؤكد شعرت لقد حقق البائعون ذوو المصادر المفتوحة بعض التقدم الجاد ، والآن وأنا أنظر إلى السوق ، أرى نوعًا من ما تقوله ، وأن اللاعبين الكبار قاموا برياضتهم ، وشحذوا أقلامهم واكتشفوا كيف يمكنهم الحياكة الكثير من هذه الأشياء في بنياتها. سواءً كان IBM أو Oracle أو SAP - كنت فقط في مؤتمر SapphireNow الشهر الماضي ، وتفاخر ستيف لوكاس ، الذي يرأس نصف تلك الشركة ، بأن SAP يدمج الآن في نظامها السحابي HANA ، أي مكونات مفتوحة المصدر أكثر من أي من مكوناتها المنافسين. إذا قمت بالرياضيات في ذلك ، فهذا بيان مثير للإعجاب ويخبرني أن اللاعبين الكبار لن يذهبوا إلى أي مكان قريبًا.

بيرت سكالزو: لا ، كنت أراهن بأموالي على حد سواء. أعني إذا نظرت ، كان سعر سهم Microsoft مؤخرًا حوالي 50 دولارًا ، كما تعلمون ، كان منذ 25 عامًا فقط منذ 25 عامًا. لا تضاعف سعر سهمك في فترة قصيرة ما لم تفعل أشياء جيدة ، تعرف ، من القيام بكل شيء بدءًا من Windows 10 مجانًا للسنة الأولى وحتى جميع الأشياء الذكية الأخرى التي يقومون بها ، أعتقد أن ميزة قاعدة البيانات الممتدة هذه هي مجرد اعتيادية. أعتقد أن ما سيحدث هو أن الكثير من الناس سينتهي بهم المطاف في أزور ، وليس بشكل مباشر ، وليس كما قالوا ، "دعنا ننتقل إلى قاعدة البيانات الخاصة بي إلى أزور". سوف تهاجر إلى هناك بطريقة سحرية لأنه سيتم أرشفتها هناك باستخدام هذه الميزة الجديدة لقاعدة البيانات الممتدة ، وبالتالي فإن اعتماد Azure سوف يرتفع.

إريك كافانا: حسنًا ، هذا أحد الاتجاهات السائدة في السوق والتي يمكنني رؤيتها ، حتى على جهاز Mac. بينما تذهب في جهاز Mac لحفظ بعض المستندات ، فإنهم الآن - وأنظمة Macs الأحدث فقط تتبع السحابة ، أليس كذلك؟ أقصد ، هناك الكثير من المعنى في تلك الاستراتيجية وأنظر إليها أيضًا وأذهب إليها ، "حسنًا يا شباب ، أنت تحاول أن تغريني جزءًا تلو الآخر في البيئة السحابية الخاصة بك ، ثم يومًا ما عندما أرغب في مشاهدة بعض الأفلام إذا انتهت صلاحية بطاقتي الائتمانية سأواجه مشكلة. "

بيرت سكالزو: نعم ، لكنك تفعل ذلك على.

إريك كافانا: بلى. هذا صحيح.

بيرت سكالزو: كنت وضعت كل شيء على.

إريك كافانا: حسنا ، ليس كل شيء تماما.

بيرت سكالزو: لا ، أقصد -

إريك كافانا: هيا الى الامام.

بيرت سكالزو: هذه الاتجاهات الاجتماعية تصل إلى الشركات. الآن لا يزال لدى الشركات الكثير من الأشياء الأخرى التي يتعين عليها القيام بها ، لكنهم يرون هذه الاتجاهات ويفعلون نفس النوع من الأشياء. لا أرى إما Oracle أو Microsoft يرحلان. في الحقيقة ، سأقوم بشراء الأسهم في كل مرة يحدث فيها تراجع.

إريك كافانا: نعم فعلا حسناً أيها الناس ، اذهب إلى idera.com ، I-D-E-R-A دوت كوم. كما قال بيرت ، لديهم مجموعة كاملة من الأشياء المجانية الموجودة هناك ، وهي واحدة من الاتجاهات الجديدة في السوق - تمنحك بعض الأشياء المجانية لتلعب بها ، لتحصل على مدمن مخدرات ، ثم تذهب لشراء الأشياء الحقيقية.

الناس ، وكانت هذه تكنولوجيا ساخنة أخرى. شكرا على وقتك اليوم ، بيرت ، ديز بالطبع ، وروبن كذلك. سنتحدث إليكم الأسبوع المقبل ، أيها الأشخاص ، والكثير من الأشياء التي تحدث. إذا كان لديك أي أفكار ، فلا تتردد في رأيك. سنتحدث إليكم في المرة القادمة ، تعتني بهم. مع السلامة.