Walton Electronics Co., Ltd.
اتصل بنا

اتصل شخص : Walton-cara

رقم الهاتف : 15986872308

Free call

يتطلب التعلم الآلي خطوات متعددة

July 18, 2022

مقدمة

يعد نشر التعلم الآلي (ML) عملية متعددة الخطوات.يتضمن اختيار نموذج ، وتدريبه على مهمة محددة ، والتحقق من صحته ببيانات الاختبار ، ثم نشر النموذج ومراقبته في الإنتاج.هنا ، سنناقش هذه الخطوات ونفصلها لتعريفك بـ ML.يشير ML إلى الأنظمة التي ، بدون تعليمات واضحة ، تكون قادرة على التعلم والتحسين.تتعلم هذه الأنظمة من البيانات لأداء مهمة أو وظيفة معينة.في بعض الحالات ، التعلم.أو تدريب أكثر تحديدًا ، يحدث بطريقة خاضعة للإشراف حيث تؤدي المخرجات غير الصحيحة إلى تعديل النموذج لدفعه نحو المخرجات الصحيحة.في حالات أخرى ، يحدث التعلم غير الخاضع للإشراف حيث ينظم النظام البيانات للكشف عن أنماط غير معروفة من قبل.تتبع معظم نماذج ML هذين النموذجين (التعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف).دعنا الآن نتعمق في المقصود بالنموذج ثم نستكشف كيف تصبح البيانات وقودًا لتعلم الآلة.نموذج التعلم الآلي النموذج هو تجريد لحل للتعلم الآلي.يحدد النموذج العمارة - التي بمجرد تدريبها تصبح تطبيقًا.لذلك ، نحن لا ننشر النماذج.ننشر تطبيقات للنماذج المدربة من البيانات (المزيد حول هذا في القسم التالي).لذا فإن النماذج بالإضافة إلى البيانات بالإضافة إلى التدريب على مثيلات متساوية من حلول ML (الشكل 1).الترجمة مطلوبة.على سبيل المثال ، يتطلب إدخال البيانات النصية في شبكة التعلم العميق ترميز الكلمات في شكل رقمي يكون عادةً متجهًا عالي الأبعاد نظرًا للعديد من الكلمات التي يمكن استخدامها.وبالمثل ، قد تتطلب المخرجات ترجمة من الشكل العددي إلى شكل نصي.تأتي نماذج ML في العديد من الأنواع ، بما في ذلك نماذج الشبكة العصبية ونماذج Bayesian ونماذج الانحدار ونماذج التجميع والمزيد.يعتمد النموذج الذي تختاره على المشكلة المطروحة.في سياق الشبكات العصبية ، تتراوح النماذج من الشبكات الضحلة متعددة الطبقات إلى الشبكات العصبية العميقة التي تتضمن العديد من الطبقات

من الخلايا العصبية المتخصصة (وحدات المعالجة).تحتوي الشبكات العصبية العميقة أيضًا على مجموعة من النماذج المتاحة بناءً على التطبيق المستهدف.

فمثلا:

● إذا كان تطبيقك يركز على تحديد الكائنات داخل الصور ، فإن الشبكة العصبية التلافيفية (CNN) هي النموذج المثالي.تم تطبيق CNNs للكشف عن سرطان الجلد وتفوق على طبيب الأمراض الجلدية العادي.

● إذا كان التطبيق الخاص بك يتضمن توقع أو إنشاء تسلسلات معقدة (مثل جمل اللغة البشرية) ، فإن الشبكات العصبية المتكررة (RNN) أو شبكات الذاكرة طويلة المدى (LSTM) هي نماذج مثالية.تم أيضًا تطبيق LSTMs على الترجمة الآلية للغات البشرية.

● إذا كان التطبيق الخاص بك يتضمن تفكيك محتويات صورة بلغة بشرية ، فيمكن استخدام مزيج من CNN و LSTM (حيث يتم إدخال الصورة في CNN ويمثل إخراج CNN الإدخال إلى LSTM ، والذي ينبعث تسلسل الكلمات).

● إذا كان تطبيقك يتضمن إنشاء صور واقعية (مثل المناظر الطبيعية أو الوجوه) ، فإن شبكة الخصومة التوليدية (GAN) تمثل النموذج الأساسي الحالي.تمثل هذه النماذج بعضًا من أبنية الشبكات العصبية العميقة الأكثر شيوعًا المستخدمة اليوم.تحظى الشبكات العصبية العميقة بشعبية لأنها يمكن أن تقبل البيانات غير المهيكلة مثل الصور أو الفيديو أو المعلومات الصوتية.تنشئ الطبقات داخل الشبكة تسلسلاً هرميًا من الميزات التي تسمح لها بتجميع المعلومات المعقدة للغاية.أظهرت الشبكات العصبية العميقة أداءً متطورًا على عدد كبير من مجالات المشكلات.ولكن مثل نماذج ML الأخرى ، تعتمد دقتها على البيانات.دعنا نستكشف هذا الجانب بعد ذلك.

البيانات والتدريب

البيانات هي الوقود الذي يدفع التعلم الآلي ، ليس فقط أثناء التشغيل ولكن أيضًا في إنشاء حل ML من خلال تدريب النموذج.في سياق بيانات التدريب للشبكات العصبية العميقة ، من المهم استكشاف البيانات الضرورية في سياق الكمية والنوعية.تتطلب الشبكات العصبية العميقة كميات كبيرة من البيانات للتدريب.إحدى القواعد الأساسية للتصنيف المعتمد على الصور هي 1000 صورة

لكل فصل.لكن الإجابة تعتمد على مدى تعقيد النموذج والتسامح مع الخطأ.تنتج بعض الأمثلة من حلول ML للإنتاج مجموعة من أحجام مجموعات البيانات.يتطلب نظام اكتشاف الوجه والتعرف عليه 450.000 صورة ، وتم تدريب روبوت محادثة للأسئلة والأجوبة بـ 200000 سؤال مقترنة بمليوني إجابة.يمكن أن تكون مجموعات البيانات الأصغر كافية أيضًا بناءً على المشكلة التي يتم حلها.يتطلب حل تحليل المشاعر الذي يزيل استقطاب الرأي من النص المكتوب عشرات الآلاف من العينات فقط.جودة البيانات لا تقل أهمية عن الكمية.نظرًا لمجموعات البيانات الكبيرة المطلوبة للتدريب ، حتى الكميات الصغيرة من بيانات التدريب الخاطئة يمكن أن تؤدي إلى حل ضعيف.اعتمادًا على نوع البيانات اللازمة ، قد تخضع بياناتك لعملية تطهير.هذا يضمن أن مجموعة البيانات متسقة ، وتفتقر إلى البيانات المكررة ، ودقيقة ، وكاملة (تفتقر إلى بيانات غير صالحة أو غير كاملة).توجد أدوات لدعم هذه العملية.التحقق من صحة البيانات من أجل التحيز مهم أيضًا للتأكد من أن البيانات لا تؤدي إلى حل ML متحيز.يعمل تدريب ML على البيانات الرقمية ، لذلك قد تكون هناك حاجة إلى خطوة معالجة مسبقة حسب الحل الخاص بك.على سبيل المثال ، إذا كانت بياناتك لغة بشرية ، فيجب أولاً ترجمتها إلى صيغة رقمية لمعالجتها.يمكن معالجة الصور مسبقًا لتحقيق الاتساق.على سبيل المثال ، سيتم تغيير حجم الصور التي يتم إدخالها في شبكة عصبية عميقة وتسهيلها لإزالة الضوضاء (من بين عمليات أخرى).واحدة من أكبر المشاكل في ML هي الحصول على مجموعة بيانات لتدريب حل ML الخاص بك.قد يكون هذا أكبر مسعى بناءً على مشكلتك لأنها قد لا تكون موجودة وتتطلب جهدًا منفصلاً

لالتقاط.أخيرًا ، يجب تقسيم مجموعة البيانات بين بيانات التدريب وبيانات الاختبار.يتم استخدام جزء التدريب لتدريب النموذج ، وبمجرد التدريب ، يتم استخدام بيانات الاختبار للتحقق من دقة الحل

 

ابق على تواصل معنا

اكتب رسالتك