به خودآموز یادگیری ماشین خوش آمدید. این مجموعه برای آموزش مفاهیم یادگیری ماشین از سطح مبتدی تا پیشرفته آماده شده است. به همین دلیل سعی کرده ایم تا مفاهیم را به ساده ترین شکل ممکن ، مطرح کنیم.

آیا تا به حال برای خرید به بقالی رفته اید؟ قبل از رفتن به بازار چه کار می کنید؟ من همیشه لیستی از مواد لازم را از قبل آماده می کنم. همچنین با توجه به تجربه خرید قبلی، تصمیم گیری می کنم.

سپس، به مغازه رفته و اجناس را خریداری می کنم. اما با افزایش تورم، کار کردن مطابق دخل و خرج، کار آسانی نیست. من متوجه شدم که برنامه ریزی دخل و خرج من وقت زیادی می گیرد. دلیلش این است که مغازه دار، مقدار و قیمت یک محصول را مدام تغییر می دهد. به دلیل چنین عواملی، من باید لیست خرید خود را تغییر دهم. در به روزرسانی لیست، برای هر تغییر، تلاش، تحقیق و زمان زیادی لازم است. اینجاست که یادگیری ماشین می تواند به نجات شما بیاید.

گیج کننده بود؟

نگران نباشید! برای دریافت بینش عمیق و درک این موضوع که چرا یادگیری ماشین اینچنین رواج یافته، این خود آموز یادگیری ماشین را بخوانید.

یادگیری ماشین چیست؟

یادگیری ماشین رایج ترین تکنیک پیش بینی آینده یا طبقه بندی (کلاسه بندی) اطلاعات برای کمک به افراد در تصمیم گیری های ضروری است. الگوریتم های یادگیری ماشین، بر روی موارد یا نمونه هایی که تجربیات گذشته را فرا گرفته و همچنین داده های تاریخی را تحلیل می کنند، آموزش داده می شوند. بنابراین، از آنجا که با این نمونه ها، بارها و بارها آموزش می بیند، قادر به شناسایی الگو هایی به منظور پیش بینی آینده می باشد.

آموزش یادگیری ماشین : مقدمه ای بر یادگیری ماشین

بعد از دانستن اینکه یادگیری ماشین چیست، بیایید یک مقدمه ی سریع بر یادگیری ماشین داشته و آموزش را شروع کنیم.

با کمک یادگیری ماشین می توانیم سیستم های هوشمندی را توسعه دهیم که قادر به تصمیم گیری های خودگردان باشند. این الگوریتم ها توسط نمونه های قبلی داده ها، از طریق تحلیل آماری و تطابق الگو، آموزش داده می شوند. سپس، بر اساس داده های آموزش داده شده، نتایج پیش بینی شده را در اختیار ما قرار می دهند.

داده ها ، هسته اصلی الگوریتم های یادگیری ماشین هستند. با کمک داده های تاریخی، ما با آموزش این الگوریتم های یادگیری ماشین، قادر به ایجاد داده های بیشتری هستیم. به عنوان مثال، شبکه های مولد تخاصمی ، یک مفهوم پیشرفته از یادگیری ماشین است که با تصاویر تاریخی آموزش می بیند و به وسیله آن ها قادر به تولید تصاویر بیشتری است. این امر همچنین در مورد گفتار و متن نیز قابل اعمال است. بنابراین، یادگیری ماشین پتانسیل وسیعی برای کاربرد های علم داده ایجاد کرده است.

یادگیری ماشین ترکیبی از علوم رایانه، ریاضیات و آمار است. آمار برای ترسیم استنتاج از داده ها ضروری است. ریاضیات برای توسعه مدل های یادگیری ماشین مفید است و در نهایت، از علوم رایانه برای اجرای الگوریتم ها استفاده می شود.

با این حال، صرفاً ساختن مدل ها کافی نیست. شما همچنین باید مدل را به طور مناسب بهینه و تنظیم کنید تا نتایج دقیقی را برای شما فراهم کند. تکنیک های بهینه سازی شامل تنظیم ابر پارامتر ها برای رسیدن به نتیجه مطلوب است.

یادگیری ماشین در هر حوزه مورد استفاده قرار می گیرد. از آن برای انتقال اطلاعات به سیستم های ایستا استفاده می شود. با دانش بدست آمده از داده ها، از آن برای ساخت محصولات هوشمند استفاده می شود.

چرا یادگیری ماشین؟

دنیای امروز در حال تحول بوده و نیاز ها و ملزومات مردم نیز به همین گونه است. علاوه بر این، ما شاهد یک انقلاب صنعتی چهارم از داده ها هستیم. برای بدست آوردن بینش معناداری از این داده ها و یاد گرفتن از نحوه استفاده افراد و رابط سیستم با داده ها، به الگوریتم های محاسباتی احتیاج داریم که بتواند داده ها را تحلیل کرده و به ما نتایجی را ارایه دهد که به روش های مختلف برای ما سودمند باشند. یادگیری ماشین در صنایعی مانند پزشکی، مراقبت های بهداشتی، تولید، بانکداری و چندین صنعت دیگر تحول ایجاد کرده است. بنابراین، یادگیری ماشین به بخش مهمی از صنعت مدرن تبدیل شده است.

داده ها به صورت نمایی در حال گسترش هستند و برای مهار قدرت این داده ها، با افزایش عظیم قدرت محاسباتی، یادگیری ماشین ابعادی دیگر به نحوه درک اطلاعات اضافه کرده است. یادگیری ماشین در همه جا مورد استفاده قرار می گیرد. وسایل الکترونیکی که از آن ها استفاده می کنید، نرم افزار هایی که بخشی از زندگی روزمره شما هستند، با الگوریتم های قدرتمند یادگیری ماشین کار می کنند.

مثالی از یادگیری ماشین : گوگل می تواند بر اساس عادات کاوش در اینترنت، نتایج جستجوی مناسب را در اختیار شما قرار دهد. به طور مشابه، Netflix بر اساس الگوریتم های یادگیری ماشین که پیش بینی ها را بر اساس تاریخچه تماشای شما انجام می دهند، قادر به ارائه فیلم ها یا نمایش هایی است که می خواهید تماشا کنید.

علاوه بر این، یادگیری ماشین به اتوماسیون کار های خسته کننده کمک کرده است و نیاز به کار دستی را از بین برده، همه این ها به دلیل انبوهی از داده هاست که شما بطور روزانه تولید می کنید. یادگیری ماشین چندین روش برای درک این داده ها ارائه کرده و نتایج ثابت و دقیقی را در اختیار شما قرار می دهد.

یادگیری ماشین چگونه کار می کند؟

با افزایش نمایی داده ها، نیاز به داشتن سیستمی وجود دارد که بتواند این بار عظیم داده را کنترل کند. مدل های یادگیری ماشین مانند یادگیری عمیق ، به اکثریت وسیعی از داده ها اجازه می دهند که با تولید دقیقی از پیش بینی ها ، کنترل شوند. یادگیری ماشین در شیوه درک اطلاعات و نگرش های مختلفی که می توانیم از آن به دست آوریم، تحول ایجاد کرده است.

الگوریتم های یادگیری ماشین از الگوهای موجود در داده های آموزشی برای انجام کلاسه بندی و پیش بینی های آینده استفاده می کنند. هر زمان که هر ورودی جدید به مدل یادگیری ماشین معرفی شود، الگو های آموخته شده خود را بر روی داده های جدید اعمال می کند تا پیش بینی های آینده را انجام دهد. براساس دقت نهایی، می توان مدل های خود را با استفاده از روش های استاندارد شده مختلف بهینه سازی کرد. بدین ترتیب، مدل یادگیری ماشین می آموزد که با مثال های جدید سازگار شده و نتایج بهتری ایجاد کند.

مقاله ی بعدی انواع آموزش یادگیری ماشین است. نگاهی به آن بیاندازید.

انواع یادگیری ماشین

الگوریتم های یادگیری ماشین را می توان در ۳ نوع به شرح زیر طبقه بندی کرد :

یادگیری نظارت شده ( Supervised Learning )
یادگیری بدون نظارت ( Unsupervised Learning )
یادگیری تقویتی ( Reinforcement Learning )

یادگیری نظارت شده

در یادگیری نظارت شده، مجموعه داده هایی که با آن ها، مدل خود را آموزش می دهیم، برچسب گذاری شده است. یک نگاشت واضح و مشخص از ورودی و خروجی وجود دارد. با توجه به داده های ورودی نمونه، این مدل می تواند توسط نمونه ها آموزش داده شود. یک نمونه از یادگیری نظارت شده، فیلتر کردن اسپم است. بر اساس داده های برچسب خورده، مدل می تواند مشخص کند که آیا این داده ها اسپم هستند یا نه. این یک شکل ساده تر از آموزش است. فیلتر کردن اسپم مثالی از این نوع الگوریتم یادگیری ماشین است.

یادگیری بدون نظارت

در یادگیری بدون نظارت، داده های برچسب خورده ای وجود ندارد. این الگوریتم، الگو های درون مجموعه داده ها را شناسایی کرده و آن ها را فرا می گیرد. این الگوریتم بر اساس چگالی داده ها ، آن ها را در دسته های مختلف قرار می دهد. با استفاده از آن، می توان داده های با بُعد بالا را تجسم کرد. یک نمونه از این نوع الگوریتم یادگیری ماشین، تحلیل مولفه های اصلی است. علاوه بر این، خوشه بندی K-Means نوع دیگری از آموزش بدون نظارت است که در آن داده ها در گروه هایی با نوع یکسان، دسته بندی می شوند.

فرآیند آموزش در یادگیری بدون نظارت صرفاً بر اساس یافتن الگو ها در داده ها است. مدل، بعد از یادگیری الگو ها، نتیجه گیری می کند.

یادگیری تقویتی

یادگیری تقویتی نوعی الگوریتم یادگیری ماشین نوظهور و محبوب است و در سیستم های مختلف خودگردان مانند خودرو ها و رباتیک صنعتی استفاده می شود. این الگوریتم تلاش می کند در یک محیط پویا، به یک هدف برسد. این نوع یادگیری، می تواند بر اساس پاداش های متعددی که توسط سیستم به آن اعطا می شود، به هدفش برسد.

بیشترین کاربرد آن در برنامه نویسی ربات ها برای انجام اقدامات خودگردان است. همچنین در ساخت خودروهای خودران هوشمند نیز مورد استفاده قرار می گیرد. می توانیم مثال ناوبری رباتیک را هم در نظر بگیریم. علاوه بر این، با آزمایش بیشتر با عامل موجود در محیط خود، می توان بهره وری را بهبود بخشید. این هدف اصلی یادگیری تقویتی است. زنجیره اقدامات مشابهی در یک مدل یادگیری تقویت وجود دارد.

الگوریتم های یادگیری ماشین

بیایید برخی از روش های رایج یادگیری ماشین را ببینیم:

۱- رگرسیون

از مدل های رگرسیون ( Regression ) بطور گسترده برای پیش بینی مقادیر مبتنی بر متغیر هایی که به چندین عامل وابسته هستند، استفاده می شود. متداول ترین نمونه رگرسیون، رگرسیون خطی است که در آن رابطه خطی یا همبستگی بین متغیر پیش بینی کننده و متغیر پاسخ وجود دارد. همچنین انواع دیگری از رگرسیون مانند رگرسیون ARIMA وجود دارد که از یک مدل رگرسیون خود همبسته برای پیش بینی مقادیر پیوسته ارائه شده توسط داده های سری زمانی، استفاده می کنند. آن ها در پیش بینی قیمت سهام و سایر مقادیر مبتنی بر زمان، مورد استفاده قرار می گیرند.

۲- یادگیری درخت تصمیم گیری

درخت تصمیم گیری ( Decision Tree ) یک نوع نظارت شده از الگوریتم های یادگیری ماشین است. این درخت ها عمدتاً برای مدل سازی پیشگویانه استفاده می شوند. ما یک درخت تصمیم گیری ایجاد می کنیم که قادر به تصمیم گیری بر اساس ورودی کاربر باشد. درخت تصمیم گیری می تواند برای هم برای رگرسیون و هم برای کلاسه بندی استفاده شود. این درخت ها بر اساس چندین متغیر مستقل، خروجی های گرافیکی به کاربر ارائه می دهند.

۳- ماشین های بردار پشتیبانی

ماشین های بردار پشتیبانی یا SVM الگوریتم های یادگیری ماشین هستند که برای کلاسه بندی داده ها به دو دسته یا کلاس استفاده می شوند. این یک نوع از الگوریتم های یادگیری نظارت شده است که از انواع کرنل برای کلاسه بندی داده ها استفاده می کنند. این الگوریتم، می تواند بر اساس پیش بینی های انجام شده، طبقه بندی کند که آیا داده در این کلاس قرار می گیرد یا در کلاس دیگر.

با کمک SVM ها می توان کلاسه بندی خطی و غیر خطی را انجام داد. یک کلاسه بند SVM با استفاده از ابرصفحه، داده ها را به دو کلاس تقسیم می کند.

۴- یادگیری قوانین وابستگی

استخراج قوانین وابستگی ( Association Rule Mining ) برای یافتن روابط بین چندین متغیر موجود در پایگاه داده، استفاده می شود. این یادگیری، نوعی روش داده کاوی است که از طریق آن می توانید وابستگی بین موارد مختلف را کشف کنید. در صنایع فروش بیشتر برای پیش بینی اینکه “آیا اگر مشتری کالا X را خریداری کرده باشد، کالای Y را خریداری می کند؟” کاربرد دارد.

۵- شبکه های عصبی مصنوعی (ANN)

شبکه عصبی مصنوعی، شکلی پیشرفته از روش یادگیری ماشین است. شبکه های عصبی مطابق سیستم عصبی انسان مدلسازی می شوند و به همین دلیل شبکه های عصبی نامیده شده اند. در این شبکه ها چندین نورون متصل وجود دارد که اطلاعات را محاسبه می کنند. نورون ها ساختار آماری را ضبط کرده و بنابراین قادر به ایجاد توزیع احتمال مشترک برای متغیر های ورودی هستند.

این شبکه های عصبی برای یافتن الگو های مجموعه داده های بزرگ، مناسب هستند. شبکه های عصبی می توانند کلاسه بندی و همچنین رگرسیون را با دقت بالا انجام دهند. علاوه بر این، آن ها نیاز به انجام کار های آماری سنگین در پیش پردازش را از بین می برند زیرا آن ها برای درک الگو ها ، به تنهایی کاملا مناسب هستند.

۶- برنامه نویسی منطق استقرایی

در این روش، برنامه نویسی منطقی ( Association Rule Mining )، بخش اصلی را برای تولید یک مدل یادگیری قانونمند تشکیل می دهد. برنامه نویسی منطق استقرایی یا ILP ، اطلاعات ورودی، فرضیه و همچنین دانش پیش زمینه ای وابسته به محتوا را در قالب چندین قانون ارائه می دهد که باید از منطق پیروی کنند. این روش، از برنامه های کاربردی استفاده می کند تا برنامه نویسی منطق استقرایی را برای پردازش فرضیه در قوانین جزئی بکار برد.

مدل های آموزشی اغلب برای توسعه این مدل مورد استفاده قرار می گیرند که سپس برای ایجاد روابط بین چندین متغیر استفاده می شود.

۷- یادگیری تقویتی

هدف از یادگیری تقویتی این است که عامل را به سمت بیشتر شدن پاداش ها و رسیدن به هدفشان، هدایت کنیم. این امر در یک محیط پویا اتفاق می افتد که عامل مجبور است از طریق سلسله آزمون و خطا ها مسیر خود را برای رسیدن به هدف مشخص کند. هر بار که مسیری صحیح را طی کند، شانسش افزایش یافته و هنگامی که با یک روش نادرست روبرو شود، شانسش کاهش می یابد. یادگیری تقویتی به طور گسترده در خودرو های خودران و رباتیک های خودگردان که باید خودشان تصمیم گیری کنند، مورد استفاده قرار می گیرد.

یادگیری های تقویتی ماهیت تجربی دارند و از طریق یک سری آزمایشات می توانند با حداکثر دقت به اهداف خود برسند.

۸- خوشه بندی

در خوشه بندی ( Clustering )، مشاهدات به گروه ها یا خوشه ها تقسیم می شوند. این خوشه ها بر اساس داده های یکسان شکل گرفته و معیار های مشابهی دارند. این معیار ها می توانند چگالی یا ساختار یکسان داده ها باشند. چندین روش خوشه بندی وجود دارد که از معیارهای مختلفی استفاده می کنند. به عنوان مثال، فاصله بین داده ها، چگالی داده ها و همبستگی گراف، برخی از معیارهایی هستند که روش های خوشه بندی در یادگیری ماشین را مشخص می کنند. از آنجا که هیچ داده برچسب دار یا نگاشت ورودی و خروجی وجود ندارد، این نوع تکنیک یک روش یادگیری ماشین بدون نظارت است.

۹- یادگیری مشابهت و معیار

تعیین مشابهت یکی از کارکرد های کلیدی یادگیری ماشین است. در این شکل از یادگیری، ترکیبی از اشیاء و داده های مشابه و همچنین غیرمشابه، به مدل یادگیری ماشین ارائه می شود. مدل یادگیری ماشین یاد می گیرد که اشیا مشابه را با هم نگاشت کند و یک تابع مشابهت را فرا بگیرد که به آن اجازه می دهد تا در آینده، اشیاء مشابه را با هم گروه بندی کند.

۱۰- شبکه های بیزین

شبکه بیزین ( Bayesian Network ) یک مدل گرافیکی جهت دار غیرمدور است. این مدل DAG نامیده می شود که احتمال چندین متغیر شرطی مستقل را نشان می دهد. می تواند رابطه بین بیماری و علائم را به نشان دهد همچنین می توان از آن برای محاسبه احتمال بیماری های مختلف استفاده کرد. آن ها می توانند برای تشخیص بیماری های مختلف از طریق روش حساب شده ی فهرست احتمالات عوامل مختلفی که در بروز آن نقش داشتند، به کار روند. اشکال پیشرفته تر شبکه های بیزین شبکه های Deep Bayesian هستند.

اصل اساسی در شبکه بیزین، قضیه بیز است که مهمترین بخش از نظریه احتمال است. با کمک قضیه بیز، احتمال شرطی یک رویداد را تعیین می کنیم. این احتمال شرطی یک رویداد شناخته شده است. احتمال شرط خودش فرضیه است و ما این احتمال را بر اساس شواهد قبلی محاسبه می کنیم.

P (A|B) = P (B|A)*P (A) / P (B)

با استفاده از یک شبکه معین از یک گراف همبند، یک کاربر می تواند DAG را برای مدل سازی وابستگی های شرطی بسازد.

۱۱- یادگیری بازنمایی

به منظور نمایش داده ها در قالبی ساخت یافته تر، از یادگیری بازنمایی ( Representation Learning ) استفاده می کنیم. این روش، داده ها را بطور موثری قالب بندی می کند تا مدل بتواند برای ارائه نتایج دقیق، بهتر آموزش دهد. بازنمایی داده ها یکی از مهمترین عواملی است که می تواند بر عملکرد روش یادگیری ماشین تأثیر بگذارد و امکان می دهد تا الگوریتم، اطلاعات بهتری از داده ها کسب کند.

با استفاده از یادگیری بازنمایی، الگوریتم ها می توانند داده های ورودی و اطلاعات ضروری را حفظ کنند. بنابراین، یک مدل قادر است بیشتر اطلاعات را در حین پیش پردازش ضبط کند.

علاوه بر این، ورودی های موجود در پیش پردازش قادر به جمع آوری داده هایی هستند که توزیع مشخصی می دهند.

۱۲- یادگیری فرهنگ لغت پراکنده (تُنُک)

در روش فرهنگ لغت پراکنده ( Sparse Dictionary Learning )، ترکیبی خطی از توابع پایه و همچنین ضرایب پراکنده فرض شده است. عناصر یک فرهنگ لغت پراکنده را اتم گویند. این اتم ها با هم یک فرهنگ لغت را تشکیل می دهند. این شاخه ای از یادگیری بازنمایی است. این روش بیشتر در سنجش فشرده و بازیابی سیگنال مورد استفاده قرار می گیرد. در این روش، ما یک داده را به عنوان یک ترکیب خطی توابع پایه نشان داده و سپس فرض می کنیم که ضرایب به صورت پراکنده باشند.

خب، این تمام آموزش یادگیری ماشین برای مبتدیان بود. بسیاری از شما ممکن است به اصطلاحات فراگیرِ یادگیری ماشین، یادگیری عمیق و هوش مصنوعی بر خورده باشید. حالا در اینجا چند قدم کمکی اضافه تر آمده است؛ در ادامه تفاوت بین یادگیری ماشین، یادگیری عمیق و هوش مصنوعی به زبان ساده بیان شده است.

مقایسه یادگیری ماشین و یادگیری عمیق و هوش مصنوعی

یادگیری ماشین

یادگیری ماشین بخشی از هوش مصنوعی است که شامل پیاده سازی الگوریتم هایی است که قادر به یادگیری از داده یا نمونه های قبلی هستند و می توانند کار ها را بدون دستورالعمل های صریح، انجام دهند. روش یادگیری از داده ها شامل شناسایی آماری الگو ها و برازش مدل است تا داده ها را دقیق تر ارزیابی کرده و نتایج دقیق تری در اختیار ما قرار دهد.

یادگیری عمیق

یادگیری عمیق بخشی از یادگیری ماشین است که شامل استفاده از شبکه های عصبی مصنوعی است. الگوریتم های یادگیری ماشینِ یادگیری عمیق، به دلیل توانایی شبکه های عصبی برای یادگیری دقیق تر از داده های بزرگ و ارائه نتایج پایدار به کاربر ، محبوب ترین گزینه در بسیاری از صنایع است.

هوش مصنوعی

هوش مصنوعی استخر بزرگتری است که شامل ترکیبی از تمام فناوری های مورد بحث در بالا است. هوش مصنوعی هنوز در حال تحقیق است و شامل انتقال اطلاعات حساس به ماشین ها نیز می باشد. با این حال، هوش جامع مصنوعی هنوز خیلی دور از ذهن است و قبل از اینکه حتی یک نسخه اولیه از آن داشته باشیم، نیاز به سال ها تحقیق داریم.

خلاصه

در این آموزش یادگیری ماشین، ما به اصول اولیه یادگیری ماشین پرداختیم و اینکه چگونه قدرت محاسباتی، در طول زمان برای سازگاری الگوریتم های پیشرفته یادگیری ماشین، تکامل پیدا کرده است. رایانه ها به وسیله ی حجم وسیعی از داده هایی که تولید می شوند، هوشمند می شوند. ما انواع مختلفی از الگوریتم های یادگیری ماشین را بررسی کردیم، همچنین نگاهی کوتاه به برخی از الگوریتم های محبوب یادگیری ماشین داشتیم. امیدواریم که شما اکنون به خوبی با یادگیری ماشین آشنا شده باشید. حالا، بعدش چی؟ با قسمت های بعدی این مقاله، مبانی یادگیری ماشین همراه ما باشید.