۳۰ برنامه ی یادگیری عمیق که هوش از سر شما می برند!

9 سپتامبر, 2020 فناوری 3 نظرها

در طی چند سال گذشته، یادگیری عمیق ( Deep Learning ) روی صد ها مسئله ی مختلف اعمال شده و نتایج خوبی نیز به همراه داشته است؛ از بینایی رایانه ( Computer Vision ) گرفته تا پردازش زبان طبیعی ( Natural Language Processing ) . در بسیاری از موارد یادگیری عمیق نسبت به روش ها و کار های قبلی بهتر عمل کرده است. یادگیری عمیق به شدت در هر دو زمینه ی دانش و صنعت به انسان کمک می کند. این کمک ها در ساخت سیستم های هوشمند برای کمک در کار های مختلف به انسان ها مورد استفاده قرار می گیرند.

هدف از این مقاله نیز به اشتراک گذاشتن برنامه ها و کاربرد های شگفت انگیز یادگیری عمیق است که بسیار جالب و جذاب هستند. امیدواریم که این مقاله شما را از فرصت هایی که این زمینه به ارمغان می آورد، آگاه سازد و همچنین این نکته را هم به ما یادآوری کند که هر فناوری جدیدی خطرات احتمالی خودش را نیز به همراه دارد. ما معتقدیم که مورد دوم در مورد یادگیری عمیق بسیار جای فکر و مباحثه دارد و امیدواریم که با قرار گرفتن اطلاعات مفید و به روز درباره ی نتایج شگفت انگیز پژوهش ها و آزمایشات در اختیار مردم بتوانیم همه ی مردم را به بحث های بیشتری در مورد این موضوع ترغیب کنیم.

در مورد یادگیری عمیق برنامه ها و اپلیکیشن های مختلف زیادی وجود دارند و این لیست زیر نیز به هیچ وجه جامع نیست. بنابراین اگر از برنامه های کاربردی جالب یادگیری عمیق ، موارد دیگری می دانید، می توانید در بخش نظرات آن ها را ذکر کنید، و ما نیز از این نکته سنجی و آگاهی شما تشکر می کنیم.

حالا به سراغ بررسی یادگیری عمیق روی مسائل مختلف می رویم. برای انجام راحت تر این کار، ما برنامه های مختلف را بر اساس حوزه های مختلف کاربرد طبقه بندی و سازماندهی کرده ایم:

یادگیری عمیق در بینایی رایانه و تشخیص الگو های مختلف
یادگیری عمیق در بازی های رایانه ای ، ربات ها و اتومبیل های رانندگی
یادگیری عمیق ایجاد صدا
یادگیری عمیق انجام هنر
توهم رایانه ، پیش بینی ها و سایر موارد جذاب
آینده هوش مصنوعی

یادگیری عمیق در بینایی رایانه و تشخیص الگو های مختلف

۱- بازسازی سخنرانی های سیاستمداران!

گروهی از دانشجویان ومحققان دانشگاه واشنگتن سیستمی ایجاد کرده اند که از صدای یک نفر استفاده می کند و آن را با حرکات لب و صورت شبیه سازی شده در یک ویدیو سنتز می کند. این فیلم نمونه بارز این فناوری را روی صورت باراک اوباما نشان می دهد.

البته شما می توانید مقاله ی کامل این فناوری را می توانید اینجا مطالعه فرمایید.

۲- بازیابی رنگ ها را در عکس ها و فیلم های سیاه و سفید

تصاویر سیاه و سفید را دوست ندارید؟ جای نگرانی نیست ؛ ” Let there be color! ” نام یک سیستم رایانه ای است که می تواند به طور خودکار رنگ ها را در عکس های سیاه وسفید بازگرداند. شما می توانید اطلاعات بیشتری در مورد آن را در این مقاله بخوانید و نمونه های بسیار دیگری را نیز در این آدرس مشاهده کنید.

بازیابی رنگ تصاویر سیاه و سفید با یادگیری عمیق — شبکه یادگیری عمیق رنگ تصاویر سیاه و سفید قدیمی را بازییابی می کند.

الگویی مشابه نیز برای رنگی کردن فیلم ها استفاده می شود که در این ویدیو قابل مشاهده است:

راز این کار در این است که شبکه ی یادگیری عمیق در حقیقت الگوی هایی از رنگ بندی را آموخته است که به طور طبیعی در عکس ها وجود دارند، برای مثال آسمان معمولاً آبی است، ابرها غالباً سفید یا خاکستری هستند و چمن هم سبزرنگ است و یادگیری عمیق هم به رایانه ها برای بازگرداندن این رنگ ها کمک می کند.

اما نکته ی جالب اینجاست که رایانه ها این کار خودشان را از تجربه ی گذشته ی خودشان و بدون مداخله انسانی انجام می دهند. البته رایانه ها بعضی اوقات اشتباه می کند، اما پیدا کردن ایرادات بسیار سخت است. به عنوان مثال، در اینجا دو عکس سیاه و سفید وجود دارد که رایانه برای هر یک از آن ها دو نتیجه ی متفاوت را داده است، اما یافتن این مورد که کدام عکس دارای رنگ بندی درست است بسیار سخت است.

بازسازی رنگ تصاویر با یادگیری عمیق — رایانه رنگ این دو تصویر سیاه و سفید را بازیابی کرده، ولی اشتباهی داشته است. آیا می توانید تشخیص دهید کدام تصویر واقعی است؟

۳- ترمیم پیکسل به سبک فیلم های پلیسی

در سریال های جنایی مانند CSI ، کارآگاهان و پلیس ها اغلب در ویدیو هایی که دارند، فراتر از وضوح ویدیوی واقعی زوم می کنند، بدون اینکه کیفیت پایین بیاید! تا چندی پیش این اتفاق کاملاً غیرقابل ممکن و ساختگی به نظر می رسید و حتی چندین ویدیو در YouTube وجود دارد که در آن افراد مختلف توضیح می دهند که سریال های جنایی مانند CSI را تماشا نمی کنند، چرا که به شدت مسخره و غیرواقعی هستند.

ویدیوی زیر یک نمونه ی خوب از کار های عجیب در سریال CSI است:

داستان تا قبل از ورود یادگیری عمیق غیرواقعی و ساختگی به حساب می آمد، چرا که بعد از یادگیری عمیق ماجرا به شکل دیگری تغییر یافت. در اوایل سال ۲۰۱۷ بود که محققان Google Brain یک شبکه ی یادگیری عمیق را آموزش دادند تا از تصاویری با وضوح بسیار کم که از چهره ی انسان بودند استفاده کنند و پیش بینی کنند که هر چهره در حالت عادی به چه شکلی است. آن ها این روش را Pixel Recursive Super Resolution می نامند که وضوح عکس را به میزان قابل توجهی افزایش می دهد.

در تصویر زیر می توانید عکس های ورودی اصلی با ابعاد ۸*۸ پیکسل ، تصاویر واقعی (که چهره واقعی بود) و در وسط این دو بلوک هم پیش بینی کامپیوتر را به صورت تصاویر ۳۲ پیکسلی مشاهده کنید. بدیهی است که این تصاویر آن طور که باید و شاید کامل نیستند، اما از طرفی هم بسیار باورنکردنی است که کامپیوتر بتواند خیلی از ویژگی های شخص موجود در عکس را ارزیابی کند.

ترمیم پیکسل ها در بزرگنمایی با یادگیری عمیق — تصاویر ۸*۸ پیکسلی به شبکه یادگیری عمیق وارد می شوند و شبکه تلاش می کند تا حدس بزند تصویر اصلی به چه شکل بوده است. همانطور که می بینید، نتیجه به تصویر اصلی بسیار نزدیک است.

۴- آنالیز حرکت چند نفره در زمان واقعی

شبکه های یادگیری عمیق هم اکنون می توانند در تخمین موقعیت های افراد مختلف به انیماتور ها کمک زیادی بکنند که این بسیار شگفت انگیز است. نکته ی عجیب اینجاست که امروزه آن ها حتی می توانند در زمان واقعی و به صورت زنده این کار را انجام دهند. ژئو کائو و همکارانش طی یک مقاله به یک شبکه عصبی ارزیابی موقعیت اسکلت انسان را آموخت. شگفت آور است! در ویدئوی زیر می توانید بیش از ده نفر در حال رقصیدن را ببینید، در حالی که شبکه ی عصبی به کمک یادگیری عمیق می داند که آن ها کجا هستند و چگونه حرکت می کنند. لازم به ذکر است که این کار بدون داشتن هیچ وسیله ای بر روی بدن یا لباس آن ها، و فقط با تجزیه و تحلیل فیلم و حرکات درون آن انجام می شود!

۵- توصیف عکس

همه ما می دانیم که کامپیوتر ها می توانند به طور خودکار عکس های ما را طبقه بندی کنند. به عنوان مثال فیس بوک می تواند به طور خودکار دوستان شما را تگ کند. و یا Google Photos با الگوریتم خاص خودش می تواند به طور خودکار عکس های شما را برای جستجو و دسترسی آسان تر برچسب گذاری کند.

در حقیقت شما می توانید یک شبکه نوآورانه را بگیرید و آن را با ImageNet – که بزرگترین پایگاه داده از تصویر دارای برچسب است – آموزش دهید. پس از این کار شبکه قادر خواهد بود اشیاء را بهتر از یک دانشجوی دکتری که بیش از ۱۰۰ ساعت در همان زمینه آموزش دیده است، طبقه بندی کند!

توصیف عکس با شبکه یادگیری عمیق — شبکه یادگیری عمیق بطور خودکار یک تصویر را ناحیه بندی می کند و جمله ای کوتاه را برای توصیف هر بخش – با رعایت دستور زبان انگلیسی مناسب – می نویسد.

اما این ها فقط چند برچسب ساده هستند. در ادامه یادگیری عمیق به شما اجازه می دهد تا چندین قدم جلوتر بروید و تمام عناصر مختلف را در یک عکس برایتان توصیف می کند. در یک کار پژوهشی و علمی، آندره کارپاتی و Li Fei-Fei یک شبکه ی یادگیری عمیق را آموزش دادند تا ده ها منطقه ی جالب را در یک تصویر شناسایی کند و یک جمله در توصیف آنچه که در هر منطقه اتفاق می افتد، را بنویسد. این به این معنی است که کامپیوتر نه تنها آموخت که عناصر موجود در عکس را طبقه بندی کند، بلکه در واقع آن ها را با قواعد صحیح گرامر انگلیسی نیز توصیف کرد و یک جمله ی ساده و روان را در وصف آن بیان کرد. این اتفاق واقعاً عجیب و حیرت آور است. شما هم می توانید از طریق این دمو صد ها تصویر دیگر را نیز بررسی کنید.

۶- تغییر زاویه دید و حالت چشم افراد در عکس ها

این مورد کمی عجیب است. تصور کنید که از کسی عکس بگیرید، مثل یک دوست یا یکی از بستگان. در پروژه ی DeepWarp ، گانین و همکارانش یک شبکه ی عصبی را از طریق یادگیری عمیق آموزش دادند که می تواند حالت چشم آن ها را تغییر دهد. نتیجه همان طور که در ویدیوی زیر مشخص است بسیار جالب بود! حتی می توانید این برنامه را در این آدرس روی تصاویرتان امتحان کنید.

۷- تجزیه و تحلیل رفتار در زمان واقعی

شبکه های مبتنی بر یادگیری عمیق می دانند که چگونه عکس ها را بشناسند و آن ها را به درستی توصیف کنند، همچنین آن ها می توانند حرکات و حالات افراد مختلف در آن ها را تخمین بزنند. DeepGlint یک راهکار بسیار جالب است که از یادگیری عمیق برای گرفتن اطلاعات در مورد رفتار ماشین ها، افراد و سایر اجسام متحرک دیگر در زمان واقعی و به صورت زنده استفاده می کند. این کاربردی از یادگیری عمیق است که شاید زیاد به آن توجه نشده باشد، اما ارزش بررسی را دارد. ویدیوی زیر به شما در این زمینه کمک زیادی می کند.

۸- بازسازی عکس های برای ایجاد اشیاء جدید

برنامه ی خارق العاده از Nguyen و همکارانش به شما اجازه می دهد تا با کمک یک شبکه ی یادگیری عمیق عکس های جدیدی را با استفاده از عکس های موجود تولید کند.

نتایج بدست آمده زیبا هستند و نشان می دهند که چگونه شبکه به طور تکراری عکس های جدیدی از اشیاء را ایجاد می کند که قبلاً به هیچ وجه در تصویر نبوده اند.

همان طور که در ویدیو ملاحظه کردید این شبکه ی مبتنی بر یادگیری عمیق عکس های شگفت انگیزی از فوران آتشفشان ها و همچنین گل ها، پرندگان، چهره ها و موارد دیگر ایجاد کرده است.

۹- تولید عکس از کهکشان ها

تصاویر جدید از کهکشان و آتشفشان با یادگیری عمیق — رایانه تصاویر جدیدی از کهکشان ها و آتشفشان ها تولید می کند. معماری ای که برای این کار استفاده شده شبکه های مولد تخاصمی نام دارند.

دیگر لازم نیست هنگام مطالعه دنیای کهکشانی و اجرام آسمانی نگران باشیم، چرا که ما امکان استفاده از یادگیری عمیق و هوش مصنوعی را داریم! به همین خاطر است که اخترشناسان امروزه از یادگیری عمیق برای ایجاد عکس های مختلف از کهکشان ها و همچنین آتشفشان ها استفاده می کنند.

۱۰- ترجمه

برنامه Google Translate هم اکنون می تواند تصاویر حاوی متن شما را به فایل متنی هر زبانی که می خواهید – به صورت کاملاً خودکار – ترجمه کند. نکته ی جالب اینجاست که برنامه ی Google Translate این کار را به صورت زنده انجام می دهد!

کافیست دوربین را روی سوژه نگه دارید، اینجاست که تلفن شما برای خواندن تصویر و OCR آن (یعنی تبدیل تصویر به متن) از یک شبکه ی مبتنی بر یادگیری عمیق استفاده می کند و سپس آن را ترجمه می کند. به کمک یادگیری عمیق زبان های مختلف دیگر مانع ارتباط ما نخواهند شد و ما قادر خواهیم بود با جهانیان و به زبان های مختلف ارتباط برقرار کنیم.

تبدیل عکس به متن با یادگیری عمیق — یک تصویر از بسته بندی مواد غذایی که توسط گوشی گرفته شده است، توسط گوگل Translate “خوانده” شده و با متن های انگلیسی در زمان واقعی جایگزین می شود.

۱۱ – حفاظت از نهنگ ها و کلاسه بندی پلانکتون ها!

همان طور که می دانید شبکه عصبی کانولوشنی یک معماری یادگیری عمیق است که می تواند تصاویر مختلف را به طرز شگفت آوری آنالیز و کلاسه بندی کنند. این شبکه ها هزاران کاربرد در علومی مانند زیست شناسی، نجوم و حتی صنایع غذایی دارند که نتایج آن ها بسیار مهم و کاربردی هستند. به عنوان مثال با کلاسه بندی عکس گونه های مختلف نهنگ ها می توان جمعیت نهنگ های در معرض خطر را بهتر مطالعه کنیم.

مثال های دیگر آن، کلاسه بندی پلانکتون ها و کلاسه بندی گیاهان اند.

۱۲- تولید عکس های جدید

تولید تصاویر جدید با شبکه های عمیق — شبکه یادگیری عمیق تصاویر جدیدی ایجاد می کند. به عنوان مثال، تصویر روز را گرفته و آن را به تصویر شب تبدیل می کند.

از ایده همان برنامه ای که عکس ها را رنگی می کرد می توان به گونه ای استفاده کرد که برنامه با بهره گیری از یادگیری عمیق بتواند عکس ها و تصاویر جدیدی را تولید کند. در برنامه Pix2Pix ، کمپانی Isola با استفاده از یادگیری عمیق یک شبکه را برای انجام چندین کار مختلف تعلیم داده است:

ایجاد مناظر واقعی از خیابان ها را از اشکال رنگی، ایجاد یک نقشه ی دقیق از یک عکس هوایی واقعی، تبدیل عکس های شب به روز و البته پر کردن طرح های ساده ی دستی با الگو های رنگی از جمله ی این کار ها هستند.

تبدیل نقاشی حاشیه به تصاویر با یادگیری عمیق — نقاشی خطوط بیرونی کیف یا کفش را بکشید و شبکه یادگیری عمیق آن را برای شما رنگی می کند. نتایج آن بسیار خلاقانه است.

۱۳- پیدا کردن و خواندن متن از همه جا!

گروه Oxford Visual Geometry از یادگیری عمیق برای پروژه ی ” read text in the wild “ استفاده کردند. این پروژه ی آن ها در واقع تلاشی برای خواندن متن از روی عکس ها و فیلم ها برای بسط دادن کار گوگل Google است تا بتوانیم مثلا متن های دلخواهمان را در آرشیو ویدیو های BBC News جستجو کنیم. با کلیک روی لینک جستجوی زیر می توانید این برنامه را امتحان کنید.

۱۴- تخمین میزان ذخیره سازی انرژی خورشیدی

Google Sunroof از عکس های هوایی گوگل ارث استفاده می کند تا مدلی سه بعدی از سقف خانه ی شما بسازد. این برنامه از شبکه های عصبی یادگیری عمیق استفاده می کند تا سقف خانه ی شما و سایه ها و درختان اطرافش را آنالیز کند. این برنامه در ادامه از مسیر خورشید و الگو های آب و هوایی استفاده می کند تا تخمین بزند که در صورت نصب پنل های خورشیدی روی سقف خانه ی شما چه میزانی از انرژی به وسیله ی خورشید تولید خواهد شد.

تخمین میزان ذخیره انرژی خورشیدی — Google Sunroof محاصبه می کند که در صورتی که پنل خورشیدی نصب کنید چقدر پول می توانید صرفه جویی کنید. این سیستم از یادگیری عمیق استنفاده می کند تا تصاویر هوایی Google Earth را تحلیل کند.

یادگیری عمیق در بازی های رایانه ای، ربات ها و خودروهای بدون راننده

۱۵- برنده شدن در بازی Breakout آتاری

تیم DeepMind گوگل از یک تکنیک خاص یادگیری عمیق به نام یادگیری عمیق تقویت شده یا Deep Reinforcing Learning برای آموزش دادن یک رایانه جهت انجام بازی کامپیوتری و محبوب آتاری به نام بریک اوت ( Breakout ) استفاده کرد. باید توجه داشته باشید که این رایانه به هیچ وجه به طور اختصاصی برای بازی کردن ساخته و برنامه نویسی نشده بود.

در عین حال این برنامه قابلیت این را داشت که هنگام تماشای امتیاز ها صفحه کلید را کنترل کند. هدف اصلی این کامپیوتر این بود که حداکثر امتیازات ممکن در این بازی را به دست بیاورد. در ابتدای کار نتیجه چندان جالب نبود، چرا که حرکات بازی اکثراً تصادفی و غیر قابل پیش بینی بودند. اما بعد از گذشتن دو ساعت از زمان آغاز بازی رایانه ی DeepMind تبدیل به متخصص درجه یک در این بازی شد.

بعد از گذشتن چهار ساعت از زمان آغاز بازی رایانه ی DeepMind متوجه شد که حفر کردن یک تونل از طریق دیوار موثرترین تکنیک برای کسب بیشترین امتیازات و به پایان رساندن بازی است!

۱۶- برنده شدن در بسیاری از بازی های کامپوتری

یادگیری بازی ها توسط هوش مصنوعی — لیستی از بازی هایی که توسط هوش مصنوعی بازی شده اند. در بیشتر بازی ها، شبکه های یادگیری عمیق آموزش می بینند تا از بازیکنان واقعی بهتر عمل کنند.

آیا شما هم از بازی Breakout خوشتان نمی آید و معتقدید رایانه ها باید در بازی های دیگری موفق به شکست دادن انسان ها شوند؟

جالب است بدانید که جامعه ی جهانی یادگیری عمیق از مارچ ۲۰۱۷ در یک رقابت جذاب هستند تا کامپوتر هایی را آموزش دهد که تقریبا در تمام بازی هایی که می شناسید افراد مختلف را شکست دهند. بازی هایی مانند Space Invaders، Doom، Pong ، Gathering و ده ها بازی کامپوتری دیگر. در بسیاری از این بازی های کامپوتری شبکه های یادگیری عمیق به مانند بازیکن های باتجربه عمل کردند و همه را شگفت زده نمودند. نکته ی جالب اینجا بود که این رایانه ها برای انجام اختصاصی این بازی ها طراحی نشده بودند و فقط بعد از چند ساعت بازی موفق شدند تا قوانین مختلف بازی و راه های مختلف شکست دادن حریفان را با اتکا به خودشان بیاموزند.

۱۷- بازی Doom : نمونه ای از خشونت در بازی های کامپیوتری

نتایج بازی doom مقایسه انسان و هوش مصنوعی — آمار بازی Doom که در آن کامپیوتر بازیکنان حرفه ای بازی را تقریبا در تمام موارد شکست می دهد.

با این حال وقتی که شبکه های عصبی شروع به آموختن بازی های کامپوتری می کنند زنگ خطر هایی هم وجود دارد. برای مثال وقتی کامپوتر ها شروع به انجام دادن بازی Doom می کنند ۲ برابر بیشتر از انسان ها موفق به کشتن دشمنان می شوند و به نسبت بازیکنان عادی بسیار کمتر کشته می شوند. نمی خواهیم زیاد آخرالزمانی به این قضیه نگاه کنیم ولی این نتایج به نوعی ما را یاد فیلم سرباز جهانی می اندازند که در سال ۱۹۹۲ ساخته شد. به خصوص وقتی که «ون دام» و «دالف لاندگرن» پس از مرگ در ویتنام دوباره از نو ساخته شدند.

شبکه های یادگیری عمیق نیز در بسیاری موارد نشان دادند که می توانند تهاجمی و فریب دهنده باشند. در بازی Gathering دو مامور آبی و قرمز مشغول رقابت برای جمع کردن نقطه های سبزرنگ هستند که اجازه ی شلیک به یکدیگر را نیز دارند. در یکی از تست ها یکی از رایانه هایی که با کمک یادگیری عمیق داشت این بازی را انجام می داد بسیار تهاجمی عمل کرد و با کشتن حرف مقابلش اجازه نداد که نقطه ای که در مقابلش بود را به دست آورد. این اتفاق در حالی رخ داد که این حرکت در بین بازیگران عادی مرسوم نیست.

۱۸- خودرو های بدون نیاز به راننده

همه درباره این خودرو ها شنیده ایم! و نکته ی جذاب این است که تا چندی بعد می توانیم آن ها در کوچه و خیابان اطرافمان در حال گشت زدن ببینیم!

در این ویدیو خودرویی از کمپانی تسلا الکتریک بدون نیاز به راننده حرکت می کند و نیازی نیز به دخالت راننده ندارد. این خودروی استثنایی می تواند اجسام مختلفی مانند اشیای اطرافش، مردم و علائم رانندگی را تشخیص دهد.

۱۹- فناوری رباتیک

یادگیری عمیق این روز ها بیش از پیش در صنایع رباتیک استفاده می شود. این مورد از بخش هایی است که بسیار گسترده است و صحبت در مورد آن مجال بسیاری می خواهد، اما دو مثال خوب را برای شما خواهیم زد که یکی از آن ها ربات اسپات مینی و دیگری ربات اطلس که هردو ساخت بوستون داینامیکس است.

این ربات ها نسبت به افرادی که آن ها را هل می دهند یا دور می زنند واکنش نشان می دهند، وقتی می افتند دوباره برمی خیزند و حتی می توانند مانند کارهای مختلف روزانه و حتی کار های نسبتاً دقیق و پیچیده ای را انجام دهند که انجامشان توسط انسان نیاز به آرامش و احتیاط دارند، مثل جا به جا کردن ظروف از ماشین ظرفشویی به کابینت.

۲۰- خودتان امتحان کنید

اخیراً چند تن از مشهورت رین کارآفرینان سیلیکون ولی با هدف عمومی کردن و در دسترس قرار دادن هوش مصنوعی و فناوری های یادگیری عمیق یک موسسه غیرانتفاعی به نام OpenAI را راه اندازی کردند. سپس آن ها پروژه ی Universe را راه اندازی کردند که یک بستر منبع باز ( Open Source ) را در اختیار شما قرار می دهد که به شما امکان می دهد تا یادگیری عمیق را در صد ها بازی و وب سایت مختلف تست کنید، بنابراین اکنون می توانید یک شبکه یادگیری عمیق را آموزش دهید تا صد ها بازی مختلف را با آن بازی کنید!

یادگیری عمیق و صوت

۲۱- تولید صوت

چند سال پیش گوگل نرم افزار WaveNet را منتشر کرد و کمپانی بایدو نیز اپلیکیشن Deep Speech را منتشر کرد. هر دوی این نرم فزا رها در واقع شبکه ای از یادگیری عمیق هستند که بطور خودکار صدا های مختلف را تولید می کنند. ممکن است بپرسید که نکته ی جالب این موضوع کجاست؟ سیری و الکسا هم می توانند صحبت کنند، پس فرق این برنامه با آن ها چیست؟

نکته ی جالب توجه این است که تا به امروز سیستم های text2voice – که متن را به صوت تبدیل می کنند – کاملاً خودمختار نبودند و به صورت دستی برای انجام این کار آموزش دیده بودند. سیستم هایی که امروزه ساخته شده اند یاد می گیرند که صدای انسان ها را به تنهایی و بدون نیاز به کمک تقلید کنند و با گذشت زمان نیز مهارتشان را بهبود دهند. وقتی از یک فرد عادی بخواهید که سعی کند صدای واقعی را از صدای ساخته شده توسط برنامه تشخیص دهد، متوجه خواهید شد که چنین کاری بسیار سخت تر از چیزی است که فکرش را می کنید. در حالی که ما هنوز از نظر تولید صدای اتوماتیک در این مرحله از پیشرفت قرار نداشتیم، یادگیر عمیق قدم بزرگی در زمینه ی ارائه امکان صحبت کردن مانند انسان ها رایانه ها برای صحبت کردن مانند انسان را به ما هدیه داد.

اگر شما موسیقی را دوست دارید ، قصه در اینجا برایتان به پایان نمی رسد! چرا که چندی پیش Merlijn Blaauw و Jordi Bonada یک شبکه ی یادگیری عمیق را آموزش دادند آواز می خواند!

۲۲- تدوین موسیقی

از همان فناوری استفاده شده برای تشخیص صدا می توان برای آموزش دادن به یک شبکه ی یادگیری عمیق جهت تولید و یا تدوین موسیقی استفاده کرد. برای مثال در یک نمونه ی خاص Francesco Marchesani یک کامپیوتر را آموزش داد تا آهنگ هایی را مثل آهنگساز کلاسیک مورد علاقه اش Chopin بسازد. بعد از اینکه کامپیوتر الگو ها و آماری را که منحصر به موسیقی خاص Chopin بود را آموخت، قطعه ای کاملاً جدید را ایجاد کرد!

۲۳- بازیابی صدا از روی تصاویر

در نگاه اول تقریباً به نظر می رسد که بازیابی صدا در فیلم های صامت امکان پذیر نباشد، اما به یاد داشته باشید که افرادی هستند که می توانند لب خوانی کنند و از روی حرکات صورت متوجه گفتار بشوند. در یک نرم افزار از آقای Owens و همکارانش یک شبکه ی یادگیری عمیق را برای تشخیص و شناسایی صداهای مختلف آموزش دادند. آن ها از طریق ویدیو هایی که در آن ها با چوب درام روی اجسام مختلف می زدند سعی کردند تا به رایانه بیاموزند تا صدا را تشخیص دهد. دانشمندان بعد از چندین بار تکرار فرایند یادگیری، این ویدئو را قطع کردند و از رایانه خواستند صدایی را که از برخورد چوب درام با اشیای مختلف انتظار دارد را بازسازی کند، در یک جمله می توان گفت که نتایج بسیار چشمگیر و باورنکردنی بود.

اگر این مورد به تنهایی برای شما کافی نیست، بهتر است با لب خوانی کامپوتر ها آشنا شوید و بفهمید چگونه رایانه ها می توانند لب خوانی کنند. این مورد استثنایی کاری است و نرم افزار LipNet که یک پروژه ی مشترک بین دانشمندان Oxford و Google DeepMind است، آن را انجام می دهد. LipNet در خواندن لب ها و آنالیز حرکات صورت افراد بسیار عالی و دقیق عمل می کند و در حالی که یک لب خوان عادی به طور متوسط ۵۲٪ از گفتار یک فرد را به درستی لب خوانی می کند ، lipnet رقم فوق العاده ی ۹۳٪ را به ثبت رساند.

هنر و یادگیری عمیق

۲۴- انتقال سبک نقاشی های معروف به عکس های جدید

انتقال سبک نقاشی با هوش مصنوعی — انتفال سبک روشی است که در آن شبکه یادگیری عمیق می تواند سبک هنری آثار شناخته شده را به آثار جدید انتقال دهد.

تغییر سبک نقاشی مونالیزا با شبکه های عمیق — با استفاده از یادگیری عمیق، سبک اثر هنری تغییر داده می شود تا به سبک های دیگر نظیر آثار مصر باستان، سهابی خرچنگ و نقشه های گوگل تغییر کند.

مقاله ای در سال ۲۰۱۶ توسط Gatys ، Ecker و Bethge منتشر شد که در آن این ایده ی خلاقانه و منحصر به فرد آزمایش شد. در این برنامه ی می توانید از الگو های موجود در آثار هنری مورد علاقه ی خودتان استفاده کنید و به یک شبکه ی یادگیری عمیق اجازه دهید تا الگو های موجود در خطوط، رنگ ها و سایه های یک اثر هنری را یاد بگیرد. سپس شما یک تصویر جدید را به این شبکه بدهید و این شبکه ی یادگیری عمیق می تواند سبک خاص اثر هنری اصلی را به تصویر شما منتقل کند.

امروزه فضای اینترنت با روش های خلاقانه و جدید برای پیاده سازی این ترفند پر شده است. به عنوان مثال، genekogan تصمیم گرفت به شیوه دیگری حرکت کند و از شیوه ی انتقال استفاده کند تا تابلوی معروف مونا لیزا را طبق سبک های آموخته شده از نقاشی های قدیمی مصری، سحابی خرچنگ و Google Maps تغییر دهد! شما می توانید دیگر آثار هنری او را نیز بررسی کنید.

روش انتقال سبک فراتر از هنر نقاشی است و حتی می تواند برای عکاسی نیز مورد استفاده قرار گیرد. در مقاله ای که توسط Luan و همکارانش نوشته شده ، آن ها روشی را بررسی کردند که در آن عکس هایی از ساختمان ها، گل ها و البته مناظر مختلف را دگرگون کرده اند. نتایجی که در زیر می بینید خیره کننده هستند، عکس ها به صورت چپ به راست (چپ = اصلی ، مبدا = سبک میانی ، راست = نتیجه) قرار داده شده اند.

تغییر سبک در تصاویر مناظر با یادگیری عمیق — نتیجه ی تغییر سبک تصاویر ساختمان ها و مناظر (چپ : تصویر اصلی ، وسط : سبک اصلی ، راست : خروجی)

دوست دارید که خودتان امتحان کنید؟ DeepArt.io اپلیکیشن هایی را می سازد که با استفاده از یادگیری عمیق می آموزند که صدها استایل مختلف را روی عکس های شما پیاده سازی کنند.

۲۵- نوشتن مقاله های ویکی پدیا، مقالات ریاضی و حتی تقلید سبک شکسپیر!

نوشتن داستان شکسپیر با هوش مصنوعی — این متن مانند داستان های شکسپیر به نظر می رسد ولی در اصل توسط یک شبکه یادگیری عمیق LSTM که داستان های شکسپیر را خوانده نوشته شده است.

نوشتن صفحات ویکی پدیا توسط هوش مصنوعی — شبکه ی یادگیری عمیق می تواند سبک های مختلف متن را فرا بگیرد. در اینجا شبکه متن هایی شبیه به ویکی پدیا را از صفر نوشته است.

یکی دیگر از دستاوردهای شگفت انگیز یادگیری عمیق حافظه کوتاه مدت ماندگار ( LSTM ) نامیده می شود و از لحاظ پردازش ورودی های متنی عملکرد شگفت انگیزی دارد. در یک مقاله با عنوان ” اثر غیر معقول شبکه های عصبی بازگشتی ” که توسط آندره کارپاتی نوشته شده بود آزمایشات بسیار جالبی انجام شد. در این آزمایشات کارپاتی اجازه داد تا یک شبکه یادگیری عمیق نوشته های شکسپیر، مقالات ویکی پدیا، مقالات ریاضی و همچنین کد های رایانه ای را بخواند و استایل نوشتاری آن ها را یاد بگیرد. و اما نتایج …

رایانه با یاد گرفتن الگو ها مانند شکسپیر داستان نوشت و همچنین مقالاتی مانند ویکی پدیا را تالیف کرد (توجه داشته باشید که لینک yahoo در واقع لینک خیالی است که رایانه آن را “بازسازی” کرده است). کامپیوتر همچنین قادر به نوشتن مقالات ریاضی جعلی و حتی کد های دستوری برای کامپیوتر بود! باورنکردنی است اما این یک برنامه ی کامپیوتری توانست برای سایر برنامه های رایانه ای کد بنویسد. توجه داشته باشید که متن ، معادلات ریاضی و کدهایی که یک رایانه می نویسد لزوماً دارای معنی نیستند، تنها انتظاری که از آن ها می رود این است که صرفاً منطقی عمل کنند.

۲۶- دست نویس

متن دست نویس تولید شده با هوش مصنوعی — این متن دست نویس توسط یک رایانه تولید شده است!

تا به اینجا برایتان در مورد کامپیوتر هایی که متن تایپی یا نقاشی و عکس تولید می کنند صحبت کردیم، اما جالب است بدانید که کامپوترها می توانند به صورت دست نویس هم متن تولید کنند. Alex Graves از دانشگاه تورنتو به یک رایانه یاد داد تا نحوه ی نوشتن و دست خط نوشته های مختلفش را بیاموزد. شما هم می توانید روی این لینک کلیک کنید تا متن مورد نظر و دلخواهتان را به هر سبکی که دوست دارید بنویسید.

توهم و تخیل رایانه ای، پیش بینی و دیگر کار های جذاب

۲۷- تخمین جمعیت و نتیجه ی انتخابات

تحلیل جمعیت و نتیجه انتخابات با هوش مصنوعی — تخمین نتیجه ی انتخابات با شبکه یادگیری عمیق بعد از بررسی تصاویر خودرو های هر منطقه!

آقای Gebru و همکارانش ۵۰ میلیون تصویر از برنامه ی Google Street View گرفتند و تحقیق کردند که یک شبکه ی یادگیری عمیق چه کار شگفت آوری با آن تصاویر می تواند انجام دهد. این نتایج بسیار جالب بودند! چرا که کامپیوتر یاد گرفته بود که اتومبیل ها را در تصاویر یافته و تشخیص دهد. این رایانه بیش از ۲۲ میلیون دستگاه خودرو، مدل، نوع بدنه و سال تولید آن ها را کشف کرد. شاید بپرسید که این اطلاعات به چه دردی می خورند؟ جالب است بدانید که این رایانه با استفاده از این اطلاعات قادر به پیش بینی گستردگی جمعیتی هر منطقه با بهره گیری از طریق آرایش ماشین ها بود! اطلاعات و نگرش های بسیاری از این قبیل وجود دارد که شرح آن ها خارج از محدوده ی این مطلب است، با این حال بد نیست که به این نمونه ی جالب نگاهی بیاندازیم: این رایانه توانسته بود دریابد که اگر تعداد سدان هایی که در طی یک رانندگی ۱۵ دقیقه ای از تعداد وانت های مشابه در سطح شهر بیشتر باشد، این شهر به احتمال زیاد در انتخابات ریاست جمهوری بعدی به یک دموکرات رأی خواهد داد (۸۸٪ شانس) ؛ در غیر این صورت ، احتمالاً مردم این شهر به نماینده جمهوری خواه (۸۲٪ شانس) رأی خواهند داد.

۲۸- رویای عمیق

این مثال عجیب و غریب، پتانسیل این را دارد که تفکرات شما را به هم بریزد، بنابراین از همین حالا از شما بابتش عذرخواهی می کنیم. در اواخر سال ۲۰۱۵ بود که محققان گوگل راهی برای استفاده از یادگیری عمیق پیدا کردند تا به کامپیوتر مورد نظر اجازه دهد تا از ویژگی های خاص تصاویر استفاده کند. البته باید توجه داشت که این روش می تواند به نحوه های مختلفی مورد استفاده قرار بگیرد که یکی از جالب ترین آن ها رویای عمیق یا Deep Dreaming نام دارد که به رایانه این امکان را می دهد توهماتی را روی عکس مورد نظر اضافه کند. در مورد نام گزاری ان مورد بد نیست بدانید که دانشمندان آن را Deep Dreaming خواندند، زیرا عکس هایی که توسط این رایانه تولید می شوند اغلب به رؤیاها شباهت دارند تا واقعیت.

به عنوان مثال در این عکس عجیب، کامپیوتر ساختمان ها و سازه های دست بشر را به طرز توهم زایی روی یک کوه قرار داده است. البته این توهم بسته به آنچه که شبکه ی عصبی یادگیری عمیق قبلاً در معرض آن بوده است، متفاوت است و صد ها نمونه ی آنلاین وجود دارد که کامپیوتر در حال خلق تصاویر خیالی از حیوانات، اتومبیل ها، مردم و ساختمان هاست. برخی از رویاهای عمیق در واقع بیشتر شبیه به کابوس های عمیق ( Deep Nightmares ) هستند و می توانند بسیار نگران کننده و حتی ترسناک باشند.

گاهی اوقات بهتر است رویای عمیق را کابوس عمیق بنامیم. کابوس هایی که توسط شبکه های یادگیری عمیق ساخته شده اند.

YouTube امروزه با فیلم های رایانه ای Deep Dreaming ترس و نفرت در لاس وگاس، آلیس در سرزمین عجایب، شهرهای خیالی، وینسنت ون گوگ و حتی دونالد ترامپ پر شده است. اما دو مورد بسیار جالب در این ویدیوها Pouff – سفر به فروشگاه مواد غذایی و یک فیلم جالب دیگر درباره سفر به رویای عمیق است که مورد دوم بیشتر روی تصورات تخیلی ناشی از بازی با صدا متمرکز می شود.

۲۹- هوش مصنوعی ، رمزنگاری مخصوص خود را اختراع و سپس آن را هک می کند تا از استراق سمع و دزدی اطلاعات جلوگیری کند!

Google Brain برای اهداف امنیتی خودش دو شبکه عصبی مبتنی بر یادگیری عمیق ایجاد کرده است، یکی که الگوریتم رمزنگاری خود را برای محافظت از پیام های خود ایجاد می کند و شبکه دیگر در تلاش است تا آن را کرک کند. این شبکه در ابداع مکانیزم های جدید رمزنگاری بسیار خوب عمل کرده اما در هک کردن آن ها چندان هم خوب نیست.

۳۰- ایجاد شبکه های یادگیری عمیق توسطشبکه های یادگیری عمیق!

Neural Complete یک کد یادگیری عمیق است که می تواند شبکه های جدید عصبی یادگیری عمیق را ایجاد کند. این کد علاوه بر این که در پایتون نوشته و تولید شده است، در زمینه ی تولید کد های پایتون نیز آموزش دیده است. این مجموعه کد بسیار عالی و فوق العاده جذاب است و باعث صرفه جویی در وقت برنامه نویسان یادگیری عمیق می شود، به خصوص برنامه نویسان تنبل.

ساخت شبکه عمیق با شبکه عمیق — Neural Complete یک شبکه یادگیری عمیق است که می تواند شبکه های عمیق را کد نویسی کند!

۳۱- پیش بینی زلزله

دانشمندان دانشگاه هاروارد از یادگیری عمیق برای آموزش رایانه هایی استفاده کردند تا محاسبات ویسکوالاستیک را برایشان انجام دهند. ارزش این محاسبات وقتی مشخص می شود که بدانید اطلاعات آن ها در پیش بینی زلزله ها به کار می رود. تا قبل از مقاله ی آن ها و تولید این رایانه چنین محاسباتی بسیار فشرده و سنگین بود و زمان زیادی نیز نیاز داشت، اما این برنامه موفق شد تا ۵۰۰۰۰% از زمان محاسبات را بهبود بخشد. هنگام محاسبه ی زلزله، زمان بندی بسیار مهم و حیاتی است و این پیشرفت شایگان می تواند برای نجات زندگی انسان ها بسیار حیاتی باشد.

آینده ی هوش مصنوعی

در انتها امیدوارم که این مقاله شما را در مورد برنامه های آینده ی یادگیری عمیق و پتانسیل های آن برای کمک به حل برخی از مشکلاتی که بشریت با آن روبروست، آگاه و البته هیجان زده کرده باشد. در عین حال یادآوری این واقعیت که هر فناوری جدید خطرات احتمالی را با خود به همراه دارد نیز در جای خودش بسیار مهم است. ایمنی در هوش مصنوعی و یادگیری عمیق واقعاً موضوعی بزرگ است که مستحق یک مطلب جداگانه برای خود است که در آینده روی وبلاگ قرار خواهد گرفت. در حال حاضر اشاره به این موضوع که افراد زیادی با هم همکاری می کنند تا اطمینان حاصل شود که هوش مصنوعی به نفع بشریت باشد. ما به شدت توصیه می کنیم که از موضوعات جذابی مانند OpenAI ، مشارکت در هوش مصنوعی ، موسسه هوش مصنوعی آلن و نگرانی های مربوط به ایمنی هوش مصنوعی و همچنین دیدگاه های خوش بینانه و بدبینانه در مورد آن آگاه باشید و همیشه اطلاعات خودتان را در این زمینه ها به روز نمایید. خوشحال می شویم که در بخش نظرات ان مقاله به بحث ما در مورد هوش مصنوعی و یادگیری عمیق بپیوندید.

بیشتر بخوانید :

منبع Yaron Hadad

امتیاز دهید!

3 نظر

نرجس
16 فوریه, 2022 در 5:29 ب.ظ

سلام وقت تون بخیر . ممنون از اطلاعات خوبی که به اشتراک میزارید میخواستم بگم من میخوام در مورد انتقال سبک عکاسی یا نقاشی به سبک جدید در یادگیری عمیق پایان نامه بنویسم از کجا می تونم مطالب پیدا کنم در این مورد برای ریز موضوع و پروپزال

پاسخ
- احمدرضا جعفری
  20 فوریه, 2022 در 12:02 ب.ظ
  
  سلام
  در این زمینه ها میتونید مقالات خیلی خوبی توی سایت Medium پیدا کنید که هر کودومشون رفرنس های مقالشون رو هم معرفی کردن. چند تا مطلب خوب که در این زمینه پیدا کردم رو براتون میفرستم میتونه نقطه شروع خوبی برای شما باشه.
  https://blog.tensorflow.org/2018/08/neural-style-transfer-creating-art-with-deep-learning.html
  https://medium.com/@stanleydukor/neural-style-transfer-part-1-e82c2e774443
  https://towardsdatascience.com/light-on-math-machine-learning-intuitive-guide-to-neural-style-transfer-ef88e46697ee
  
  پاسخ
- حسین
  26 آوریل, 2022 در 12:36 ب.ظ
  
  سلام. ظاهرا روی شبکه های DCGAN باید تمرکز کنید
  
  پاسخ