خانه > تازه ها > استفاده از یادگیری عمیق برای تمرکز بر روی چشم انسان در تصاویر
تمرکز روی چشم

استفاده از یادگیری عمیق برای تمرکز بر روی چشم انسان در تصاویر

یک تیم از محققان دانشگاه علوم زمین چین و فناوری Wuhan WXYZ در چین اخیرا یادگیری ماشینی را معرفی کرده اند که بر اساس تشخیص محل چشم افراد در تصاویر بر روی صورتشان است. این تکنیک، در مجله Elsevier’s journal Neurocomputing ارائه شد که می تواند چندین نرم افزار مفید و کارآمد را پوشش دهد. برای مثال، می تواند برای تشخیص چشمان افراد خواب آلوده در هنگام رانندگی یا انجام وظایفی که نیازمند ۱۰۰% دقت و هوشیاری است، استفاده شود.

یکی از بهترین راه هایی که می توان درجه خواب آلودگی یک فرد را ارزیابی کرد این است که به چشمانشان نگاه کنیم. که در افراد خواب آلوده به طور معمول چشمان بسته تر یا خسته تر هستند. با این حال ، تجزیه و تحلیل خودکار چشم افراد با استفاده از روش های محاسباتی ، قبل از هر چیز مستلزم تعیین کردن مکان آن ها در تصاویر یا فیلم ها در زمان واقعی است.

افرادی که این پژوهش را انجام داده اند از طریق ایمیل به TechXplore گفتند:

فعالیت اخیر ما قسمتی از تحقیق ما بر روی تخمین درجه خواب آلودگی افراد است.در آخرین فعالیت خود،ما یک مدل سرویس ابتکاری را برای روبات های خدماتی معرفی کردیم که از سرویس های غیر فعال متفاوت است.(به عبارت دیگر،در هنگام ارائه خدمات روبات باید منتظر دستورالعمل کاربر باشد.) در ادامه ما یک روبات سرویس نوشیدنی به عنوان نمونه انتخاب کردیم تا اثر بخشی سرویس های ابتکاری ما را تایید بکند.

در ابتدا،محققان شروع به توسعه تکنیک ارزیابی خواب آلودگی افراد کردند که می توانست کارایی روباتی که برای انسان ها نوشیدنی سرو می کرد را بهبود ببخشد.اولین مرحله در این مسیر خلق روشی خودکار برای تعیین محل چشمان افراد در زمان واقعی به وسیله تجزیه و تحلیل چهره افراد در تصاویر بود.

روش تعیین محل چشم افراد توسط محققان بر اساس تکنیک یادگیری ماشین با نام وزن محرمانه دوتایی آبشار شبکه عصبی (WBCCNN) شناخته می شود. WBCCNN توسعه یافته موقعیت چشم افراد را از درشت تا ریز پیش بینی می کند و این باعث بهبود عملکرد مدل می شود. علاوه بر این ، مؤلفه باینری شبکه به کاهش اندازه حافظه مدل و سرعت بخشیدن به عملکرد آن کمک می کند.

محققان WBCCNN مدل خود را برای تعیین محل چشم افراد در آزمایش ها ارزیابی کردند چرا که  در آنها از مجموعه داده های تصاویر برچسب گذاری شده در طبیعت (LFW)،BioID و قسمت های صورت که در طبیعت برچسب گذاری شده (LFPW) استفاده می شود.این روش به نتایج قابل توجهی دست یافت و بهتر از عملکرد دیگر روش های تعیین محل چشم انسان،با درصد خطای تشخیص ۰٫۶۶% برای چشم چپ و ۰٫۷۱% برای چشم راست عملکرد تاثیر گذاری از خود به نمایش گذاشته است.

طبق گفته محققان،با معنا ترین دست یابی مطالعاتی آنها توسعه WBCCNN بوده که سنگینی آن توسط زبان دوتایی محدود می شود.این طراحی منحصر به فرد به طور مشخص قادر است تا ظرفیت حافظه مدل را برای ذخیره سازی فعال کند و همچنین هزینه محاسباتی آن را کاهش دهد.در آینده،مدل WBCCNN جدید می تواند در توسعه ابزار ارزیابی خواب آلودگی افراد و دیگر احساسات با تشخیص محل چشمان افراد کمک کند.

محققان می گویند:

تشخیص قابل اعتماد محل چشم افراد برای ارزیابی خواب آلودگی لازم است با این حال،ما سعی خواهیم کرد تا از روش پیشنهادی برای اعمال تشخیص محل چشم افراد در روبات های ابتکاری برای تخمین خواب آلودگی استفاده کنیم که طراحی شده تا به افراد برای عملکرد بهتر و موثر تر کمک کند.

 

همچنین بخوانید:
0/5 ( 0 نظر )

درباره‌ی ابوالفضل وطن پرست

همچنین ببینید

tensorflow

گوگل TensorBoard.dev و TensorFlow Enterprise را معرفی می کند!

گوگل کلود TensorFlow Enterprise را به چاپ رساند ، نسخه ای بهینه شده از چارچوب یادگیری ماشین منبع باز TensorFlow برای مشاغل بزرگ

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *