آموزش OpenCV – قسمت دوم : انسان چگونه میبیند؟

آموزش OpenCV – قسمت دوم : انسان چگونه میبیند؟

 

۴-۲

 

آشنایی با بینایی انسان

 قبل از این که به کتابخانه  OpenCV بپردازیم بهتر است بپرسیم چرا این توابع در وهله ی اول ساخته شده اند؟ دانستن چگونگی کارکرد بینایی انسان جهت توسعه ی الگوریتم های درست برای بینایی ماشین بسیار مهم است. هدف الگوریتم های بینایی ماشین فهمیدن محتوای عکس ها و فیلم ها می باشد که انسان ها این کار را بدون زحمت انجام میدهند.

ولی چگونه میتوانیم با همین دقت این کار را به وسیله ی ماشین انجام دهیم؟

چگونه انسان تمام اطلاعات را شامل رنگ، شکل و روشنایی را  در کسری از ثانیه دریافت می کند؟

برای مثال مواردی را باید بدانیم

سیستم بینایی ما به محتوا های فرکانس پایین بیشتر حساس است تا محتوا های فرکانس  بالا. مثلا نواحی مسطح که مقدار پیکسل ها در آن تعییر زیادی نمیکنند محتوای فرکانس پایین به شمار می آیند گوشه ها و لبه ها که مقادیر نوسان زیادی دارند محتوای فرکانس بالا هستند.شما متوجه خواهید شد که اگر لکه ای در صفحه ی مسطح وجود داشته باشد به آسانی آن را میبینید ولی سخت است که چیزی مانند این لکه را در سطحی که دارای بافت زیادی است تشخیص دهیم.

از طرف دیگر چشم انسان بیشتر به تغییرات روشنایی حساس می باشد تا تغییر در رنگ.

 

۶

 

سیستم بینایی ما به حرکت حساس است. اگر چیزی در محدوده ی بینایی ما در حال حرکت باشد به سرعت آن را تشخیص می دهیم حتی اگر به طور مستقیم به آن نگاه نکنیم.

ما به این تمایل داریم تا یک یادداشت ذهنی از نقاط برجسته محدوده دیدمان را در ذهن خود داشته باشیم. به عنوان مثال چیزی را با چهار پایه مشکی، سطح سفید و در هر گوشه که نقاط قرمزی هستند در نظر بگیرید. ما به سرعت یک یادداشت ذهنی برمی داریم که غیر از سطح و پایه ها، بیشتر دارای رنگ های متضاد می باشد و دارای نقاط قرمز رنگ در گوشه ها است. پس اگر دفعه بعد آن را ببینیم به سرعت آن را تشخیص می دهیم.

محدوده دید انسان که در هر زاویه میتواند چه چیزی را تشخیص دهد.

 

۷

 

چگونه انسان ها محتوای تصاویر را متوجه می شوند؟

اگر شما به اطراف خود نگاه کنید با اشیاء زیادی روبرو می شوید که به طور آنی و بدون هیچ تلاشی آن ها را تشخیص می دهید. برای مثال وقتی به چیزی نگاه می کنید، برای این که متوجه شوید اسم این شی چیست چندین دقیقه صبر نمی کنید بلکه آنی آن را تشخیص می دهید. ولی این کار برای کامپیوتر ها پیچیده و دشوار می باشد. محققان سال ها تلاش کرده اند تا بفهمند چرا کامپیوتر ها  در این زمینه به خوبی انسان نیستند.

اگر یک صندلی سایزش دو برابر شده و ۴۵ درجه بچرخد ما میتوانیم تشخیص دهیم باز هم صندلی است ولی کامپیوتر ها نمی توانند. انسان ها تمایل دارند تا یک شی را بر اساس شکل و ویژگی های برجسته ی آن به خاطر بسپارند. بدون توجه به این که این شی چگونه قرار گرفته ما میتوانیم باز هم آن را تشخیص دهیم.

  • تا اینجا مباحثی درباره سیستم بینایی انسان گفته شد ولی از آنجایی که سیستم بینایی محدوده ای گسترده می باشد برای مطالعه بیشتر به اینترنت مراجعه کنید.
بدون دیدگاه

ارسال یک نظر

نظر
نام
ایمیل
وبسایت