برترین ابزار های حاشیه نویسی متن باز تشخیص اشیا

بهترین ابزار های منبع باز حاشیه نویسی برای بینایی کامپیوتر

در این مقاله ۴ ابزار فوق العاده برای حاشیه نویسی را معرفی می کنیم و امیدواریم به شما در راستای ایجاد مجموعه داده های بینایی کامپیوتر کمک کند.

اگر شما یک دانشمند داده هستید که در حال کار بر روی بینایی کامپیوتر می باشید ، حتما به این موضوع پی برده اید که بخاطر یکی از این دو دلیل زیر ، نیاز به یک ابزار آسان و سریع برچسب گذاری دارید :

  • برای ایجاد مجموعه داده های خود برای آزمایش های PoC یا R&D
  • برای اطمینان از کیفیت داده های خود به گونه ای که در عملکرد الگوریتم های یادگیری عمیق شما تاثیری نگذارد .

ما به طور عمیقی در دنیای برچسب گذاری بینایی کامپیوتر جستجو کردیم و دریافتیم که حفره موجود در این زمینه به وسیله تعداد زیادی از ابزار های موثر پر شده است (این سه لیست  فوق العاده را ببینید؛ اینجا و اینجا و اینجا و یا این وبلاگ) . ما زمانی را صرف مقایسه نوید بخش ترین و فعال ترین پروژه ها کردیم تا فهمیدیم که بیشتر این ابزار ها برای دستیابی به تنها یکی از ۳ اهداف زیر طراحی شده اند :

  1. اگر می خواهید در زمینه برچسب گذاری کسب و کاری را آغاز کنید ، نیاز دارید به :
  • ویژگی های پیشرفته مدیریت پروژه
  • مقدار زیادی از ویژگی ها تا بتوان هر کاری را انجام داد
  • ابزار خودکار سازی برای افزایش تاثیر گذاری
  1. اگر در یک استارت آپ کار می کنید ، احتمالا نیاز دارید به :
  • API ها یا حداقل راه های ساده برای اتصال ابزار برچسب گذاری API های خصوصی
  • یک تجربه کاربری بصری (UX) تا هر حاشیه نویسی که به طور موقت استخدام می کنید می تواند بلافاصله کار خود را شروع کند .
  1. اگر برای خود شغلی دارید که:
  • API ها و مدیریت پروژه برای شما اهمیتی ندارد.
  • فقط می خواهید هر چه سریع تر برچسب گذاری را آغاز کنید!

در اینجا لیستی از ابزارهای مورد علاقه ما وجود دارد که به جعبه های محدود کننده برچسب گذاری اجازه شناسایی و به چند ضلعی ها اجازه ناحیه بندی جهت پیاده سازی برنامه بینایی کامپیوتر را می دهند .

اصول اولیه برچسب گذاری در بینایی کامپیوتر (اختیاری)

در بینایی کامپییوتر ، ۳ نوع داده اصلی برای آموزش الگوریتم هایتان وجود دارد :

  1. تصویر + برچسب برای آموزش کلاسه بند ها ( ResNets )
  2. کادر محصور کننده + برچسب برای شناسایی کننده ها ( YOLOv3, Faster R-CNN… )
  3. چند ضلعی ها + برچسب برای کاربرد های ناحیه بندی ( Mask R-CNN )
تفاوت ناحیه بندی و شناسایی اشیا تصویر
تفاوت بین داده ناحیه بندی (رنگ آبی) و داده شناسایی (رنگ بنفش)

همچنین همانطور که به احتمال زیاد متوجه شده اید ، یکی از تاثیر گذار ترین مورد ها برای موفقیت یک پروژه هوش مصنوعی تعداد داده های با کیفیت است که می توانید از آن ها استفاده کنید . منظور از داده با کیفیت برای بینایی کامپیوتر این است که :

  • هر تصویر یا حاشیه نویسی دارای برچسب مناسب خود است .
  • هر کادر محصور کننده یا چند ضلعی با دقت ، موجودیت را احاطه کرده تا بتواند در آن آموزش ببخشد.

حتی اگر مورد اخیر به طور قطع فاقد عینیت باشد ، ما می خواهیم تا  الگوریتم های ما به سطح اجرای انسانی دست بیایند . بنابراین ، ما نیاز به حاشیه نویسی هایی در سطح انسانی داریم .

بهترین ابزار منبع باز حاشیه نویسی برای شرکت های برچسب گذاری

Computer Vision Annotation Tool (CVAT)

ابزار حاشیه نویسی بینایی کامپیوتر Computer Vision Annotation Tool CVAT
ابزار حاشیه نویسی بینایی کامپیوتر ( Computer Vision Annotation Tool – CVAT )

تقریبا ۲۰ سال پس از معرفی OpenCV ، Intel بار دیگر در زمینه بینایی کامپیوتر فعالیت کرده و CVAT را منتشر می کند ، یک ابزار قدرتمند و کامل برای حاشیه نویسی .  با اینکه این ابزار نیاز به زمان برای یادگیری و پیشرفت کردن دارد ، با این حال تعداد بسیار زیادی ویژگی های جدید برای برچسب گذاری بینایی کامپیوتر ارائه می دهد .

نقاط قوت :

  • نصب و مقیاس دهی آن آسان است زیرا این یک برنامه وب است که در Docker اجرا می شود .
  • تعداد زیادی روش های حاشیه نویسی پیشنهاد می کند ( از قبیل حاشیه نویسی خودکار با استفاده از TensorFlow Object Detection API یا Video Interpolation و …)
  • به شما اجازه مدیریت کار گروهی را می دهد تا اعضای یک تیم بتوانند به طور همزمان بر روی یک وظیفه حاشیه نویسی کار کنند.

نقاط ضعف :

  • رابطه کاربری کمی پیچیده است . به عنوان مثال ، تنظیم یک وظیفه حاشیه نویسی برای اولین بار می تواند بسیار مشکل ساز باشد .
  • در ابتدا چندان شهودی نیست؛ چندین روز زمان می برد تا در آن پیشرفت کنید .
  • فقط با Chrome کار می کند ، بنابراین اگر به هر دلیلی از Google می ترسید یا خوشتان نمی آید ، راه حلی پیدا کنید …

استفاده از دمو آنلاین برنامه CVAT

بهترین ابزار منبع باز حاشیه نویسی برای استارت آپ ها

Visual Object Tagging Tools ( VOTT )

ابزار بصری برچسب زدن اشیا Visual Object Tagging Tools VOTT )
ابزار بصری برچسب زدن اشیا ( Visual Object Tagging Tools – VOTT )

VOTT توسط مایکروسافت توسعه یافته و تجربه کاربری فوق العاده ای به شما ارائه می دهد ، که احتمالا زمان و انرژی زیادی برای شما حین برچسب گذاری صرفه جویی می کند . علاوه بر این ، ایجاد یک پروژه نیز ساده است ، بنابراین نیازی نیست که برای استفاده از آن ، در مستندات های آن غرق شوید .

نقاط قوت :

  • کد واقعا بسیار خوب نوشته شده است ( در عمل ) و به خوبی رابط کاربری را تعریف کرده است بنابراین کار با آن آسان است و می توانید توابع اضافی که نیاز دارید را به آن اضافه کنید .
  • همانطور که گفته شد تجربه کاربری با تم مشکی و جدول بندی شده ای که دارد بسیار عالی است ، در نتیجه ، واقعا یافتن این که از کجا شروع به ایجاد کادر محصور کننده کنید، آسان خواهد بود . شاید این مانند یک خدمات افزوده باشد اما باور کنید قطعا باعث ایجاد تفاوت می شود.
  • این برنامه، پیشنهاد می دهد تا از الگوریتم های خودکار یادگیری عمیق برای تشخیص اشیا ها استفاده کنید ( آن را با SSD (Single Shot Detector ) آموزش دیده در کلاس های COCO استفاده می کنند )
  • این یک برنامه وب و یک برنامه الکترونی ( نصبی ) است. به شما امکان می دهد از آن به صورت نصب شده در رایانه های شخصی یا برنامه ای که در مرورگر وب خود اجرا می کنید، استفاده کنید .

نقاط ضعف:

  • برای استفاده از نسخه برنامه وب ، به داده های خود نیاز دارید تا در Azure ، سرویس رایانش ابری مایکروسافت آپلود شوند. ( با این حال ، نسخه الکترونی به شما امکان استفاده از داده ها را بر روی هارد دیسک می دهد ولی ابتدا نیاز دارید تا آن را با npm نصب کنید)
  • این برنامه از API های داخلی استفاده نمی کند . ( تنظیم کردن کد ها بسیار آسان است تا API های خصوصی شما بتواند با آن ارتباط برقرار کند )
  • شما نمی توانید تصویر را برچسب گذاری کنید : شما فقط مجاز هستید تا کادر های محصور کننده یا چند ضلعی ها را با برچسب های داده شده ، رسم کنید . بنابراین ، برای ساخت مجموعه داده های کلاسه بندی مناسب نیست .

استفاده از برنامه تحت وب VoTT

DataTurks

ابزار حاشیه نویسی DataTurks
DataTurks

DataTurks استارت آپی است که در سال ۲۰۱۸ ایجاد شد و خدماتی نظیر برچسب گذاری تصاویر ، فیلم و همچنین متن را ارائه می دهد . با این حال ، شما تا زمانی که به یک منبع باز تبدیل شد ، شما مجبور به پرداخت هزینه آن بودید . ( احتمالا به این قضیه مربوط است که Walmart در فبریه ۲۰۱۹ آن را خریداری کرد )

 با این که، آن ها از آن زمان در مورد این نرم افزار ارتباط برقرار نکردند و حتی به نظر می رسید که متوقف شده است ، با این حال این برنامه یک ابزار برچسب گذاری فوق العاده و اکنون رایگان است !

“وقتی از آن استفاده می کنید ، به هیچ نوشته ای مربوط به مجوز و استفاده محدود برای نسخه های غیرتجاری که در مکان های مختلف نوشته شده است ، توجه نکنید. Dataturks اکنون رایگان است و می توانید از کلیه ویژگی های آن استفاده کنید (ما آن را امتحان و آزمایش کرده ایم)”

نقاط قوت :

  • به عنوان یک ابزار CVAT ، یک برنامه وب است و در Docker قابل اجرا می باشد .
  • اجازه می دهد تا کار های مشترک و غیر همزمان انجام گیرد : دو هم تیمی که بر روی یک مجموعه داده کار می کنند ، تصاویر مشابهی برای برچسب گذاری دریافت نمی کنند .
  • API را برای ایجاد و گرفتن کارهای حاشیه نویسی پیشنهاد می دهد .

نقاط ضعف :

  • به نظر می رسد DataTurk دیگر بر روی محصول خود کار نمی کند .
  • تجربه کاربری خوب است اما اعمال تغییرات جزئی می توانست آن را بسیار بهتر کند .

استفاده از دمو آنلاین DataTurks

بهترین ابزار منبع باز برچسب گذاری عکس برای استفاده شخصی

Make-Sense

ابزار حاشیه نویسی MakeSense
MakeSense.ai

Make–Sense تنها چند ماه است که منتشر شده است ( در ماه ژوئن ۲۰۱۹ ) و در حال حاضر دارای تجربه کاربری فوق العاده ای است . آغاز حاشیه نویسی تا به حال اینقدر سریع نبوده است !  به وب سایت بروید ، تصاویر خود را انتخاب و جای گذاری کرده و حاشیه نویسی را آغاز کنید .

نقاط قوت :

  • سریع ، تاثیر گذار و از همه مهم تر ، آسان !
  • تجربه کاربری بسیار عالی
  • در مورد عکس های شخصی خود نگران نباشید چرا که می گویند : تصاویر را جایی نمی فرستیم و در نتیجه ذخیره هم نمی شوند .

نقاط ضعف :

  • ویژگی های هر گونه مدیریت پروژه ای را فراهم نمی کند .
  • هیچ گونه API را نیز فراهم نمی کند .

استفاده از ابزار حاشیه نویسی MakeSense

لیست کوتاهی از دیگر ابزار های مفید حاشیه نویسی

  • VGG Image Annotator ( VIA )
  • LabelMe که توسط MIT توسعه داده شده است. برای اجرای آن به صورت آنلاین به اینجا و برای نسخه آفلاین به اینجا مراجعه کنید.
  • Coco-Annotator به نظر می رسد که ابزار های کاملی دارد در حالی که کاملاً جدید است ( سیستم تأیید اعتبار کاربر ، نقاط انتهایی API ).

امیدوارم این مقاله به شما در انتخاب ابزاری برای برچسب زدن متناسب با نیاز های شما کمک کرده باشد و در صورت یافتن موارد بهتر در اظهار نظر خود دریغ نکنید.

بیشتر بخوانید :

منبع SICARA
0/5 (0 نظر)

درباره‌ی احمدرضا جعفری

همچنین ببینید

یادگیری ماشین در OpenCV k نزدیک ترین همسایه

یادگیری ماشین در OpenCV : جلسه چهارم

در جلسه قبلی از آموزش یادگیری ماشین به بررسی الگوریتم K نزدیک ترین همسایه پرداختیم. …

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *