تشخیص چهره (Face Detection)

مقالات علمی

تشخیص چهره (Face Detection) یک فناوری رایانه ای مبتنی بر هوش مصنوعی است که می تواند حضور چهره انسان را در عکس ها و فیلم های دیجیتال شناسایی و مکان یابی کند. می توان آن را به عنوان یک مورد خاص از تشخیص اشیاء در نظر گرفت، که در آن وظیفه یافتن مکان ها و تعیین اندازه تمام اشیاء متعلق به یک طبقه معین – در این مورد، چهره ها – در یک تصویر یا تصاویر خاص است.

با توجه به پیشرفت‌های فناوری تشخیص چهره، اکنون می‌توان چهره‌ها را بدون در نظر گرفتن حالت سر، شرایط نور و رنگ پوست در یک تصویر یا ویدیو تشخیص داد. از فناوری تشخیص چهره می توان در زمینه های مختلف – از جمله امنیت، بیومتریک، اجرای قانون، سرگرمی و ایمنی شخصی – استفاده کرد تا نظارت و ردیابی افراد را در زمان واقعی ارائه دهد. در رایج‌ترین نوع تشخیص چهره، الگوریتم‌ها نقاط خاصی مانند شکل چانه را در صورت شناسایی می‌کنند و یک الگو برای آن شخص ایجاد می‌کنند. زمانی که کاربران به طور داوطلبانه تصاویر خود را در یک پایگاه داده محدود، مانند شبکه شرکت، برای استفاده هایی مانند کنترل دسترسی توسط شناسایی چهره ارسال می کنند، شناسایی چهره دقیق تر انجام می شود. هنگامی که فرد به اسکنر صورت نزدیک می شود، تصویر زنده او گرفته شده و به یک الگو تبدیل می شود و سپس با الگوهای ذخیره شده در پایگاه داده مقایسه می شود. مطابقت داشتن چهره با اطلاعات ذخیره شده، کاربر را قادر می‌سازد تا برخی فعالیت‌ها را انجام دهد، مانند عبور از یک در یا ورود به یک شبکه کامپیوتری.

ردیابی چهره چگونه کار می کند؟

برنامه‌های تشخیص چهره از الگوریتم‌هایی استفاده می‌کنند که تعیین می‌کنند آیا تصاویر مثبت هستند (یعنی تصاویر با چهره) یا تصاویر منفی (یعنی تصاویر بدون چهره). برنامه‌های تشخیص چهره از الگوریتم‌ها و ML (machine learning) برای یافتن چهره‌های انسان در تصاویر بزرگ‌تر استفاده می‌کنند که اغلب اشیاء غیر از چهره انسان مانند مناظر، ساختمان‌ها و سایر قسمت‌های بدن انسان مانند پا یا دست را در خود جای می‌دهند. الگوریتم‌های تشخیص چهره معمولاً با جستجوی چشم انسان شروع می‌شوند – یکی از ساده‌ترین ویژگی‌ها برای تشخیص. سپس الگوریتم ممکن است سعی کند ابروها، دهان، بینی، سوراخ‌های بینی و عنبیه را تشخیص دهد. هنگامی که الگوریتم به این نتیجه رسید که یک ناحیه صورت را پیدا کرده است، آزمایش‌های اضافی را برای تأیید اینکه در واقع یک چهره را شناسایی کرده است، اعمال می‌کند.

 

 

برای کمک به اطمینان از دقت، الگوریتم ها باید بر روی مجموعه داده های بزرگی که صدها هزار تصویر مثبت و منفی را در خود جای داده اند، آموزش داده شوند. این آموزش توانایی الگوریتم‌ها را برای تعیین اینکه آیا چهره‌ها در یک تصویر وجود دارند و کجا هستند، بهبود می‌بخشد. پس از آموزش، الگوریتم‌ها می‌توانند با بررسی د اده های ورودی به شکل تصویر به دو سوال پاسخ دهند:

  1. آیا در این تصویر چهره ای وجود دارد؟
  2. اگر بله، کجا هستند؟

روش‌های مورد استفاده در تشخیص چهره می‌تواند مبتنی بر دانش (Knowledge-based)، مبتنی بر ویژگی (Feature-based)، تطبیق الگو (Template matching) یا مبتنی بر ظاهر (Appearance-based) باشد که هرکدام مزایا و معایبی دارند:

  • روش‌های مبتنی بر دانش، یا روش‌های مبتنی بر قانون، چهره‌ای را بر اساس قوانین توصیف می‌کنند. چالش این رویکرد دشواری ارائه قوانین کاملاً تعریف شده است.
  • روش‌های مبتنی بر ویژگی – که از ویژگی‌هایی مانند چشم یا بینی فرد برای تشخیص چهره استفاده می‌کنند – می‌توانند تحت تأثیرِ منفی نویز و نور باشند.
  • روش‌های تطبیق الگو مبتنی بر مقایسه تصاویر با الگوهای استاندارد چهره یا ویژگی‌هایی است که قبلاً ذخیره شده‌اند و برای تشخیص چهره بین این دو ارتباط برقرار می کند. متأسفانه این روش ها به تغییرات در حالت، مقیاس و شکل نمی پردازند.
  • روش‌های مبتنی بر ظاهر از تجزیه و تحلیل آماری و یادگیری ماشینی برای یافتن ویژگی‌های مرتبط تصاویر چهره استفاده می‌کنند. این روش که در استخراج ویژگی برای تشخیص چهره نیز استفاده می شود، به روش های فرعی تقسیم می شود.

برخی از تکنیک های خاص تر مورد استفاده در ردیابی چهره عبارتند از:

  • حذف پس زمینه به عنوان مثال، اگر تصویری دارای پس‌زمینه ساده، تک رنگ یا پس‌زمینه از پیش تعریف‌شده و ثابت باشد، حذف پس‌زمینه می‌تواند به آشکار کردن مرزهای چهره کمک کند.
  • در تصاویر رنگی، گاهی اوقات می توان از رنگ پوست برای یافتن چهره استفاده کرد. با این حال، این ممکن است با تمام چهره ها کار نکند.
  • استفاده از حرکت برای یافتن چهره ها گزینه دیگری است. در ویدئوها، یک چهره تقریبا همیشه در حال حرکت است، بنابراین کاربران این روش باید ناحیه متحرک را محاسبه کنند. یکی از ایرادات این روش خطر اشتباه شدن با سایر اجسام در حال حرکت در پس زمینه است.

 

ترکیبی از استراتژی های ذکر شده در بالا می تواند یک روش تشخیص چهره جامع ارائه دهد. تشخیص چهره در تصاویر به دلیل متغیر بودن عواملی مانند حالت، بیان، موقعیت و جهت، رنگ پوست و مقادیر پیکسل، وجود عینک یا موهای صورت ، شرایط نور و وضوح تصویر می‌تواند پیچیده باشد. سال‌های اخیر پیشرفت‌هایی را در تشخیص چهره با استفاده از یادگیری عمیق به ارمغان آورده است.

زمانی که محققان بینایی کامپیوتری (Computer Vision) پل ویولا و مایکل جونز چارچوبی را برای تشخیص چهره ها با دقت بالا پیشنهاد کردند,پیشرفت های عمده در روش تشخیص چهره در سال ۲۰۰۱ رخ داد. چارچوب Viola-Jones مبتنی بر آموزش براساس مدل برای درک اینکه چه چیزی یک چهره است و چه چیزی نیست، است. پس از آموزش، مدل ویژگی‌های خاصی را استخراج می‌کند، که سپس در یک فایل ذخیره می‌شود تا ویژگی‌های تصاویر جدید را بتوان با ویژگی‌های ذخیره‌شده قبلی در مراحل مختلف مقایسه کرد. اگر تصویر مورد مطالعه از هر مرحله از مقایسه ویژگی ها عبور کند، یک چهره شناسایی شده است و عملیات می تواند ادامه یابد.

اگرچه چارچوب Viola-Jones هنوز برای شناسایی چهره ها در برنامه ها محبوب است، اما محدودیت هایی نیز دارد. به عنوان مثال، اگر صورت با ماسک یا روسری پوشانده شده باشد، یا اگر صورت به درستی جهت دهی نشده باشد، این چارچوب ممکن است کار نکند، ممکن است الگوریتم نتواند آن را پیدا کند.

برای کمک به رفع اشکالات چارچوب ویولا جونز و بهبود تشخیص چهره، الگوریتم‌های دیگری – مانند region-based convolutional neural network (R-CNN)  و Single Shot Detector (SSD)  – برای کمک به بهبود فرآیندها توسعه یافته‌اند.

شبکه عصبی کانولوشنال (CNN) نوعی شبکه عصبی مصنوعی است که برای تشخیص و پردازش تصویر استفاده می‌شود و به طور خاص برای پردازش داده‌های پیکسلی طراحی شده است. یک R-CNN پیشنهادهای منطقه ای را در چارچوب CNN برای بومی سازی و طبقه بندی اشیاء در تصاویر ایجاد می کند.

 

در حالی که رویکردهای مبتنی بر شبکه پیشنهاد منطقه مانند R-CNN به دو عکس نیاز دارند – یکی برای ایجاد پیشنهادهای منطقه و دیگری برای شناسایی شی در هر پیشنهاد – SSD فقط به یک عکس برای شناسایی چندین شی در تصویر نیاز دارد. بنابراین، SSD به طور قابل توجهی سریعتر از R-CNN است.

مزایای ردیابی چهره

به عنوان یک عنصر کلیدی در برنامه های تصویربرداری چهره، مانند تشخیص چهره و تجزیه و تحلیل چهره، تشخیص چهره مزایای مختلفی را برای کاربران ایجاد می کند، از جمله:

  • امنیت بهبود یافته است. تشخیص چهره تلاش های نظارتی را بهبود می بخشد و به ردیابی مجرمان و تروریست ها کمک می کند. امنیت شخصی نیز افزایش یافته است، زیرا هکرها چیزی برای سرقت یا تغییر مانند رمز عبور ندارند.
  • آسان برای ادغام. ادغام فناوری تشخیص چهره و شناسایی چهره آسان است و اکثر راه حل ها با اکثر نرم افزارهای امنیتی سازگار هستند.
  • شناسایی خودکار.در گذشته شناسایی به صورت دستی توسط شخص انجام می شد. این روش ناکارآمد و اغلب نادرست بود. تشخیص چهره اجازه می دهد تا فرآیند شناسایی به صورت خودکار انجام شود، بنابراین باعث صرفه جویی در زمان و افزایش دقت می شود.

معایب ردیابی چهره

در حالی که ردیابی چهره چندین مزیت بزرگ برای کاربران به همراه دارد، معایب مختلفی نیز دارد، از جمله:

  • بار عظیم ذخیره سازی داده ها فناوری فراگیری ماشین (ML) مورد استفاده در تشخیص چهره به ذخیره سازی داده بسیار قدرتمندی نیاز دارد که ممکن است برای همه کاربران در دسترس نباشد.
  • تشخیص آسیب پذیر است. در حالی که تشخیص چهره نتایج دقیق‌تری نسبت به فرآیندهای شناسایی دستی ارائه می‌دهد، اما با تغییر در ظاهر یا زوایای دوربین نیز می‌توان آن را راحت‌تر از بین برد.
  • نقض احتمالی حریم خصوصی. توانایی تشخیص چهره برای کمک به دولت برای ردیابی مجرمان مزایای زیادی ایجاد می کند. با این حال، همین نظارت می تواند به دولت اجازه دهد تا شهروندان خصوصی را مشاهده کند. مقررات سختگیرانه ای باید تنظیم شود تا اطمینان حاصل شود که این فناوری به طور منصفانه و مطابق با حقوق حریم خصوصی انسان استفاده می شود.

ردیابی چهره (Face Detection) و تشخیص چهره(Face Recognition):

اگرچه واژه‌های شناسایی چهره و تشخیص چهره اغلب با هم استفاده می‌شوند، ردیابی چهره (face recognition) تنها یکی از کاربردهای شناسایی چهره (face detection) است و البته یکی از مهم‌ترین آنها. تشخیص چهره برای باز کردن قفل گوشی ها و برنامه های تلفن همراه و همچنین برای تأیید بیومتریک استفاده می شود. صنایع بانکداری، خرده فروشی و حمل و نقل-امنیت از تشخیص چهره برای کاهش جرم و جلوگیری از خشونت استفاده می کنند.

به طور خلاصه، اصطلاح تشخیص چهره فراتر از تشخیص حضور چهره انسان است تا مشخص شود چهره چه کسی است. این فرآیند از یک برنامه کامپیوتری استفاده می‌کند که تصویر دیجیتالی از چهره یک فرد را می‌گیرد – که گاهی اوقات از یک فریم ویدئو گرفته شده است – و آن را با تصاویر موجود در پایگاه داده‌ای از سوابق ذخیره شده مقایسه می‌کند.

کاربردهای ردیابی چهره

اگرچه همه سیستم های تشخیص چهره از ردیابی چهره استفاده می کنند، اما همه سیستم های ردیابی چهره برای تشخیص چهره استفاده نمی شوند. ردیابی چهره همچنین می تواند برای ضبط حرکت صورت یا فرآیند تبدیل الکترونیکی حرکات صورت انسان به یک پایگاه داده دیجیتال با استفاده از دوربین ها یا اسکنرهای لیزری استفاده شود. از این پایگاه داده می توان برای تولید انیمیشن کامپیوتری واقع گرایانه برای فیلم ها، بازی ها یا آواتارها استفاده کرد.

تشخیص چهره همچنین می تواند برای فوکوس خودکار دوربین ها یا شمارش تعداد افرادی که وارد یک منطقه شده اند استفاده شود. این فناوری همچنین دارای کاربردهای بازاریابی نیز است — به عنوان مثال، نمایش تبلیغات خاص زمانی که یک چهره خاص شناسایی می شود.

یکی دیگر از برنامه های کاربردی برای تشخیص چهره به عنوان بخشی از اجرای نرم افزار استنتاج عاطفی (software implementation of emotional inference) است که می تواند به عنوان مثال برای کمک به افراد مبتلا به اوتیسم برای درک احساسات افراد اطراف خود مورد استفاده قرار گیرد. این برنامه با استفاده از پردازش تصویر پیشرفته، احساسات را در چهره انسان می خواند.

یک کاربرد دیگر، استنتاج سخن از نشانه های بصری یا “لب خوانی” است. این می تواند به رایانه ها کمک کند تا تشخیص دهند چه کسی صحبت می کند، که ممکن است در برنامه های امنیتی مفید باشد. علاوه بر این، تشخیص چهره می تواند برای کمک به تار کردن قسمت هایی از یک تصویر برای اطمینان از حفظ حریم خصوصی استفاده شود.

 

چرا ردیابی چهره مهم است؟

تشخیص چهره اولین گام در کاربردهای مختلف دیگر از جمله ردیابی چهره، تحلیل چهره و تشخیص چهره است.

در زمینه تجزیه و تحلیل چهره، تشخیص چهره به الگوریتم‌های تحلیل چهره می‌گوید هنگام شناسایی سن، تشخیص جنسیت و تجزیه و تحلیل احساسات بر اساس حالات چهره، روی کدام قسمت‌های تصویر (یا ویدیو) تمرکز کنند.

و وقتی نوبت به تشخیص چهره می‌رسد، تشخیص چهره برای الگوریتم‌ها ضروری است تا بدانند از کدام بخش‌های تصویر (یا ویدیو) برای تولید اثر چهره استفاده می‌کنند که با چهره‌های قبلاً ذخیره‌شده مقایسه می‌شود تا مشخص شود که آیا مطابقت دارد یا خیر.

در پایان، تشخیص چهره به سرعت در حال رشد است و طیف گسترده ای از مزایا را ارائه می دهد. با استفاده عاقلانه، با کنترل های مناسب برای محدود کردن استفاده گسترده توسط مجریان قانون و شرکت ها، تشخیص چهره یک عنصر کلیدی در ایمنی، امنیت، مراقبت های بهداشتی و بسیاری از زمینه های دیگر است.

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

6 مکان خالی از سکنه
مقالات علمی
۶ مکان خالی از سکنه

۶ مکان خالی از سکنه این مکان ها انرژی خاصی دارند. ۱. پترا، اردن منطقه اطراف پترا از سال ۷۰۰۰ قبل از میلاد مسکونی بوده است، اما قدمت این ویرانه‌های سنگ‌تراش شده به پادشاهی نبطی در قرن اول بازمی‌گردد. عشایر بادیه نشین از دیرباز این دره را با ارواح معروف …

مقالات علمی
امن ترین برنامه های پیام رسان ۲۰۲۲

امن ترین برنامه های پیام رسان ۲۰۲۲ در این مقاله به بررسی بهترین پیام رسان ها جهت حفظ حریم خصوصی تان می پردازیم. یکی از تکنیک های بسیار مهم در این زمینه رمزنگاری END-TO-END است که فقط فرستنده و گیرنده می توانند به دیتا دسترسی داشته باشند.   Signal از …

معرفی زبان برنامه نویسی C++
برنامه نویسی
معرفی زبان برنامه نویسی C++

این زبان از خانواده C  میباشد و بسیار قدرتمند است. یک زبان برنامه‌نویسی همه‌منظوره، همگردان، سطح میانی، شیءگرا و چندرگه است که از برنامه‌نویسی رویه‌ای، تجرید داده‌ها و برنامه‌نویسی شیءگرا پشتیبانی می‌کند.   تاریخچه زبان : استراس‌تروپ کار بر روی زبان «C دارای کلاس» را در سال ۱۹۷۹ آغاز کرد. …