زومیت :
اگرچه شرکتهای هوش مصنوعی، نرمافزارهایی را برای تشخیص احساسات در چهرهی افراد منتشر کردهاند، به عقیدهی روانشناسان تشخیص احساسات به این راحتی امکانپذیر نیست. صدها چهره یکی پس از دیگری روی نمایشگر ظاهر میشوند. در برخی چهرهها، چشمها کشیده شدهاند، در برخی، لبها جمع شدهاند. در گروهی دیگر، چشمها به حالت فشرده بسته شدهاند، گونهها بالا رفتهاند و دهان به حالت تعجب باز مانده است. برای هرکدام از چهرهها باید به پرسشی ساده پاسخ داد: این شخص در حال تجربهی لذت است یا دردی ناگهانی؟
راچل جک روانشناس و همکاران او در سال ۲۰۱۸، از ۸۰ نفر درخواست کردند در تست چهرهشناسی شرکت کنند. این تیم، در دانشگاه گلاسکو بریتانیا فهرستی از شرکتکنندگان آسیای شرقی و غربی را برای پژوهشی بلندمدت تهیه کردند. آنها این پرسش را مطرح کردند: آیا حالتهای چهره میتوانند به درستی احساسات را منتقل کنند؟
پژوهشگران از افراد دربارهی احساسات دریافتی آنها در طول سالهای زندگیشان پرسیدند. افراد شرکتکننده بزرگسالها و کودکانی از کشورها و جمعیتهای بومی مناطق دورافتادهی دنیا بودند. مشاهدات تأثیرگذار دههی ۱۹۶۰ و ۱۹۷۰ پاول اکمان، روانشناس آمریکایی نشان میدهد، انسانها در سراسر جهان میتوانند حالتهای روحی را براساس حالات چهره تشخیص دهند؛ و این نتیجه نشان میدهد حالتهای چهره در سراسر جهان مشترک است.
ایدههای یادشده، دهها سال ثابت و بدون تغییر باقی ماندند؛ اما گروه جدیدی از روانشناسان و دانشمندان شناختی، با بازنگری در دادهها، نتایج را زیر سؤال بردند. امروزه بسیاری از پژوهشگران معتقدند تفسیر احساسات پیچیدهتر شده است و حالتهای چهره در بافتها و فرهنگهای مختلف، تفاوتهای گستردهای با یکدیگر دارند.
اختلاف بین پژوهشگران بر سر صحت نتایج پژوهشهای اکمان افزایش یافته است؛ اما شرکتها و دولتها هنوز فرضیهی اکمان را قبول دارند و از آن برای تأثیر بر زندگی مردم استفاده میکنند. برای مثال در بسیاری از سیستمهای قانونی غربی، خواندن احساسات متهم، بخشی از فرایند دادخواهی است. آنتونی کندی، قاضی دیوان عالی ایالات متحده در سال ۱۹۹۲ با تأکید بر اهمیت این موضوع مینویسد: «باید قلب و ذهن مجرم را شناخت.»
رمزگشایی از احساسات، هستهی اصلی برنامهی آموزشی جنجالی اکمان برای وزارت امنیت حملونقل ایالات متحده (TSA) بود که در سال ۲۰۰۷ معرفی شد. این برنامه که SPOT نام داشت (مخفف نظارت بر مسافران با روشهای عینی)، برای تدریس نظارت بر مسافران، بررسی علائم مشکوک استرس، فریب یا ترس به کارکنان TSA تولید شده بود؛ اما دانشمندان، اعضای کنگرهی ایالات متحده و سازمانهایی مثل انجمن آزادیهای مدنی آمریکا این برنامه را به دلیل انحراف و بیدقتی بالا مورد انتقاد قرار دادند.
از طرفی شرکتهای فناوری، بدون توجه به نگرانیهای یادشده از فرضیهی کشف آسان احساسات حمایت کردند و حتی نرمافزارهایی را براساس این فرضیه طراحی کردند. این سیستمها آزمایش شدند و برای ارزیابی تناسب کاندیدهای شغلی، دروغسنجی، افزایش جذابیت تبلیغات و تشخیص اختلالهایی مثل زوال عقل تا افسردگی به کار رفتند. چنین تخمینهایی ارزش این صنعت را به میلیاردها دلار رساندند. غولهای فناوری از جمله مایکروسافت، IBM و آمازون و همچنین شرکتهای تخصیص مثل Affectiva در بوستون، ماساچوست و شرکت NeuroData در میامی و فلوریدا، همه الگوریتمهایی را برای کشف احساسات افراد براساس چهره، پیشنهاد دادهاند.
پژوهشگران هنوز هم بر سر تولید یا درک صحیح احساسات و حالتهای چهره، اختلاف نظر دارند. بسیاری از آنها معتقدند هنوز برای استفاده از کامپیوترها برای تشخیص چهرهی خودکار زود است، زیرا فناوری میتواند واکنشهای مخربی را در پی داشته باشد. مؤسسهی AI Now، مرکزی پژوهشی در دانشگاه نیویورک است که ممنوعیت استفاده از فناوری تشخیص احساسات را در موقعیتهای حساسی مثل استخدام یا قانونگذاری، ضروری میداند. به عقیدهی الکس مارتینز، پژوهشگر چهره در دانشگاه ایالتی اوهایو، تفسیر حالات چهره حتی برای انسانها هم کار دشواری است. درنتیجه، روند خودکارسازی این فرایند میتواند بسیار نگرانکننده باشد.
دانشمندان چگونه به بررسی حالتهای چهره میپردازند؟
عمق پوست
صورت انسان از ۴۳ ماهیچه تشکیل شده است که میتوانند کشیده شوند، بالا بروند و به صدها شکل مختلف دربیایند. با وجود گسترهی وسیع حرکتها، دانشمندان معتقدند برخی حالتهای چهره، احساسات مشخصی را منتقل میکنند.
چارلز داروین یکی از پیشتازان تشخیص احساسات بود. کتاب او با عنوان درباب منشأ انواع در سال ۱۸۵۹، نتیجهی پژوهشی میدانی دشوار و یکی از منابع مشاهداتی غنی است. دومین اثر تأثیرگذار او، ابراز احساسات در انسان و حیوان (۱۸۷۲)، کمی دقیقتر است. داروین در این کتاب مینویسد، حرکات چهرهی نخستیسانها مشابه ابراز احساسات انسان از جمله انزجار و ترس است و ابراز احساسات میتوانند عملکردی انطباقی داشته باشند. برای مثال، پیچش لب، مچاله شدن بینی و باریک کردن چشمها که مربوط به احساس انزجار میشوند ممکن است ریشه در محافظت از فرد در برابر عوامل بیماریزای سمی داشته باشند. با توسعهی رفتارهای اجتماعی، این حالتها برای برقراری ارتباط و بیان احساسات به کار رفتند.
مقالهی داروین دربارهی احساسات، از تعداد زیادی حالتهای مختلف چهره از جمله سوژههایی برای نمایش حالت غم تشکیل شده است.
اکمان برای پژوهشهای میان فرهنگی خود در دههی ۱۹۶۰، از فرضیههای داروین استفاده کرد. او نحوهی ابراز و درک شش احساس کلیدی شامل خوشحالی، ناراحتی، خشم، ترس، شگفتزدگی و انزجار را در سراسر جهان از جمله گینهی نو، آزمایش کرد. اکمان به دلایل کاربردی، از شش حالت یاد شده استفاده کرد زیرا برخی احساسات از جمله حس شرم یا گناه، بهصورت مستقیم منتقل نمیشوند. او میگوید:
شش حس انتخابی، حالتهای چهرهی مشخصی را منتقل میکنند و بررسی آنها آسانتر است.
بهگفتهی اکمان، بررسیهای اولیه شواهدی برای جهانی بودن نظریهی تکامل داروین ارائه کردند؛ و آثار بعدی هم این فرضیه را تقویت کردند که برخی حالتهای چهره میتوانند دارای مزیت انطباقی باشند. لیزا فلدمن برت، روانشناس دانشگاه شمال شرقی بوستون میگوید: «طبق فرضیهای دیرینه، حالتهای چهره، حرکاتی ضروری هستند.» به بیان دیگر، صورت افراد نمیتواند احساسات را مخفی کند. مشکل واضح چنین فرضیهای وجود ابراز احساسات جعلی است. برای مثال برخی افراد میتوانند بدون ایجاد هیچ حرکتی در چهرهی خود، حسی را تجربه کنند. پژوهشگران حامی نظریهی اکمان، بر تغییرات قابل توجهی احتمالی در استاندارد طلایی هر کدام از احساسات، تأکید میکنند.
از طرفی، بخش زیادی از پژوهشگران معتقدند تغییرات احساسی بهحدی گسترده هستند که نظریهی استاندارد طلایی را محکوم به شکست میکنند. دیدگاه آنها پشتوانهی علمی وسیعی دارد. برای مثال چند سال پیش، ویراستارهای مجلهی Psychological Science in the Public Interest، هیئتی از مؤلفان را گرد هم آورد که با یکدیگر مخالف بودند و از آنها خواست به بازنگری در پژوهش چهره بپردازند. پژوهشگران بهجای کار روی یک فرضیه، به بررسی دادهها پرداختند. برت میگوید:
ما نهایت سعی خود را برای کنار گذاشتن تفکرات پیشین خود کردیم. در صورت بروز مخالفت، سعی میکردیم جستجوی شواهد را افزایش دهیم.
پژوهشگران تقریبا ۱۰۰۰ مقاله را مطالعه کردند؛ و پس از دو سال و نیم به نتیجهای قوی رسیدند: شواهد کمی برای تشخیص وضعیت احساسی براساس مجموعهای از حرکات چهره وجود دارند. البته در بعضی نمونهها هیچگونه شواهدی وجود نداشت.
چهرهها صرفا میتوانند خلق و خوی افراد را نشان دهند.
از طرفی، گروهی از پژوهشها، هیچگونه رابطهای را بین حرکات چهره و احساسات درونی نشان ندادهاند. کارلوس کریولی، روانشناس دانشگاه دی مونتفورت در لیستر بریتانیا در پژوهشی روی ساکنین جزایر تروبریاند در گینهی نوی پاپوآ، به هیچگونه شواهدی از نتیجهگیریهای اکمان نرسید. به عقیدهی کریولی، تلاش برای ارزیابی وضعیت روانی درونی افراد براساس شاخصهای بیرونی، مانند تلاش برای اندازهگیری جرم با واحد متر است.
دلیل دیگر نبود شواهد برای حالتهای سراسری چهره، محدودتر است. مسائلی مثل، حرکات بدن، شخصیت، لحن صدا و تغییرات رنگمایهی پوستی نقش مهمی در نحوهی دریافت و ابراز احساسات دارند. برای مثال، تغییر در وضعیت احساسی افراد میتواند بر جریان خون تأثیر بگذارد و درنتیجه ظاهر پوست را تغییر دهد. طبق نتایج مارتینز و همکاران، تغییرات رنگمایهی پوستی به احساسات ربط دارند. بافت بصری از جمله صحنهی پسزمینه هم میتوانند سرنخهایی را از حالت احساسی اشخاص ارائه کنند.
احساسات ترکیبی
به عقیدهی گروهی دیگر از پژوهشگران، مخالفت با نتایج اکمان تا اندازهای اغراقآمیز است. اکمان در سال ۲۰۱۴، در واکنش به انتقاد برت به بخشی از پژوهشها و پشتوانههای علمی فرضیهی خود اشاره کرد. این پژوهشها شامل مقالههایی دربارهی حالتهای چهرهی آنی و پژوهش روی ارتباط بین حالتهای چهره و وضعیت بدن و مغز بودند. به عقیدهی اکمان، حالتهای چهره نهتنها قادر به انتقال احساسات افراد هستند بلکه میتوانند الگوهایی از فعالیتهای روانشناختی، عصبی را هم آشکار کنند. اکمان میگوید همچنان بر عقیدهی خود راسخ است.
به نقل از جسیکا تریسی، روانشناس دانشگاه بریتیش کلمبیا در ونکوور کانادا، برخی پژوهشگران به شیوهای اغراقآمیز و تنها براساس چند مثال مخالف، با نظریهی اکمان مخالفت میکنند. او با اشاره به تحلیل تقریبا ۱۰۰ مقالهی مرتبط میگوید:
اغلب افراد با دیدن چهرهای خشمگین، بهسرعت آن را تشخیص میدهند. طبق هزاران شواهد دیگر، اغلب افراد در اغلب فرهنگهای سراسر دنیا، در هنگام خشم، واکنش مشابهی را نشان میدهند.
تریسی و سه روانشناس دیگر معتقدند، بررسی برت، دربارهی نگاشت یک به یک بین شش حس و حرکات چهره، اغراق آمیز است. دیسا ساوتر از دانشگاه آمستردام میگوید: «فکر نمیکنم هیچ پژوهشگری در حوزهی علوم حسی، چنین تفکر اغراقآمیزی داشته باشد.»
ساوتر و تریسر معتقدند، برای درک حالتهای چهره، به طبقهبندی غنیتری از احساسات نیاز داریم. برای مثال بهجای اینکه، خوشحالی بهعنوان احساسی مستقل در نظر گرفته شود، باید به شناسایی مؤلفههای سازندهی آن پرداخت؛ گروه خوشحالی میتواند شامل احساساتی مثل لذت، خوشگذرانی، دلسوزی، غرور و بسیاری از احساسات دیگر باشد. حالتهای چهره برای هر کدام از این احساسات متفاوت هستند یا میتوانند دارای همپوشانی باشند.
به ترتیب عقربههای ساعت از بالا سمت چپ: خوشحالی پس از گل زیون ویلیامسون، بسکتبالیست؛ خوشحالی هواداران مکزیک از برد در مرحلهی گروهی جام جهانی؛ خوشحالی ادل پس از برنده شدن جایزهی گرمی در سال ۲۰۱۲؛ اشک هواداران جاستین بیبر در کنسرت مکزیکوسیتی.
در هر پژوهش باید به عنصر معنادار توجه کرد. برای مثال در یکی از بررسیها، شرکتکنندگان یکی از شش برچسب احساسی را برای هر چهره انتخاب میکردند. به عقیدهی پژوهشگران گزینهای که بیش از ۲۰ درصد، انتخاب شده باشد نشاندهندهی اشتراک معنادار است. به اعتقاد گروهی دیگر از پژوهشگران، میزان ۲۰ درصد برای رسیدن به این نتیجه کافی نیست. جک معتقد است، آستانهی انتخاب اکمان بسیار پائین است. او میگوید:
با مشورت با استاد راهنمای خود دربارهی نمودارهای دههی ۱۹۶۰ و ۱۹۷۰ اکمان متوجه شدم هر کدام از آنها تفاوتهای زیادی از نظر تشخیص فرهنگی دارند. هنوز هیچ دادهای وجود ندارد که نشان دهد چنین احساساتی سراسری هستند.
پژوهشگران علاوه بر معناداری باید با فردگردایی هم در پژوهشها مبارزه کنند. برای مثال در بسیاری از بررسیها، آزمایشکننده در ابتدای تست به برچسبگذاری احساسات پرداخته است، درحالیکه ممکن است نتایج نهایی تغییر کنند؛ بنابراین، برت، جک و دیگر پژوهشگران در تلاش هستند روشهای بیطرفانهتری را برای بررسی احساسات پیدا کنند. برت در جستجوی نمایندهای برای خشم، ترس یا لذت، بهدنبال معیارهای روانشناسی میرود. جک هم بهجای استفاده از تصاویر و سوژههای از پیش تعیینشده از کامپیوتر برای تولید حالتهای چهرهی تصادفی استفاده میکند تا صرفا بر شش حس متداول متمرکز نشود. گروهی دیگر هم از شرکتکنندگان میخواهند، چهرهها را در دستههای مختلف احساسی طبقهبندی کنند یا شرکتکنندگانی از فرهنگهای مختلف را برای برچسبگذاری تصاویر به زبان خود، جمعآوری میکنند.
احساسات کامپیوتری
سازمانهای نرمافزاری، تمایلی به ارائهی مجوز رایگان برای بررسی الگوریتمهای خود ندارند. یک برنامهی معمولی هوش مصنوعی (AI) برای تشخیص چهره، از میلیونها تصویر چهره و صدها ساعت ویدئو تشکیل شده است که احساسات موجود در هر کدام از تصاویر و ویدئوها، دارای برچسب هستند. برنامهها براساس این برچسبها میتوانند الگوهای مختلف را تشخیص دهند. شرکت Affectiva میگوید، نرمافزار خود را با بیش از ۷ میلیون چهره از ۸۷ کشور جهان آموزش داده است و دقت آن را به ۹۰ درصد رسانده است. این شرکت، هنوز از پشتوانهی علمی الگوریتم خود سخنی نگفته است. آزمایشگاه Neurodata هم بر تنوع ابراز احساسات چهره تأکید میکند و میگوید: «وقتی شخصی اتفاقی حسی را تجربه میکند، برخی حالتهای چهره بیشتر تکرار میشوند؛ و الگوریتمها هم عنصر اشتراک را در نظر میگیرند.»
پژوهشگران در هر دو طیف موافق و مخالف، نسبت به نرمافزارهای تشخیص حالت بدبین هستند و از طرفی دربارهی کاربرد دادهها برای آموزش این الگوریتمها و اعتبار علمی آنها نگراناند. اکمان میگوید، ادعای بسیاری از شرکتهای فناوری را در زمینهی تشخیص چهره قبول ندارد. او نامی از شرکتها نبرد اما اشاره کرد که از بزرگترین شرکتهای فناوری دنیا هستند. اکمان از این شرکتها درخواست کرده است روش خودکار آنها را برای تشخیص چهره بررسی کند. او میگوید: «تا جایی که میدانم، آنها مدعی چیزی هستند که هنوز شواهدی برای آن وجود ندارد.»
برخی پژوهشها از کامپیوترها برای تولید تصادفی چهرهها استفاده میکنند. در پژوهش راشل جک (۲۰۱۸)، از شرکتکنندگان خواسته شد چگونگی تطبیق هر چهره با حالت درد یا لذت را شرح دهند.
به عقیدهی مارتینز، شاید کشف احساس خودکار بتواند نکاتی را دربارهی واکنش احساسی میانگین در گروهی از افراد بیان کند. برای مثال شرکت Affectiva، نرمافزاری را به شرکتهای بازاریابی میفروشد که به آنها در پیشبینی واکنش پایگاه مشتری به محصول یا کمپین بازاریابی کمک میکند.
در صورتی که نرمافزارها مرتکب خطایی شوند، ذینفعان هم عملکرد ضعیفی خواهند داشت. برای مثال ممکن است تبلیغات شرکت، طبق انتظار پیش نرود؛ اما برخی الگوریتمهای به کاررفته در فرآیندهای شغلی ممکن است تأثیر زیادی در زندگی افراد از جمله مصاحبههای شغلی داشته باشند. سال گذشته، کشورهای مجارستان، لتونی و یونان، سیستمی را برای پیشنمایش به مسافران طراحی کردند که هدف آن کشف تقلب از طریق تحلیل حالتهای جزئی چهرهی افراد بود.
هنوز نیاز به پژوهشهای مختلفی در زمینهی ابراز احساسات، وجود دارد. شرکتهای فناوری، اغلب از برت دعوت میکنند. او در ماه گذشته به بازدید از مایکروسافت پرداخت. برت معتقد است پژوهشگران باید از روش داروین برای نوشتن کتاب منشأ انواع استفاده کنند: مشاهده، مشاهده، مشاهده.
تنها آزمایشگاه کافی نیست و باید حالتهای چهرهی واقعی افراد را بررسی کرد. سپس از ماشینها برای ثبت و تحلیل تصاویر واقعی استفاده کرد. برت معتقد است، بهجای بازبینی مجموعهی دادهها و آزمایشها، دادههای بیشتر و روشهای تحلیلی میتوانند به پژوهشگران در یادگیری نکات جدیدتر کمک کنند. برت با شرکتهای فناوری که میخواهند از مبنایی علمی ضعیفی بهرهبرداری کنند، مخالفت میکند و میگوید:
آیا شرکتهای هوش مصنوعی میخواهند از فرضیههای اشتباه استفاده کنند یا بهدنبال انجام کارهای ضروری برای رسیدن به هدف خود هستند؟
دیدگاه تان را بنویسید