دستیارهای هوشمندی که صدای واقعیتری دارند، کاربران را بیشتر درگیر میکنند، اما همین واقعی بودن میتواند منجر به برداشت اشتباه از رفتار آنها شود. کاربران انتظار دارند این دستیارها مانند انسانها رفتار کنند و انجام همزمان چند کار را بیادبی تلقی میکنند.
بسیاری از پژوهشها بر جنبههای قابل مشاهده هوش مصنوعی مانند آواتارها یا رباتها تمرکز دارند، اما در شرایطی که استفاده از این رابطها ممکن نیست (مانند عینکهای هوشمند که فاقد صفحه نمایش هستند)، رابطهای صوتی ضروری میشوند.
راز واقعیتر کردن صدای دستیار هوشمند
پژوهشگران دانشگاه کارنگی ملون با همکاری متخصصان روانشناسی، یک رابط صوتی طراحی کردهاند که دستیار هوشمند را طوری القا میکند که گویی واقعاً در اتاق حضور دارد. این امر از طریق دو روش کلیدی حاصل میشود:
- پخش صدا از جهت مشخص (Spatialization): این تکنیک باعث میشود صدای دستیار از نقطهای خاص در اتاق شنیده شود و این تصور را ایجاد کند که دستیار در حال حرکت است، کتابی را ورق میزند یا در لیوانی آب میریزد.
- جلوههای صوتی سینمایی (Foley effects): این صداها که در فیلمها برای افزایش حس واقعگرایی استفاده میشوند، شامل صداهایی مانند خشخش لباس، جیرجیر صندلی یا صدای تایپ کردن هستند. دکتر لوری هلر، متخصص ادراک شنوایی، معتقد است این صداها به تجربه واقعیبودن کمک میکنند؛ نبود آنها حس واقعی بودن را از بین میبرد.
آزمایش و نتایج
در آزمایشی، شرکتکنندگان با دستیاری صحبت کردند که صداهای محیطی مانند ورق زدن کتاب، تایپ کردن و ریختن آب را تولید میکرد. نتایج نشان داد که افزودن این جلوههای صوتی، تعامل کاربران را به طور چشمگیری افزایش داد و دستیار هوشمند بسیار انساننما به نظر رسید. دکتر دیوید لیندلبائر، استاد دانشگاه کارنگی ملون، تأیید کرد که این جلوههای صوتی، درگیری و ارتباط کاربر با دستیار را افزایش میدهند.
پیامد غیرمنتظره: برداشت بیادبی
با وجود افزایش درگیری، این انساننمایی پیامد غیرمنتظرهای داشت: کاربران انتظار داشتند دستیار از هنجارهای اجتماعی پیروی کند. زمانی که دستیار همزمان با صحبت، کارهای دیگری مانند تایپ کردن یا ورق زدن کتاب را انجام میداد، شرکتکنندگان احساس میکردند حواس دستیار پرت است و به آنها توجه کافی نمیشود. این رفتار از نظر آنها بیادبانه تلقی میشد.
راه حل پیشنهادی
یی فی چِنگ، دانشجوی دکتری دانشگاه کارنگی ملون، پیشنهاد میکند که جلوههای صوتی باید متناسب با مکالمه طراحی شوند؛ به این معنی که دستیار تنها زمانی باید کار دیگری را انجام دهد که مزاحم صحبت او نباشد.
آینده دستیارهای صوتی
دکتر لیندلبائر معتقد است که میتوان جلوههای صوتی مستقلی از محیط طراحی کرد که بدون نیاز به دانش خاصی از فضای اطراف، همان تأثیر مثبت را بر درگیرکردن کاربر داشته باشند. جالب اینکه حتی زمانی که صداها با آنچه چشم میدید کاملاً هماهنگ نبود، باز هم تأثیر خود را بر کاربران گذاشت و حس حضور یک انسان واقعی را القا کرد.
این یافتهها در کنفرانس عوامل انسانی در سامانههای محاسباتی (CHI ۲۰۲۶) ارائه شدهاند.