کد نوشته: 5656

چرا دستیارهای هوشمند با صدای واقعی‌تر، گاهی بی‌ادب به نظر می‌رسند؟

دستیارهای هوشمندی که صدای واقعی‌تری دارند، کاربران را بیشتر درگیر می‌کنند، اما همین واقعی بودن می‌تواند منجر به برداشت اشتباه از رفتار آن‌ها شود. کاربران انتظار دارند این دستیارها مانند انسان‌ها رفتار کنند و انجام هم‌زمان چند کار را بی‌ادبی تلقی می‌کنند.

بسیاری از پژوهش‌ها بر جنبه‌های قابل مشاهده هوش مصنوعی مانند آواتارها یا ربات‌ها تمرکز دارند، اما در شرایطی که استفاده از این رابط‌ها ممکن نیست (مانند عینک‌های هوشمند که فاقد صفحه نمایش هستند)، رابط‌های صوتی ضروری می‌شوند.

راز واقعی‌تر کردن صدای دستیار هوشمند

پژوهشگران دانشگاه کارنگی ملون با همکاری متخصصان روان‌شناسی، یک رابط صوتی طراحی کرده‌اند که دستیار هوشمند را طوری القا می‌کند که گویی واقعاً در اتاق حضور دارد. این امر از طریق دو روش کلیدی حاصل می‌شود:

پخش صدا از جهت مشخص (Spatialization): این تکنیک باعث می‌شود صدای دستیار از نقطه‌ای خاص در اتاق شنیده شود و این تصور را ایجاد کند که دستیار در حال حرکت است، کتابی را ورق می‌زند یا در لیوانی آب می‌ریزد.
جلوه‌های صوتی سینمایی (Foley effects): این صداها که در فیلم‌ها برای افزایش حس واقع‌گرایی استفاده می‌شوند، شامل صداهایی مانند خش‌خش لباس، جیرجیر صندلی یا صدای تایپ کردن هستند. دکتر لوری هلر، متخصص ادراک شنوایی، معتقد است این صداها به تجربه واقعی‌بودن کمک می‌کنند؛ نبود آن‌ها حس واقعی بودن را از بین می‌برد.

آزمایش و نتایج

در آزمایشی، شرکت‌کنندگان با دستیاری صحبت کردند که صداهای محیطی مانند ورق زدن کتاب، تایپ کردن و ریختن آب را تولید می‌کرد. نتایج نشان داد که افزودن این جلوه‌های صوتی، تعامل کاربران را به طور چشمگیری افزایش داد و دستیار هوشمند بسیار انسان‌نما به نظر رسید. دکتر دیوید لیندلبائر، استاد دانشگاه کارنگی ملون، تأیید کرد که این جلوه‌های صوتی، درگیری و ارتباط کاربر با دستیار را افزایش می‌دهند.

پیامد غیرمنتظره: برداشت بی‌ادبی

با وجود افزایش درگیری، این انسان‌نمایی پیامد غیرمنتظره‌ای داشت: کاربران انتظار داشتند دستیار از هنجارهای اجتماعی پیروی کند. زمانی که دستیار هم‌زمان با صحبت، کارهای دیگری مانند تایپ کردن یا ورق زدن کتاب را انجام می‌داد، شرکت‌کنندگان احساس می‌کردند حواس دستیار پرت است و به آن‌ها توجه کافی نمی‌شود. این رفتار از نظر آن‌ها بی‌ادبانه تلقی می‌شد.

راه حل پیشنهادی

یی فی چِنگ، دانشجوی دکتری دانشگاه کارنگی ملون، پیشنهاد می‌کند که جلوه‌های صوتی باید متناسب با مکالمه طراحی شوند؛ به این معنی که دستیار تنها زمانی باید کار دیگری را انجام دهد که مزاحم صحبت او نباشد.

آینده دستیارهای صوتی

دکتر لیندلبائر معتقد است که می‌توان جلوه‌های صوتی مستقلی از محیط طراحی کرد که بدون نیاز به دانش خاصی از فضای اطراف، همان تأثیر مثبت را بر درگیرکردن کاربر داشته باشند. جالب اینکه حتی زمانی که صداها با آنچه چشم می‌دید کاملاً هماهنگ نبود، باز هم تأثیر خود را بر کاربران گذاشت و حس حضور یک انسان واقعی را القا کرد.

این یافته‌ها در کنفرانس عوامل انسانی در سامانه‌های محاسباتی (CHI ۲۰۲۶) ارائه شده‌اند.

#دستیار هوشمند، رابط صوتی، واقع‌گرایی صدا، جلوه‌های صوتی، هنجارهای اجتماعی، تعامل انسان و کامپیوتر