OpenAI روز دوشنبه از بهروزرسانیهای جدید برای حالت صوتی پیشرفته ChatGPT، قابلیت مکالمه صوتی بیدرنگ این چتبات مبتنی بر هوش مصنوعی، رونمایی کرد. هدف از این بهروزرسانی، بهبود تعاملات کاربران با این دستیار هوش مصنوعی از طریق کاهش دفعات قطع مکالمات و همچنین ارتقای ویژگیهای شخصیتی آن است.
مانوکا استراتا، پژوهشگر پس از آموزش در OpenAI، در ویدیویی که روز دوشنبه در شبکههای اجتماعی رسمی این شرکت منتشر شد، این تغییرات را اعلام کرد. بهروزرسانی جدید اوپنایآی در تلاش است تا یکی از مشکلات رایج دستیارهای صوتی هوش مصنوعی را برطرف کند؛ مشکلی که در آن دستیار صوتی هنگام مکث کاربران برای فکر کردن یا نفس عمیق کشیدن، صحبت آنها را قطع میکند.
بر اساس این بهروزرسانی، کاربران رایگان ChatGPT اکنون به نسخه جدیدی از حالت صوتی پیشرفته دسترسی خواهند داشت که به آنها اجازه میدهد بدون نگرانی از قطع شدن، در حین صحبت با دستیار هوش مصنوعی مکث کنند. همچنین، کاربران پولی ChatGPT، شامل مشترکین طرحهای Plus، Teams، Edu، Business و Pro، علاوه بر تجربه قطعیهای کمتر در حالت صوتی پیشرفته، از شخصیت بهبودیافته این دستیار صوتی نیز بهرهمند خواهند شد.
سخنگوی OpenAI در مصاحبه با تککرانچ اعلام کرد که دستیار صوتی هوش مصنوعی جدید این شرکت برای کاربران پولی، در پاسخهایش “مستقیمتر، جذابتر، مختصرتر، مشخصتر و خلاقانهتر” عمل خواهد کرد.
شایان ذکر است که این بهبودها در حالت صوتی پیشرفته در حالی ارائه میشوند که OpenAI با فشار فزایندهای از سوی رقبا در عرصه دستیارهای صوتی هوش مصنوعی روبرو است. در همین راستا، استارتاپ Sesame، که با حمایت Andreessen Horowitz و توسط برندن ایریب، یکی از بنیانگذاران Oculus، تاسیس شده است، اخیراً به دلیل دستیارهای صوتی هوش مصنوعی طبیعی خود به نامهای مایا و مایلز، توجه بسیاری را به خود جلب کرده است. علاوه بر این، بازیگران بزرگتری مانند آمازون نیز با جدیت بیشتری وارد این حوزه شدهاند و در حال آمادهسازی نسخه مبتنی بر مدل زبانی بزرگ (LLM) دستیار صوتی الکسا خود هستند. این رقابت تنگاتنگ نشاندهنده اهمیت روزافزون دستیارهای صوتی هوش مصنوعی در زندگی کاربران و تلاش شرکتهای فناوری برای ارائه بهترین تجربه کاربری در این زمینه است.