متا هوش مصنوعی Seamless برای ترجمه آنی مکالمات بین زبان‌های مختلف رونمایی کرد

در جدیدترین اخبار منتشر شده در صنعت تکنولوژی مطلع شدیم که شرکت متا هوش مصنوعی Seamless برای ترجمه آنی مکالمات بین زبان‌های مختلف رونمایی کرد.

براساس گزارش منتشر شده توسط رسانه venturebeat مطلع شدیم که محققان هوش مصنوعی متا مجموعه جدیدی از مدل‌های هوش مصنوعی به نام Seamless Communication را توسعه‌ داده‌اند که هدف آن برقراری ارتباط طبیعی و بهتر بین زبان‌هاست و اساساً مفهوم مترجم جهانی گفتار را به یک واقعیت تبدیل می‌کند.

همانطور که اعلام شد مدل هوش مصنوعی ترجمه متا که Seamless نام دارد، قابلیت‌های سه مدل دیگر این شرکت – SeamlessExpressive ،SeamlessStreaming و SeamlessM4T v2 را در یک سیستم یکپارچه با یکدیگر ترکیب می‌کند. براساس مقاله تحقیقاتی متا، Seamless «اولین سیستم در دسترس عموم است که ارتباطات کلامی بین‌زبانی را در لحظه فراهم می‌کند.»

مترجم Seamless مرز جدیدی را در استفاده از هوش مصنوعی برای ارتباط در سراسر وبلاگ نشان می‌دهد. این سه مدل شبکه عصبی پیچیده را ترکیب می‌کند تا ترجمه بلادرنگ بین بیش از ۱۰۰ زبان گفتاری و نوشتاری را در عین حفظ سبک آوازی، احساسات و عروض صدای گوینده، امکان‌پذیر کند.

متا در SeamlessExpressive روی حفظ سبک آوا و تفاوت‌های ظریف احساسی صدای گوینده در هنگام ترجمه تمرکز کرده است. در مقاله این شرکت آمده:

ترجمه‌ها باید ظرافت‌های بیان انسان را شامل شوند. در حالی که ابزارهای ترجمه موجود در ضبط محتوای یک مکالمه مهارت دارند، اما معمولاً برای خروجی خود به سیستم‌های تبدیل متن به گفتار رباتیک و یکنواخت متکی هستند.

همچنین ادعا شده است که SeamlessStreaming ترجمه تقریباً هم‌زمان با تنها دو ثانیه تأخیر را امکان‌پذیر می‌کند. محققان می‌گویند که این اولین مدل چندزبانه‌ای است که با چنین سرعتی می‌تواند ترجمه نزدیک به ۱۰۰ زبان گفتاری و نوشتاری را فراهم کند. محققان متا درنهایت به‌عنوان نتیجه‌گیری می‌گویند:

در مجموع، Seamless نگاهی محوری به اساس فنی موردنیاز برای تبدیل مترجم جهانی گفتار از یک مفهوم علمی-تخیلی به یک فناوری واقعی به ما ارائه می‌کند. به‌طور کلی، تجربیات چندبُعدی که Seamless ممکن است ایجاد کند، می‌تواند منجر به تغییر فاز در نحوه انجام ارتباطات بین‌زبانی به کمک ماشین شود.

مدل سوم، SeamlessM4T v2، به عنوان پایه‌ای برای دو مدل دیگر عمل می‌کند. این یک نسخه ارتقا یافته از مدل اصلی SeamlessM4T است که سال گذشته منتشر شد. براساس این مقاله، معماری جدید «سازگاری بهبود یافته بین خروجی متن و گفتار» را ارائه می‌دهد.

قابلیت‌های این مدل‌ها می‌تواند تجربه‌های ارتباطی جدید مبتنی بر صدا، از مکالمات چندزبانه بی‌درنگ با استفاده از عینک‌های هوشمند گرفته تا فیلم‌ها و پادکست‌های دوبله خودکار را فراهم کند. محققان در اظهارات خود بیان‌ کردند که این هوش مصنوعی جدید می‌تواند به از بین بردن موانع زبانی برای مهاجران و دیگرانی که با ارتباطات مشکل دارند نیز کمک کند.

با این حال، محققان اذعان کردند که این فناوری علی‌رغم تمام ویژگی‌های مثبتی که دارد می‌تواند برای کلاهبرداری‌های فیشینگ صوتی، تقلبی عمیق و سایر برنامه‌های مضر نیز مورد استفاده قرار گیرد. برای ارتقای ایمنی و استفاده مسئولانه از مدل‌ها، آن‌ها اقدامات متعددی از جمله واترمارک صوتی و تکنیک‌های جدید را برای کاهش مواردی از چنین دست اجرا کردند.

با در دسترس قرار دادن این پیشرفته ترین مدل‌های پردازش زبان طبیعی، شرکت متا امیدوار است که محققان و توسعه‌دهندگان همکار را قادر سازد تا این کار را برای کمک به ایجاد ارتباط بین زبان‌ها و فرهنگ‌ها مختلف توسعه و گسترش دهند. این نسخه بر رهبری متا در زمینه هوش مصنوعی متن آزاد تأکید کرده و منبع جدید ارزشمندی را برای جامعه تحقیقاتی فراهم می‌کند. با ما همراه باشید در صورت انتشار اخبار جدید در رابطه با این موضوع بلافاصله آن را با شما به اشتراک خواهیم گذاشت. همچنین شما نیز می‌توانید نظرات و پیش‌بینی‌های خود را درباره هوش مصنوعی Seamless شرکت متا با ما در میان بگذارید.