در جدیدترین اخبار منتشر شده در صنعت تکنولوژی مطلع شدیم که شرکت متا هوش مصنوعی Seamless برای ترجمه آنی مکالمات بین زبانهای مختلف رونمایی کرد.
براساس گزارش منتشر شده توسط رسانه venturebeat مطلع شدیم که محققان هوش مصنوعی متا مجموعه جدیدی از مدلهای هوش مصنوعی به نام Seamless Communication را توسعه دادهاند که هدف آن برقراری ارتباط طبیعی و بهتر بین زبانهاست و اساساً مفهوم مترجم جهانی گفتار را به یک واقعیت تبدیل میکند.
همانطور که اعلام شد مدل هوش مصنوعی ترجمه متا که Seamless نام دارد، قابلیتهای سه مدل دیگر این شرکت – SeamlessExpressive ،SeamlessStreaming و SeamlessM4T v2 را در یک سیستم یکپارچه با یکدیگر ترکیب میکند. براساس مقاله تحقیقاتی متا، Seamless «اولین سیستم در دسترس عموم است که ارتباطات کلامی بینزبانی را در لحظه فراهم میکند.»
مترجم Seamless مرز جدیدی را در استفاده از هوش مصنوعی برای ارتباط در سراسر وبلاگ نشان میدهد. این سه مدل شبکه عصبی پیچیده را ترکیب میکند تا ترجمه بلادرنگ بین بیش از ۱۰۰ زبان گفتاری و نوشتاری را در عین حفظ سبک آوازی، احساسات و عروض صدای گوینده، امکانپذیر کند.
متا در SeamlessExpressive روی حفظ سبک آوا و تفاوتهای ظریف احساسی صدای گوینده در هنگام ترجمه تمرکز کرده است. در مقاله این شرکت آمده:
ترجمهها باید ظرافتهای بیان انسان را شامل شوند. در حالی که ابزارهای ترجمه موجود در ضبط محتوای یک مکالمه مهارت دارند، اما معمولاً برای خروجی خود به سیستمهای تبدیل متن به گفتار رباتیک و یکنواخت متکی هستند.
همچنین ادعا شده است که SeamlessStreaming ترجمه تقریباً همزمان با تنها دو ثانیه تأخیر را امکانپذیر میکند. محققان میگویند که این اولین مدل چندزبانهای است که با چنین سرعتی میتواند ترجمه نزدیک به ۱۰۰ زبان گفتاری و نوشتاری را فراهم کند. محققان متا درنهایت بهعنوان نتیجهگیری میگویند:
در مجموع، Seamless نگاهی محوری به اساس فنی موردنیاز برای تبدیل مترجم جهانی گفتار از یک مفهوم علمی-تخیلی به یک فناوری واقعی به ما ارائه میکند. بهطور کلی، تجربیات چندبُعدی که Seamless ممکن است ایجاد کند، میتواند منجر به تغییر فاز در نحوه انجام ارتباطات بینزبانی به کمک ماشین شود.
مدل سوم، SeamlessM4T v2، به عنوان پایهای برای دو مدل دیگر عمل میکند. این یک نسخه ارتقا یافته از مدل اصلی SeamlessM4T است که سال گذشته منتشر شد. براساس این مقاله، معماری جدید «سازگاری بهبود یافته بین خروجی متن و گفتار» را ارائه میدهد.
قابلیتهای این مدلها میتواند تجربههای ارتباطی جدید مبتنی بر صدا، از مکالمات چندزبانه بیدرنگ با استفاده از عینکهای هوشمند گرفته تا فیلمها و پادکستهای دوبله خودکار را فراهم کند. محققان در اظهارات خود بیان کردند که این هوش مصنوعی جدید میتواند به از بین بردن موانع زبانی برای مهاجران و دیگرانی که با ارتباطات مشکل دارند نیز کمک کند.
با این حال، محققان اذعان کردند که این فناوری علیرغم تمام ویژگیهای مثبتی که دارد میتواند برای کلاهبرداریهای فیشینگ صوتی، تقلبی عمیق و سایر برنامههای مضر نیز مورد استفاده قرار گیرد. برای ارتقای ایمنی و استفاده مسئولانه از مدلها، آنها اقدامات متعددی از جمله واترمارک صوتی و تکنیکهای جدید را برای کاهش مواردی از چنین دست اجرا کردند.
با در دسترس قرار دادن این پیشرفته ترین مدلهای پردازش زبان طبیعی، شرکت متا امیدوار است که محققان و توسعهدهندگان همکار را قادر سازد تا این کار را برای کمک به ایجاد ارتباط بین زبانها و فرهنگها مختلف توسعه و گسترش دهند. این نسخه بر رهبری متا در زمینه هوش مصنوعی متن آزاد تأکید کرده و منبع جدید ارزشمندی را برای جامعه تحقیقاتی فراهم میکند. با ما همراه باشید در صورت انتشار اخبار جدید در رابطه با این موضوع بلافاصله آن را با شما به اشتراک خواهیم گذاشت. همچنین شما نیز میتوانید نظرات و پیشبینیهای خود را درباره هوش مصنوعی Seamless شرکت متا با ما در میان بگذارید.
یک دیدگاه
.