مدل هوش مصنوعی آمازون اکنون می‌تواند ویدیوهای چند دقیقه‌ای تولید کند

آمازون مدل هوش مصنوعی تولید ویدیوی خود، Nova Reel، را ارتقا داده و اکنون مدل هوش مصنوعی آمازون اکنون می‌تواند ویدیوهای چند دقیقه‌ای تولید کند. Nova Reel که در دسامبر ۲۰۲۴ معرفی شد، اولین ورود آمازون به عرصه تولید ویدیویی با هوش مصنوعی به شمار می‌رود. این مدل در بازاری که به سرعت در حال شلوغ شدن است، با مدل‌هایی از OpenAI، گوگل و دیگران رقابت می‌کند.

الیزابت فوئنتس، یکی از توسعه‌دهندگان AWS، در یک پست وبلاگی توضیح داد که آخرین نسخه Nova Reel، یعنی Nova Reel 1.1، می‌تواند ویدیوهای “چند-شاتی” با “سبک ثابت” در سراسر شات‌ها تولید کند. کاربران می‌توانند با ارائه یک دستور متنی تا ۴۰۰۰ کاراکتر، ویدیویی تا دو دقیقه شامل شات‌های شش ثانیه‌ای تولید کنند. مدل هوش مصنوعی آمازون اکنون می‌تواند ویدیوهای چند دقیقه‌ای تولید کند.

به گزارش تک‌کرانچ Nova Reel 1.1 همچنین یک حالت جدید به نام “Multishot Manual” را معرفی می‌کند. در این حالت، مدل می‌تواند علاوه بر دستور متنی، به یک تصویر نیز ارجاع دهد تا کنترل بیشتری بر ترکیب‌بندی شات‌های ویدیو ارائه شود. به گفته فوئنتس، با ارائه یک تصویر با رزولوشن 1280 در 720 پیکسل و یک دستور متنی با حداکثر ۵۱۲ کاراکتر، حالت Multishot Manual می‌تواند ویدیوهایی شامل حداکثر ۲۰ شات تولید کند.

لازم به ذکر است که Nova Reel تنها از طریق پلتفرم‌ها و خدمات AWS، از جمله Bedrock (مجموعه ابزارهای توسعه هوش مصنوعی آمازون) در دسترس است و مشتریان برای استفاده از آن باید درخواست دسترسی دهند. مانند بسیاری از سیستم‌های هوش مصنوعی مولد، سوالاتی در مورد اینکه آیا Reel با استفاده از روش‌های اخلاقی توسعه یافته است یا خیر، وجود دارد.

مدل‌های تولید ویدیو با استفاده از تعداد بسیار زیادی از نمونه‌های ویدیویی آموزش داده می‌شوند تا الگوهای موجود در این ویدیوها را “یاد بگیرند” و بتوانند کلیپ‌های جدید تولید کنند. برخی از شرکت‌ها مدل‌های خود را با استفاده از ویدیوهای دارای حق چاپ و بدون کسب اجازه از صاحبان یا سازندگان آنها آموزش می‌دهند و زمانی که این مدل‌ها تصاویر دارای حق چاپ را بازتولید می‌کنند، کاربران این مدل‌ها را در معرض شکایت‌های مربوط به مالکیت معنوی قرار می‌دهند.

آمازون منبع داده‌های آموزشی Reel را فاش نکرده و همچنین راهی صریح برای سازندگانی که احتمالاً ویدیوهای خود را در مجموعه داده‌های این مدل قرار می‌دهند، برای انصراف از این کار ارائه نکرده است. با این حال، این شرکت اعلام کرده است که مطابق با سیاست جبران خسارت خود، از هر مشتری AWS که به نقض حق چاپ با رسانه‌های تولید شده توسط مدل‌های آن متهم شود، محافظت خواهد کرد.

قابلیت تولید ویدیوهای طولانی‌تر توسط Nova Reel 1.1 یک گام مهم در عرصه هوش مصنوعی مولد به شمار می‌رود. پیش از این، بسیاری از مدل‌های تولید ویدیو، از جمله نسخه اولیه Nova Reel، محدود به تولید کلیپ‌های بسیار کوتاه بودند. افزایش طول ویدیوهای تولید شده، کاربردهای جدید و گسترده‌تری را برای این فناوری باز می‌کند. به عنوان مثال، می‌توان از آن برای تولید پیش‌نمایش‌های طولانی‌تر برای فیلم‌ها و سریال‌ها، محتوای آموزشی مفصل‌تر، و حتی قطعات تبلیغاتی با جزئیات بیشتر استفاده کرد. مدل هوش مصنوعی آمازون اکنون می‌تواند ویدیوهای چند دقیقه‌ای تولید کند.

در حالی که شرکت‌هایی مانند OpenAI با مدل Sora و گوگل با Lumiere در حال پیشرفت‌های چشمگیری در زمینه تولید ویدیوی واقع‌گرایانه با هوش مصنوعی هستند، رویکرد آمازون با تمرکز بر ارائه این فناوری از طریق پلتفرم ابری AWS، می‌تواند آن را به ابزاری قدرتمند برای کسب‌وکارها و توسعه‌دهندگان تبدیل کند. دسترسی محدود فعلی به این مدل نشان می‌دهد که آمازون احتمالاً در حال ارزیابی دقیق بازخوردها و اطمینان از عملکرد پایدار و ایمن آن قبل از عرضه گسترده‌تر است.

نگرانی‌های مربوط به اخلاق استفاده از داده‌های آموزشی و مسائل مربوط به حق چاپ همچنان از چالش‌های اصلی در حوزه هوش مصنوعی مولد به شمار می‌روند. موضع آمازون در قبال محافظت از مشتریان خود در برابر ادعاهای نقض حق چاپ، می‌تواند تا حدودی این نگرانی‌ها را کاهش دهد، اما شفافیت بیشتر در مورد منابع داده‌های آموزشی و نحوه مدیریت حقوق صاحبان محتوا همچنان ضروری به نظر می‌رسد.