آمازون مدل هوش مصنوعی تولید ویدیوی خود، Nova Reel، را ارتقا داده و اکنون مدل هوش مصنوعی آمازون اکنون میتواند ویدیوهای چند دقیقهای تولید کند. Nova Reel که در دسامبر ۲۰۲۴ معرفی شد، اولین ورود آمازون به عرصه تولید ویدیویی با هوش مصنوعی به شمار میرود. این مدل در بازاری که به سرعت در حال شلوغ شدن است، با مدلهایی از OpenAI، گوگل و دیگران رقابت میکند.
الیزابت فوئنتس، یکی از توسعهدهندگان AWS، در یک پست وبلاگی توضیح داد که آخرین نسخه Nova Reel، یعنی Nova Reel 1.1، میتواند ویدیوهای “چند-شاتی” با “سبک ثابت” در سراسر شاتها تولید کند. کاربران میتوانند با ارائه یک دستور متنی تا ۴۰۰۰ کاراکتر، ویدیویی تا دو دقیقه شامل شاتهای شش ثانیهای تولید کنند. مدل هوش مصنوعی آمازون اکنون میتواند ویدیوهای چند دقیقهای تولید کند.
به گزارش تککرانچ Nova Reel 1.1 همچنین یک حالت جدید به نام “Multishot Manual” را معرفی میکند. در این حالت، مدل میتواند علاوه بر دستور متنی، به یک تصویر نیز ارجاع دهد تا کنترل بیشتری بر ترکیببندی شاتهای ویدیو ارائه شود. به گفته فوئنتس، با ارائه یک تصویر با رزولوشن 1280 در 720 پیکسل و یک دستور متنی با حداکثر ۵۱۲ کاراکتر، حالت Multishot Manual میتواند ویدیوهایی شامل حداکثر ۲۰ شات تولید کند.
لازم به ذکر است که Nova Reel تنها از طریق پلتفرمها و خدمات AWS، از جمله Bedrock (مجموعه ابزارهای توسعه هوش مصنوعی آمازون) در دسترس است و مشتریان برای استفاده از آن باید درخواست دسترسی دهند. مانند بسیاری از سیستمهای هوش مصنوعی مولد، سوالاتی در مورد اینکه آیا Reel با استفاده از روشهای اخلاقی توسعه یافته است یا خیر، وجود دارد.
مدلهای تولید ویدیو با استفاده از تعداد بسیار زیادی از نمونههای ویدیویی آموزش داده میشوند تا الگوهای موجود در این ویدیوها را “یاد بگیرند” و بتوانند کلیپهای جدید تولید کنند. برخی از شرکتها مدلهای خود را با استفاده از ویدیوهای دارای حق چاپ و بدون کسب اجازه از صاحبان یا سازندگان آنها آموزش میدهند و زمانی که این مدلها تصاویر دارای حق چاپ را بازتولید میکنند، کاربران این مدلها را در معرض شکایتهای مربوط به مالکیت معنوی قرار میدهند.
آمازون منبع دادههای آموزشی Reel را فاش نکرده و همچنین راهی صریح برای سازندگانی که احتمالاً ویدیوهای خود را در مجموعه دادههای این مدل قرار میدهند، برای انصراف از این کار ارائه نکرده است. با این حال، این شرکت اعلام کرده است که مطابق با سیاست جبران خسارت خود، از هر مشتری AWS که به نقض حق چاپ با رسانههای تولید شده توسط مدلهای آن متهم شود، محافظت خواهد کرد.
قابلیت تولید ویدیوهای طولانیتر توسط Nova Reel 1.1 یک گام مهم در عرصه هوش مصنوعی مولد به شمار میرود. پیش از این، بسیاری از مدلهای تولید ویدیو، از جمله نسخه اولیه Nova Reel، محدود به تولید کلیپهای بسیار کوتاه بودند. افزایش طول ویدیوهای تولید شده، کاربردهای جدید و گستردهتری را برای این فناوری باز میکند. به عنوان مثال، میتوان از آن برای تولید پیشنمایشهای طولانیتر برای فیلمها و سریالها، محتوای آموزشی مفصلتر، و حتی قطعات تبلیغاتی با جزئیات بیشتر استفاده کرد. مدل هوش مصنوعی آمازون اکنون میتواند ویدیوهای چند دقیقهای تولید کند.
در حالی که شرکتهایی مانند OpenAI با مدل Sora و گوگل با Lumiere در حال پیشرفتهای چشمگیری در زمینه تولید ویدیوی واقعگرایانه با هوش مصنوعی هستند، رویکرد آمازون با تمرکز بر ارائه این فناوری از طریق پلتفرم ابری AWS، میتواند آن را به ابزاری قدرتمند برای کسبوکارها و توسعهدهندگان تبدیل کند. دسترسی محدود فعلی به این مدل نشان میدهد که آمازون احتمالاً در حال ارزیابی دقیق بازخوردها و اطمینان از عملکرد پایدار و ایمن آن قبل از عرضه گستردهتر است.
نگرانیهای مربوط به اخلاق استفاده از دادههای آموزشی و مسائل مربوط به حق چاپ همچنان از چالشهای اصلی در حوزه هوش مصنوعی مولد به شمار میروند. موضع آمازون در قبال محافظت از مشتریان خود در برابر ادعاهای نقض حق چاپ، میتواند تا حدودی این نگرانیها را کاهش دهد، اما شفافیت بیشتر در مورد منابع دادههای آموزشی و نحوه مدیریت حقوق صاحبان محتوا همچنان ضروری به نظر میرسد.