هوش مصنوعی MGIE اپل

هوش مصنوعی MGIE اپل برای ویرایش عکس منتشر شد

در جدیدترین اخبار منتشر شده در صنعت گیم مطلع شدیم که شرکت اپل هوش مصنوعی MGIE را برای ویرایش عکس به صورت رسمی منتشر کرد.

براساس گزارشات جدید متنشر شده توسط رسانه The Verge مطلع شدیم که محققان اپل مدل جدیدی از هوش مصنوعی را منتشر کردند که به کاربران امکان می‌دهد بدون دست زدن به نرم‌افزار ویرایش عکس، آنچه را که می‌خواهند در عکس تغییر دهند، به سادگی اعمال کنند.

همانطور که به صورت رسم اعلام شد، مدل هوش مصنوعی MGIE که اپل با دانشگاه کالیفرنیا، سانتا باربارا روی آن کار کرده است، می‌تواند از طریق پیام‌های متنی، تصاویر را برش داده، اندازه آن را تغییر دهد، ورق بزند و به آن فیلتر اضافه کند.

MGIE که مخفف MLLM-Guided Image Editing است، می‌تواند برای کارهای ساده و پیچیده‌تر ویرایش تصویر مانند تغییر اشیاء خاص در یک عکس برای ایجاد شکل متفاوت یا روشن‌تر کردن آنها اعمال شود. این مدل دو کاربرد متفاوت از مدل‌های زبان چندوجهی را با هم ترکیب می‌کند. ابتدا یاد می‌گیرد که چگونه درخواست‌های کاربر را تفسیر کند و سپس «تصور می‌کند» که ویرایش چگونه به نظر می‌رسد (برای مثال، درخواست آسمان آبی‌تر در یک عکس، روشنایی بخش آسمان یک تصویر را افزایش می‌دهد). در نهایت تغییرات را اعمال کرده و عکس مورد نظر را به شما تحویل می‌دهد.

هنگام ویرایش یک عکس با MGIE، کاربران فقط باید آنچه را که می خواهند در مورد عکس تغییر دهند تایپ کنند. مقاله از مثال ویرایش تصویر یک پیتزا پپرونی استفاده کرد. در این نمونه تایپ کرده که «آن را سالم‌تر کنید» که باعث اضافه کردن سبزیجات به آن توسط هوش مصنوعی شده است. همچنین عکسی از چند ببر در این مقاله نیز وجود دارد که بسیار تاریک است و محققان با ثبت دستور «اضافه‌کردن کنتراست بیشتر برای شبیه‌سازی نور»، تصویر روشن‌تری ایجاد کردند. در تصویر زیر می‌توانید این مثال‌ها را مشاهده کنید.

هوش مصنوعی MGIE اپل

محققان در مقاله خود می‌گویند:

هوش مصنوعی MGIE به جای راهنمایی مختصر اما مبهم، آگاهی بصری خاصی را به دست آورده که نتیجه آن به ویرایش معقول تصویر منجر می‌شود. ما مطالعات گسترده‌ای را از جنبه‌های مختلف ویرایش انجام می‌دهیم و نشان می‌دهیم که MGIE ما به‌طور موثر عملکرد خود را در عین حفظ کارایی رقابتی بهبود می‌بخشد. ما همچنین معتقدیم که چارچوب ‌هدایت شده توسط MLLM، در آینده می‌تواند به تحقیقات حوزه بینایی و زبان کمک کند.

اپل MGIE را از طریق GitHub برای دانلود در دسترس قرار داده و همچنین نسخه آزمایشی تحت وب آن را در Hugging Face Spaces منتشر کرده است. اپل هنوز برنامه‌های خود در زمینه هوش مصنوعی را اعلام نکرده است و مشخص نیست که چه برنامه‌ای برای این مدل دارد.

برخی از پلتفرم‌های تولید تصویر، مانند OpenAI’s DALL-E 3، می‌توانند وظایف ساده ویرایش عکس را روی تصاویری که از طریق ورودی‌های متن ایجاد می‌کنند، انجام دهند. ادوبی خالق فتوشاپ که اکثر افراد برای ویرایش تصویر به آن مراجعه می کنند، مدل ویرایش هوش مصنوعی خود را نیز دارد. مدل هوش مصنوعی Firefly آن، پر مولد را تقویت می‌کند که پس‌زمینه‌های تولید شده را به عکس‌ها اضافه می‌کند.

اپل برخلاف مایکروسافت، متا یا گوگل بازیگر بزرگی در حوزه هوش مصنوعی مولد نبوده است، اما تیم کوک، مدیر عامل اپل گفته است که این شرکت می خواهد ویژگی های هوش مصنوعی بیشتری را در سال جاری به دستگاه های خود اضافه کند.

در ماه دسامبر، محققان اپل یک چارچوب ماشین لرنینگ منبع باز به نام MLX منتشر کردند تا آموزش مدل‌های هوش مصنوعی بر روی تراشه‌های سیلیکون اپل را آسان‌تر کند. با ما همراه باشید در صورت انتشار اخبار جدید در رابطه با این موضوع بلافاصله آن را با شما به اشتراک خواهیم گذاشت. همچنین شما نیز می‌توانید نظرات خود را درباره هوش مصنوعی MGIE اپل با ما در میان بگذارید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا