در جدیدترین اخبار منتشر شده در صنعت گیم مطلع شدیم که شرکت اپل هوش مصنوعی MGIE را برای ویرایش عکس به صورت رسمی منتشر کرد.
براساس گزارشات جدید متنشر شده توسط رسانه The Verge مطلع شدیم که محققان اپل مدل جدیدی از هوش مصنوعی را منتشر کردند که به کاربران امکان میدهد بدون دست زدن به نرمافزار ویرایش عکس، آنچه را که میخواهند در عکس تغییر دهند، به سادگی اعمال کنند.
همانطور که به صورت رسم اعلام شد، مدل هوش مصنوعی MGIE که اپل با دانشگاه کالیفرنیا، سانتا باربارا روی آن کار کرده است، میتواند از طریق پیامهای متنی، تصاویر را برش داده، اندازه آن را تغییر دهد، ورق بزند و به آن فیلتر اضافه کند.
MGIE که مخفف MLLM-Guided Image Editing است، میتواند برای کارهای ساده و پیچیدهتر ویرایش تصویر مانند تغییر اشیاء خاص در یک عکس برای ایجاد شکل متفاوت یا روشنتر کردن آنها اعمال شود. این مدل دو کاربرد متفاوت از مدلهای زبان چندوجهی را با هم ترکیب میکند. ابتدا یاد میگیرد که چگونه درخواستهای کاربر را تفسیر کند و سپس «تصور میکند» که ویرایش چگونه به نظر میرسد (برای مثال، درخواست آسمان آبیتر در یک عکس، روشنایی بخش آسمان یک تصویر را افزایش میدهد). در نهایت تغییرات را اعمال کرده و عکس مورد نظر را به شما تحویل میدهد.
هنگام ویرایش یک عکس با MGIE، کاربران فقط باید آنچه را که می خواهند در مورد عکس تغییر دهند تایپ کنند. مقاله از مثال ویرایش تصویر یک پیتزا پپرونی استفاده کرد. در این نمونه تایپ کرده که «آن را سالمتر کنید» که باعث اضافه کردن سبزیجات به آن توسط هوش مصنوعی شده است. همچنین عکسی از چند ببر در این مقاله نیز وجود دارد که بسیار تاریک است و محققان با ثبت دستور «اضافهکردن کنتراست بیشتر برای شبیهسازی نور»، تصویر روشنتری ایجاد کردند. در تصویر زیر میتوانید این مثالها را مشاهده کنید.
محققان در مقاله خود میگویند:
هوش مصنوعی MGIE به جای راهنمایی مختصر اما مبهم، آگاهی بصری خاصی را به دست آورده که نتیجه آن به ویرایش معقول تصویر منجر میشود. ما مطالعات گستردهای را از جنبههای مختلف ویرایش انجام میدهیم و نشان میدهیم که MGIE ما بهطور موثر عملکرد خود را در عین حفظ کارایی رقابتی بهبود میبخشد. ما همچنین معتقدیم که چارچوب هدایت شده توسط MLLM، در آینده میتواند به تحقیقات حوزه بینایی و زبان کمک کند.
اپل MGIE را از طریق GitHub برای دانلود در دسترس قرار داده و همچنین نسخه آزمایشی تحت وب آن را در Hugging Face Spaces منتشر کرده است. اپل هنوز برنامههای خود در زمینه هوش مصنوعی را اعلام نکرده است و مشخص نیست که چه برنامهای برای این مدل دارد.
برخی از پلتفرمهای تولید تصویر، مانند OpenAI’s DALL-E 3، میتوانند وظایف ساده ویرایش عکس را روی تصاویری که از طریق ورودیهای متن ایجاد میکنند، انجام دهند. ادوبی خالق فتوشاپ که اکثر افراد برای ویرایش تصویر به آن مراجعه می کنند، مدل ویرایش هوش مصنوعی خود را نیز دارد. مدل هوش مصنوعی Firefly آن، پر مولد را تقویت میکند که پسزمینههای تولید شده را به عکسها اضافه میکند.
اپل برخلاف مایکروسافت، متا یا گوگل بازیگر بزرگی در حوزه هوش مصنوعی مولد نبوده است، اما تیم کوک، مدیر عامل اپل گفته است که این شرکت می خواهد ویژگی های هوش مصنوعی بیشتری را در سال جاری به دستگاه های خود اضافه کند.
در ماه دسامبر، محققان اپل یک چارچوب ماشین لرنینگ منبع باز به نام MLX منتشر کردند تا آموزش مدلهای هوش مصنوعی بر روی تراشههای سیلیکون اپل را آسانتر کند. با ما همراه باشید در صورت انتشار اخبار جدید در رابطه با این موضوع بلافاصله آن را با شما به اشتراک خواهیم گذاشت. همچنین شما نیز میتوانید نظرات خود را درباره هوش مصنوعی MGIE اپل با ما در میان بگذارید.