براساس گزارشات جدید منتشر شده مطلع شدیم که 3D-GPT به عنوان هوش مصنوعی مولدی که میتواند جهانهای سهبعدی بسازد معرفی شد.
براساس گزارش منتشر شده توسط رسانه venturebeat، مطلع شدیم که محققان دانشگاه ملی استرالیا، دانشگاه آکسفورد و آکادمی هوش مصنوعی پکن یک سیستم هوش مصنوعی جدید به نام «3D-GPT» توسعه دادهاند که میتواند مدلهای سه بعدی را به سادگی از توضیحات متنی ایجاد کند. این هوش مصنوعی قادر است با تجزیهکردن پرامپت کاربر و با استفاده از سه عامل خود، مدلهای سهبعدی دقیقی بسازد. هوش مصنوعی 3D-GPT میتواند صنایع مختلف تولید محتواهای سه بعدی را متحول کند.
براساس مقاله منتشرشده در arXiv، این هوش مصنوعی در مقایسه با عملکردهای سنتی، مدلهای سهبعدی را به صورت کارآمدتری میسازد. هوش مصنوعی 3D-GPT فرایند مدلسازی سهبعدی را به بخشهای قابل دسترس تقسیم میکند؛ هر بخش نیز بهوسیله یک عامل انجام میگردد. بدین ترتیب پرامپت کاربر طی سه مرحله تجزیه و تحلیل و در نهایت کد دستوری مدل سهبعدی تولید میشود. محققان در رابطه با این موضوع اظهار داشتند:
این هوش مصنوعی LLMها [مدلهای زبان بزرگ] را به عنوان حلکنندههای ماهر مسایل قرار میدهد، وظایف مدلسازی سهبعدی رویهای را به بخشهای قابل دسترس تقسیم کرده و عامل مناسب را برای هر کار منصوب میکند. توضیحات مختصر صحنه را بهبود میبخشد، آنها را به فرمهای دقیق تبدیل میکند و در عین حال متن را به صورت پویا براساس دستورالعملهای بعدی تطبیق میدهد. تحقیقات تجربی ما تأیید میکند که 3D-GPT نه تنها دستورالعملها را تفسیر و اجرا کرده و نتایج قابل اعتمادی ارائه میدهد، بلکه به طور مؤثر با طراحان انسانی همکاری میکند.
هوش مصنوعی 3D-GPT برای مدلسازی سه عامل کلیدی دارد. «عامل ارسال تسک» که پرامپتهای متنی را تجزیه میکند. «عامل مفهومسازی» که جزئیات ذکرنشده را به توضیحات اولیه اضافه میکند و «عامل مدلسازی» که پارامترها را تنظیم و کد نهایی را تولید میکند. کد بهدستآمده را میتوان در نرمافزارهای سهبعدی مانند Blender به مدل سهبعدی تبدیل کرد.
هوش مصنوعی 3D-GPT با شکستن فرآیند مدلسازی و تخصیص عوامل تخصصی هوش مصنوعی، میتواند اعلانهای متنی را تفسیر کند، توضیحات را با جزئیات بیشتر بهبود بخشد و در نهایت داراییهای سه بعدی را تولید کند که مطابق با آنچه کاربر تصور میکرده است.
محققان هوش مصنوعی 3D-GPT را با پرامپت «یک صبح مهآلود بهاری، جایی که گلهای شبنمزده در علفزاری سرسبز با درختان پُرجوانه احاطه شده است» آزمایش کردند. 3D-GPT توانست صحنههای سهبعدی کاملی را با گرافیک واقعی ایجاد کند که عناصر توصیفشده در متن را به دقت انعکاس میدهد.
در حالی که کیفیت گرافیک هنوز واقعی نیست، نتایج اولیه آزمایشات روی این هوش مصنوعی نشان میدهد که این رویکرد مبتنی بر عامل نویدبخش سادهسازی محتوای سهبعدی است. معماری مدولار همچنین می تواند به هر جزء عامل اجازه دهد تا به طور مستقل بهبود یابد. با تولید کد برای کنترل نرم افزارهای سهبعدی موجود به جای ساختن مدلها از ابتدا، 3D-GPT با ادامه پیشرفت تکنیکهای مدلسازی، پایهای منعطف برای ساختن آن فراهم میکند.
محققان به این نتیجه رسیدند که سیستم و پتانسیل «مدلهای زبانی بزرگ» (LLM) در مدلسازی سهبعدی اهمیت برجستهای دارد و یک چارچوب اساسی برای پیشرفتهای آینده در تولید صحنه و انیمیشن ارائه میدهد.
این هوش مصنوعی میتواند صنعت مدلسازی سه بعدی را متحول، کارآمدتر و در دسترستر کند. همانطور که به سمت عصر متاورس پیش میرویم، ایجاد محتوای سهبعدی بهوسیله ابزارهایی مانند 3D-GPT برای سازندگان در طیف وسیعی از صنایع، از بازی و واقعیت مجازی تا سینما و بخشهای چندرسانهای، میتواند ارزشمند باشد. با ما همراه باشید در صورت انتشارا خبار جدید در رابطه با این موضوع بلافاصله آن را با شما به اشتراک خواهیم گذاشت. همچنین شما نیز میتوانید نظرات خود را درباره هوش مصنوعی 3D-GPT با ما در میان بگذارید.