اپل چند مدل هوش مصنوعی متن‌باز جدید منتشر کرد

در جدیدترین اخبار منتشر شده در صنعت تکنولوژی مطلع شدیم که اپل چند مدل هوش مصنوعی متن‌باز جدید را به عنوان رقیبی برای مدل‌های کوچک گوگل و متا منتشر کرد.

براساس گزارش منتشر شده توسط رسانه Apple Insider مطلع شدیم که تیم تحقیقاتی Apple Intelligence دو مدل زبان کوچک اما با کارایی بالا را منتشر کرده است که برای آموزش ژنراتورهای هوش مصنوعی استفاده می‌شود. همچنین مدل هوش مصنوعی متن‌باز جدید به عنوان رقیبی برای مدل‌های کوچک گوگل و متا به شمار می‌روند.

تیم ماشین لرنینگ در اپل در یک پروژه متن‌باز موسوم DataComp for Language Models (به اختصار DCLM) کار می‌کنند که شامل دو مدل اصلی است؛ یکی با ۷ میلیارد پارامتر و دیگری با ۱.۴ میلیارد پارامتر. هر دوی آن‌ها در بنچمارک‌ها عملکرد بسیار خوبی دارند، به‌خصوص نمونه بزرگ‌تر که بهتر از مدل Mistral-7B است و می‌تواند با سایر مدل‌های متن‌باز پیشرو، مانند Llama 3 از متا و Gemma از گوگل رقابت کند.

مدل‌های زبانی مانند این برای آموزش موتورهای هوش مصنوعی، مانند ChatGPT، با ارائه یک چارچوب استاندارد استفاده می‌شوند که شامل معماری، پارامترها و فیلتر کردن مجموعه داده‌ها برای ارائه داده‌های با کیفیت بالاتر برای موتورهای هوش مصنوعی است.

محققان اپل این مدل‌های جدید را مدل‌های متن‌باز با بهترین عملکرد توصیف کرده‌اند. نکته‌ مهم این است که در این پروژه، با انتشار کد آموزشی و مجموعه داده‌های دیگر، مدل‌ها به‌صورت متن‌باز در Hugging Face در دسترس هستند. همچنین هر دو مدل در بنچمارک‌های MMLU امتیاز خوبی کسب کردند تا در برابر مدل‌های تجاری دیگر رقابت کنند.

به گفته محققان اپل، مدل بزرگ‌تر در مقایسه با MAP-Neo (پیشرفته‌ترین مدل متن‌باز قبلی اپل)، بهبود 6.6 درصدی در بنچمارک‌ها داشته است؛ درحالی‌که تا ۴۰ درصد از محاسبات کمتری برای آموزش آن استفاده شده است. از سوی دیگر، درست مانند مدل بزرگ‌تر DCLM-7B، نسخه کوچک‌تر ۱.۴B این مدل که روی ۲.۶ تریلیون توکن آموزش دیده است، عملکرد قابل‌توجهی در تست‌های MMLU ،Core و Extended دارد.

پل مدل‌های خود را کاملاً متن باز کرده است و مجموعه داده‌ها، مدل‌های وزن و کد آموزشی همگی برای سایر محققان در دسترس هستند. اردیبهشت‌ماه نیز اپل از مدل‌های متن‌باز OpenELM رونمایی کرد که در چهار مدل مختلف ۲۷۰ میلیون پارامتری، ۴۵۰ میلیون پارامتری، ۱.۱ میلیارد پارامتری و ۳ میلیارد پارامتری منتشر شد. به گفته اپل، این مدل‌ها در وظایف مربوط به پردازش متن ،مانند نوشتن ایمیل، عملکرد خوبی دارند.

این شرکت با معرفی Apple Intelligence و Private Cloud Compute در کنفرانس WWDC خود در ژوئن، منتقدانی را که مدعی ضعف اپل در زمینه برنامه‌های کاربردی هوش مصنوعی در دستگاه‌هایش بودند، ساکت کرد. مقالات تحقیقاتی تیم ماشین لرنینگ که قبل و بعد از آن رویداد منتشر شد، ثابت کرد که این شرکت در واقع یک رهبر صنعت هوش مصنوعی است.

مدل‌هایی که محققان اپل منتشر کرده‌اند، ظاهراً در هیچ‌یک از محصولات آینده اپل به‌ کار گرفته نمی‌شوند و بیشتر باید آن‌ها را پروژه‌های تحقیقاتی متن‌باز در نظر گرفت. با ما همراه باشید در صورت انتشار اخبار جدید در رابطه با این موضوع بلافاصله آن را با شما به اشتراک خواهیم گذاشت. همچنین شما نیز می‌توانید نظرات خود را درباره مدل هوش مصنوعی متن‌باز جدید اپل با ما در میان بگذارید.