در جدیدترین اخبار منتشر شده در صنعت تکنولوژی مطلع شدیم که اپل چند مدل هوش مصنوعی متنباز جدید را به عنوان رقیبی برای مدلهای کوچک گوگل و متا منتشر کرد.
براساس گزارش منتشر شده توسط رسانه Apple Insider مطلع شدیم که تیم تحقیقاتی Apple Intelligence دو مدل زبان کوچک اما با کارایی بالا را منتشر کرده است که برای آموزش ژنراتورهای هوش مصنوعی استفاده میشود. همچنین مدل هوش مصنوعی متنباز جدید به عنوان رقیبی برای مدلهای کوچک گوگل و متا به شمار میروند.
تیم ماشین لرنینگ در اپل در یک پروژه متنباز موسوم DataComp for Language Models (به اختصار DCLM) کار میکنند که شامل دو مدل اصلی است؛ یکی با ۷ میلیارد پارامتر و دیگری با ۱.۴ میلیارد پارامتر. هر دوی آنها در بنچمارکها عملکرد بسیار خوبی دارند، بهخصوص نمونه بزرگتر که بهتر از مدل Mistral-7B است و میتواند با سایر مدلهای متنباز پیشرو، مانند Llama 3 از متا و Gemma از گوگل رقابت کند.
مدلهای زبانی مانند این برای آموزش موتورهای هوش مصنوعی، مانند ChatGPT، با ارائه یک چارچوب استاندارد استفاده میشوند که شامل معماری، پارامترها و فیلتر کردن مجموعه دادهها برای ارائه دادههای با کیفیت بالاتر برای موتورهای هوش مصنوعی است.
محققان اپل این مدلهای جدید را مدلهای متنباز با بهترین عملکرد توصیف کردهاند. نکته مهم این است که در این پروژه، با انتشار کد آموزشی و مجموعه دادههای دیگر، مدلها بهصورت متنباز در Hugging Face در دسترس هستند. همچنین هر دو مدل در بنچمارکهای MMLU امتیاز خوبی کسب کردند تا در برابر مدلهای تجاری دیگر رقابت کنند.
به گفته محققان اپل، مدل بزرگتر در مقایسه با MAP-Neo (پیشرفتهترین مدل متنباز قبلی اپل)، بهبود 6.6 درصدی در بنچمارکها داشته است؛ درحالیکه تا ۴۰ درصد از محاسبات کمتری برای آموزش آن استفاده شده است. از سوی دیگر، درست مانند مدل بزرگتر DCLM-7B، نسخه کوچکتر ۱.۴B این مدل که روی ۲.۶ تریلیون توکن آموزش دیده است، عملکرد قابلتوجهی در تستهای MMLU ،Core و Extended دارد.
پل مدلهای خود را کاملاً متن باز کرده است و مجموعه دادهها، مدلهای وزن و کد آموزشی همگی برای سایر محققان در دسترس هستند. اردیبهشتماه نیز اپل از مدلهای متنباز OpenELM رونمایی کرد که در چهار مدل مختلف ۲۷۰ میلیون پارامتری، ۴۵۰ میلیون پارامتری، ۱.۱ میلیارد پارامتری و ۳ میلیارد پارامتری منتشر شد. به گفته اپل، این مدلها در وظایف مربوط به پردازش متن ،مانند نوشتن ایمیل، عملکرد خوبی دارند.
این شرکت با معرفی Apple Intelligence و Private Cloud Compute در کنفرانس WWDC خود در ژوئن، منتقدانی را که مدعی ضعف اپل در زمینه برنامههای کاربردی هوش مصنوعی در دستگاههایش بودند، ساکت کرد. مقالات تحقیقاتی تیم ماشین لرنینگ که قبل و بعد از آن رویداد منتشر شد، ثابت کرد که این شرکت در واقع یک رهبر صنعت هوش مصنوعی است.
مدلهایی که محققان اپل منتشر کردهاند، ظاهراً در هیچیک از محصولات آینده اپل به کار گرفته نمیشوند و بیشتر باید آنها را پروژههای تحقیقاتی متنباز در نظر گرفت. با ما همراه باشید در صورت انتشار اخبار جدید در رابطه با این موضوع بلافاصله آن را با شما به اشتراک خواهیم گذاشت. همچنین شما نیز میتوانید نظرات خود را درباره مدل هوش مصنوعی متنباز جدید اپل با ما در میان بگذارید.