[ad_1]
محققان اپل راه حلهای جدیدی برای آموزش مدلهای زبان بزرگ بر روی متن و عکس تشکیل کردهاند که در نهایت تبدیل گسترش سیستمهای هوش مصنوعی پرقدرت و انعطافپذیرتر میشود.
اپل در مقاله تحقیقاتی خود توضیح میدهد که ترکیب دقیق انواع مختلفی از دادههای آموزشی و معماریهای گوناگون، چطور میتواند علتعملکرد پیشرفته این سیستم در طیف وسیعی از معیارهای هوش مصنوعی شود.
محققان اپل توضیح خواهند داد:
«ما نشان دادهایم که برای پیشآموزش چندوجهی در مقیاس بزرگ، منفعت گیری از ترکیبی دقیق از عکس-کپشن، متن-عکس مداخلهای و دادههای فقط متنی برای دستیابی به نتایج پیشرفته زیاد مهم است.»
با آموزش مدلها بر پایه مجموعه دادههای متنی که اطلاعات بصری و زبانی را شامل خواهد شد، این مدلهای اپل موسوم به MM1 توانستند در وظایفی همانند نوشتن شرح تصاویر، جوابگویی به سؤالات بصری و استنتاج زبان طبیعی برتری داشته باشند. محققان این چنین فهمید شدند که انتخاب رمزگذار عکس و وضوح تصاویر ورودی تأثیر بسیاری روی کارکرد مدلها دارد.
به حرف های آنها، بزرگترین مدل MM1 با ۳۰ میلیارد پارامتر، توانایی خیرهکنندهای در فهمیدن عرصه تصاویر از خود نشان داده است که با این شرایط، میتواند بر پایه تصاویر ورودی، استدلال چندمرحلهای داشته باشد.

تحقیقات روی مدلهای MM1 درحالی انجام میشود که اپل اندوختهگذاریهای خود در عرصه هوش مصنوعی را افزایش داده است تا بتواند با رقبایی همانند گوگل، مایکروسافت و آمازون که در ادغام قابلیتهای هوش مصنوعی در محصولات خود پیشی گرفتهاند، رقابت کند. مطابق گزارش تازه بلومبرگ، این شرکت تصمیم دارد سالانه یک میلیارد دلار برای گسترش هوش مصنوعی هزینه کند.
مطابق گزارشهای قبلی، اپل روی یک فریمورک مدل زبان بزرگ بهنام «Ajax» و این چنین یک چتبات با نام داخلی «Apple GPT» کار میکند. مقصد کوپرتینوییها این است که فناوریهای هوش مصنوعی خود را در مواردی همانند سیری، اپل موزیک و دیگر برنامهها و سرویسهای خود ادغام کنند.
[ad_2]
منبع