توسعهدهنده(ها) | EleutherAI |
---|---|
انتشار اولیه | ۹ ژوئن ۲۰۲۱ |
نوع | |
مجوز | متنباز |
جیپیتی-جی (به انگلیسی: GPT-J) یک مدل زبانی بزرگ هوش مصنوعی متنباز است که توسط شرکت EleutherAI توسعه یافتهاست.[۱] بهطور کلی این مدل از معماری جیپیتی ۲ پیروی میکند و تنها تفاوت عمده آن در به رمزگشاهای موازی است: بهجای قرار دادن پرسپترون چندلایه پیشخور، بهمنظور دستیابی به توان عملیاتی بالاتر با آموزش توزیعشده، بهطور موازی محاسبه میشوند.[۲]
جیپیتی-جی عملکرد بسیار مشابهی با نسخههای جیپیتی ۳ شرکت اوپنایآی با اندازه مشابه در کارهای مختلف بدون جریان پایین دارد و حتی میتواند در وظایف تولید کد بهتر عمل کند.[۳] جدیدترین نسخه، جیپیتی-جی-۶بی (به انگلیسی: GPT-J-6B) یک مدل زبان مبتنی بر مجموعه دادهای تحت نام The Pile است.[۴] نسخه The Pile یک مجموعه داده ۸۸۶ گیگابایتی منبع باز است که به ۲۲ مجموعه داده کوچکتر تقسیم شدهاست.[۵]
جیپیتی-جی برخلاف چتجیپیتی به عنوان یک ربات چت عمل نمیکند و فقط به عنوان یک پیشبینی متن عمل میکند.[۶]