Dades | |||||
---|---|---|---|---|---|
Tipus | programari de codi obert organització sense ànim de lucre | ||||
Camp de treball | intel·ligència artificial | ||||
Història | |||||
Creació | 25 gener 2023 | ||||
Activitat | |||||
Membre de | Open Source Initiative | ||||
Lloc web | eleuther.ai | ||||
EleutherAI és un grup de recerca d'intel·ligència artificial (IA) sense ànim de lucre. El grup, considerat una versió de codi obert d'OpenAI,[1] es va formar en un servidor de Discord el juliol de 2020 per organitzar una rèplica de GPT-3. Malgrat la manca de finançament formal o d'estructura organitzativa, ràpidament es va convertir en un jugador líder en la investigació de processament del llenguatge natural a gran escala, llançant el model similar a GPT-3 de codi obert més gran del món el 21 de març de 2021,[2] establint un nou model obert. -font els registres d'última generació el juny de 2021 [3] i el febrer de 2022.[4] El gener de 2023, EleutherAI es va incorporar formalment com a institut de recerca sense ànim de lucre.
EleutherAI va començar com a servidor de Discord el 7 de juliol de 2020 amb el nom provisional "LibreAI" abans de canviar de marca a "EleutherAI" més tard aquell mes.
El 30 de desembre de 2020, EleutherAI va llançar el Pile, un conjunt de dades seleccionat de text divers per entrenar grans models lingüístics.[5] Tot i que el document feia referència a l'existència dels models GPT-Neo, els mateixos models no es van publicar fins al 21 de març de 2021. Segons una retrospectiva escrita uns mesos més tard, els autors no preveien que "la gent es preocuparia tant pels nostres "petits models"". El 9 de juny de 2021, EleutherAI va seguir amb GPT-J-6B, un model de llenguatge de sis mil milions de paràmetres que va tornar a ser el model semblant a GPT-3 de codi obert més gran del món.[6]
Després del llançament de DALL-E per OpenAI el gener de 2021, EleutherAI va començar a treballar en models de síntesi de text a imatge. Quan OpenAI no va llançar DALL-E públicament, Katherine Crowson d'EleutherAI i l'artista digital Ryan Murdock van desenvolupar una tècnica per utilitzar CLIP (un altre model desenvolupat per OpenAI) per convertir models habituals de generació d'imatges en síntesis de text a imatge.[7][8][9][10] A partir d'idees que es remunten a DeepDream de Google,[11] van trobar el seu primer gran èxit combinant CLIP amb un altre model disponible públicament anomenat VQGAN. Crowson va llançar la tecnologia fent tuitejar quaderns demostrant la tècnica que la gent podia executar gratuïtament sense cap equip especial.[12][13][14] Emad Mostaque, director general de Stability AI, atribueix aquest treball com a motivador de la fundació de Stability AI.[15]
Tot i que EleutherAI va rebutjar inicialment les ofertes de finançament, preferint utilitzar el programa TPU Research Cloud de Google per obtenir el seu càlcul,[16] a principis de 2021 havien acceptat finançament de CoreWeave (una petita empresa de computació en núvol) i SpellML (una empresa d'infraestructures de núvol) al forma d'accés a potents clústers de GPU que són necessaris per a la investigació d'aprenentatge automàtic a gran escala. El 10 de febrer de 2022 van llançar GPT-NeoX-20B, un model similar al seu treball anterior però que s'ha ampliat gràcies als recursos proporcionats per CoreWeave.[17] Aquest model va ser el tercer a tenir el títol de "model de llenguatge d'estil GPT-3 de codi obert més gran del món" i el primer a ser el model de llenguatge de codi obert més gran (de qualsevol tipus), superant un model entrenat per Meta AI que tenia el títol durant dos mesos. A partir del 6 de març de 2023, és el segon model de llenguatge de codi obert més gran del món.