GPT-4o | |
Fejlesztő | OpenAI |
Kategória |
|
Licenc | kereskedelmi licenc |
A GPT-4o weboldala |
A GPT-4o (GPT-4 omni) egy többnyelvű, multimodális GPT (Generative Pre-trained Transformer), az OpenAI ChatGPT sorozata ötödik tagja.[1][2]
A GPT-4o a GPT-4 továbbfejlesztett változata, bemutatása újabb minőségi ugrást hozott az MI történetében.
Az új generatív továbbfejlesztett modell nevének végén a GPT-4-es után az „o” az „omni” rövidítése, ami arra utal, hogy a modell elődjénél "magabiztosabb" a beszéd, a fordítás és a képalkotás területén egyaránt.
A GPT-4o a bemutatását követő hetekben iteratívan, fokozatosan került bevezetésre a vállalat fejlesztői és fogyasztói termékeiben. Bemutatásától kezdve a GPT-4o vette át a ChatGPT "meghajtását".[3]
A GPT-4o 2024. május 13-án mutatkozott be a közönségnek.[3] Az OpenAI élőben közvetített, livestreamelt bemutatója során technológiai vezetője (CTO), Mira Murati mutatta be az új modellt.
Kiderült, hogy a modell több mint 50 nyelvet támogat, ami lefedi a beszélők több mint 97 százalékát. Murati úgy illusztrálta a modell többnyelvűségét, hogy olaszul beszélt a modellhez, amit az angolra fordított, majd viszont, angolról olaszra fordított a GPT-4o, s mindezt tette természetes, vonzó női hangon. (Kérésre, "csak a játék kedvéért" beszélt kicsit elváltoztatott gépi, "robothangon" is a bemutató során.)[4]
Az új modell bemutatóján a felhasználók kérdéseket tehettek fel a GPT-4o-nak, válasza közben akár meg is szakíthatták. A GPT-4o „valós idejű” reakciókészséget mutatott, a felhasználó hangjának árnyalataira is képes volt reagálni, arra válaszul „különböző érzelmi stílusú” hangokat generált (beleértve az éneklést is).
Az OpenAI API-jában[5] és a Microsoft Azure OpenAI[6] szolgáltatásában a GPT-4o kétszer olyan gyors volt, mint a GPT-4, miközben csak feleannyiba került annál, ugyanakkor magasabb sebességhatárokkal rendelkezett, mint a GPT-4 Turbo.[7] A továbbfejlesztett chatbot már a bemutató időpontjától térítésmentesen elérhető volt a ChatGPT díjmentes szintjén, valamint az OpenAI prémium ChatGPT Plus és ChatGPT Team csomagjai előfizetői számára, gyakorlatilag a GPT-4o minden felhasználó számára ingyenesen került a piacra.[8][9]
A GPT-4o bemutatásakor az addigi legmagasabb teljesítményt nyújtotta a multimodalitási-; tehát a hang-, a többnyelvűség és a képalkotás összehasonlítási teszteken. Ezeket az új rekordokat a hangalapú beszédfelismerés, a fordítás és a vizualitás terén állította be az új modell,[10] ezzel az OpenAI nagy lépést tett az oldottabb, kötetlenebb, felhasználóbarátabb imidzs megteremtése irányba.[3]A GPT-4o 88,7 pontos eredményt ért el az MMLU benchmarkingjában, szemben a GPT-4 86,5 pontjával.[11] A Kaliforniai Egyetem (Berkeley) által vezetett Large Model Systems Organization (LMSYS) Élő-pontrendszer alapú Arena Benchmarkban bemutatása idején a GPT-4o volt a vezető modell.[12]