GPT-4o

GPT-4o
FejlesztőOpenAI
Kategória
  • generatív előtanított transzformátor
  • mesterségesintelligencia-modell
  • foundation model
Licenckereskedelmi licenc
A GPT-4o weboldala

A GPT-4o (GPT-4 omni) egy többnyelvű, multimodális GPT (Generative Pre-trained Transformer), az OpenAI ChatGPT sorozata ötödik tagja.[1][2]

A GPT-4o a GPT-4 továbbfejlesztett változata, bemutatása újabb minőségi ugrást hozott az MI történetében.

Név és bevezetés

[szerkesztés]

Az új generatív továbbfejlesztett modell nevének végén a GPT-4-es után az „o” az „omni” rövidítése, ami arra utal, hogy a modell elődjénél "magabiztosabb" a beszéd, a fordítás és a képalkotás területén egyaránt.

A GPT-4o a bemutatását követő hetekben iteratívan, fokozatosan került bevezetésre a vállalat fejlesztői és fogyasztói termékeiben. Bemutatásától kezdve a GPT-4o vette át a ChatGPT "meghajtását".[3]

Bemutató

[szerkesztés]

A GPT-4o 2024. május 13-án mutatkozott be a közönségnek.[3] Az OpenAI élőben közvetített, livestreamelt bemutatója során technológiai vezetője (CTO), Mira Murati mutatta be az új modellt.

Kiderült, hogy a modell több mint 50 nyelvet támogat, ami lefedi a beszélők több mint 97 százalékát. Murati úgy illusztrálta a modell többnyelvűségét, hogy olaszul beszélt a modellhez, amit az angolra fordított, majd viszont, angolról olaszra fordított a GPT-4o, s mindezt tette természetes, vonzó női hangon. (Kérésre, "csak a játék kedvéért" beszélt kicsit elváltoztatott gépi, "robothangon" is a bemutató során.)[4]

Az új modell bemutatóján a felhasználók kérdéseket tehettek fel a GPT-4o-nak, válasza közben akár meg is szakíthatták. A GPT-4o „valós idejű” reakciókészséget mutatott, a felhasználó hangjának árnyalataira is képes volt reagálni, arra válaszul „különböző érzelmi stílusú” hangokat generált (beleértve az éneklést is).

Rekorderedmények

[szerkesztés]

Az OpenAI API-jában[5] és a Microsoft Azure OpenAI[6] szolgáltatásában a GPT-4o kétszer olyan gyors volt, mint a GPT-4, miközben csak feleannyiba került annál, ugyanakkor magasabb sebességhatárokkal rendelkezett, mint a GPT-4 Turbo.[7] A továbbfejlesztett chatbot már a bemutató időpontjától térítésmentesen elérhető volt a ChatGPT díjmentes szintjén, valamint az OpenAI prémium ChatGPT Plus és ChatGPT Team csomagjai előfizetői számára, gyakorlatilag a GPT-4o minden felhasználó számára ingyenesen került a piacra.[8][9]

A GPT-4o bemutatásakor az addigi legmagasabb teljesítményt nyújtotta a multimodalitási-; tehát a hang-, a többnyelvűség és a képalkotás összehasonlítási teszteken. Ezeket az új rekordokat a hangalapú beszédfelismerés, a fordítás és a vizualitás terén állította be az új modell,[10] ezzel az OpenAI nagy lépést tett az oldottabb, kötetlenebb, felhasználóbarátabb imidzs megteremtése irányba.[3]A GPT-4o 88,7 pontos eredményt ért el az MMLU benchmarkingjában, szemben a GPT-4 86,5 pontjával.[11] A Kaliforniai Egyetem (Berkeley) által vezetett Large Model Systems Organization (LMSYS) Élő-pontrendszer alapú Arena Benchmarkban bemutatása idején a GPT-4o volt a vezető modell.[12]

Jegyzetek

[szerkesztés]
  1. Edwards, Benj: OpenAI’s GPT-4 exhibits “human-level performance” on professional benchmarks (amerikai angol nyelven). Ars Technica, 2023. március 14. (Hozzáférés: 2024. május 14.)
  2. Coëffé, Thomas: OpenAI dévoile GPT-4 : tout savoir sur le nouveau modèle d’IA multimodale (fr-FR nyelven). BDM, 2023. március 14. (Hozzáférés: 2024. május 14.)
  3. a b c Wiggers, Kyle: OpenAI debuts GPT-4o 'omni' model now powering ChatGPT (amerikai angol nyelven). TechCrunch, 2024. május 13. (Hozzáférés: 2024. május 14.)
  4. Introducing GPT-4o” (hu-HU nyelven). 
  5. Introducing GPT-4o: our fastest and most affordable flagship model - Get up and running with the OpenAI API https://platform.openai.com/docs/quickstart
  6. Azure OpenAI Service – Advanced Language Models | Microsoft Azure (amerikai angol nyelven). azure.microsoft.com. (Hozzáférés: 2024. május 14.)
  7. Wiggers, Kyle: OpenAI releases GPT-4, a multimodal AI that it claims is state-of-the-art (amerikai angol nyelven). TechCrunch, 2023. március 14. (Hozzáférés: 2024. május 14.)
  8. Mauran, Cecily: OpenAI announces GPT-4o, a multimodal voice assistant that's free for all ChatGPT users (angol nyelven). Mashable, 2024. május 13. (Hozzáférés: 2024. május 14.)
  9. https://help.openai.com/en/articles/7102672-how-can-i-access-gpt-4-gpt-4-turbo-and-gpt-4o
  10. Hello GPT-4o We’re announcing GPT-4o, our new flagship model that can reason across audio, vision, and text in real time. - OpenAI - May 13, 2024 https://openai.com/index/hello-gpt-4o/
  11. Fedus, William. "GPT-4o is our new state-of-the-art frontier model"https://twitter.com/LiamFedus/status/1790064963966370209
  12. William Fedus (@LiamFedus) on X”, X (formerly Twitter). [2024. december 1-i dátummal az eredetiből archiválva] (Hozzáférés: 2025. január 18.) (angol nyelvű) 

További információk

[szerkesztés]