DeepSeek

Infotaula d'organitzacióDeepSeek
(mul) DeepSeek
(zh) 杭州深度求索人工智能基础技术研究有限公司
(zh) 深度求索 Modifica el valor a Wikidata
Dades
Tipusempresa emergent
empresa tecnològica
negoci Modifica el valor a Wikidata
Indústriatecnologia de la informació i intel·ligència artificial Modifica el valor a Wikidata
Forma jurídicaempresa privada Modifica el valor a Wikidata
Història
Creaciómaig 2023, Hangzhou Modifica el valor a Wikidata
FundadorLiang Wenfeng Modifica el valor a Wikidata
Governança corporativa
Seu
Entitat matriuHigh-Flyer Modifica el valor a Wikidata
Propietat deHigh-Flyer Modifica el valor a Wikidata
Propietari de
Indicador econòmic
FinançadorHigh-Flyer Modifica el valor a Wikidata

Lloc webdeepseek.com Modifica el valor a Wikidata

X: deepseek_ai GitHub: deepseek-ai Modifica el valor a Wikidata

DeepSeek (xinès: 深度求索; pinyin: Shēndù Qiúsuǒ) és una empresa xinesa d'intel·ligència artificial que desenvolupa models de llenguatge extens de codi obert. L'empresa és finançada exclusivament pel fons d'inversió lliure xinès High-Flyer. Tant DeepSeek com High-Flyer tenen la seva seu a Hangzhou (Zhejiang), Xina.

El gener de 2025, la companyia va guanyar l'atenció internacional amb el llançament del seu darrer model, DeepSeek R1, un competidor dels sistemes d'IA establerts com ara ChatGPT d'OpenAI.

Història

[modifica]

L'abril de 2023, High-Flyer, un fons amb seu a Hangzhou que utilitza un model d'intel·ligència artificial per a les transaccions financeres (high-frequency trading),[1] va anunciar a través del seu fundador Liang Wenfeng que llançaria una empresa independent especialitzada en intel·ligència artificial anomenada DeepSeek, per tal de desenvolupar i comercialitzar la intel·ligència artificial general mitjançant un model de llenguatge desenvolupat per la firma.[2]

El novembre de 2023, DeepSeek va llançar el seu primer model, anomenat DeepSeek Coder, especialitzat en la generació i comprensió de codis font.[3]

El 29 de novembre del mateix any, DeepSeek va anunciar el llançament del seu primer bot de conversa utilitzant un model de llenguatge extens anomenat DeepSeek LLM, que constava d'un total de 67.000 milions de paràmetres, gratuït i de codi obert.[4]

El 7 de maig de 2024, DeepSeek va llançar DeepSeek V2, que aquesta vegada contenia un total de 236.000 milions de paràmetres i podia activar fins a 21.000 milions de paràmetres per cada token utilitzat.[5] El mes següent, es va llançar la segona versió de DeepSeek Coder anomenada DeepSeek Coder V26.[6]

El desembre de 2024, DeepSeek va llançar DeepSeek V3, que substituïa la versió anterior i pretenia ser una alternativa a altres models de llenguatges disponibles en línia.[7][8]

El 20 de gener de 2025, la companyia va anunciar el llançament del seu primer model de raonament anomenat Deepseek R1, utilitzant una cadena de raonament desenvolupant passos lògics successius per a les consultes.[9][10][11]

Referències

[modifica]
  1. McMorrow, Ryan; Olcott, Eleanor «The Chinese quant fund-turned-AI pioneer». Financial Times, 09-06-2024 [Consulta: 22 gener 2025].
  2. «Deepseek: From Hedge Fund to Frontier Model Maker». [Consulta: 22 gener 2025].
  3. «Deepseek Coder open source AI coding assistant runs online and locally», 05-11-2023. [Consulta: 22 gener 2025].
  4. «Inside DeepSeek Models». [Consulta: 22 gener 2025].
  5. Deep-Seek AI. «DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model».
  6. «DeepSeek Coder V2, le nouveau modèle de référence pour le code», 20-06-2024. [Consulta: 22 gener 2025].
  7. «🚀 Introducing DeepSeek-V3 | DeepSeek API Docs». [Consulta: 22 gener 2025].
  8. «« Deepseek 3 », la réponse chinoise à Chat GPT relance la rivalité sino-américaine», 03-01-2025. [Consulta: 22 gener 2025].
  9. «DeepSeek-R1 - DeepSeek推出的高性能AI推理模型,性能对标OpenAI o1正式版», 21-01-2025. [Consulta: 22 gener 2025].
  10. «DeepSeek-R1 Release | DeepSeek API Docs». [Consulta: 22 gener 2025].
  11. «Intelligence artificielle : Deepseek V-3, la réponse chinoise à Chat-GPT ?». [Consulta: 22 gener 2025].