GPT-3

Generative Pre-trained Transformer 3 (GPT-3) là một mô hình ngôn ngữ lớn được phát hành bởi OpenAI vào năm 2020. Giống như phiên bản tiền nhiệm của nó, GPT-2, đây là một mô hình transformer chỉ chứa bộ giải mã của mạng nơ-ron sâu, nó vượt trội hơn các kiến trúc dựa trên hồi quytích chập bằng kỹ thuật được gọi là ("cơ chế chú ý" hay "attention").[1] Cơ chế chú ý này cho phép mô hình tập trung lựa chọn vào các phân đoạn văn bản đầu vào mà nó dự đoán là liên quan nhất.[2] Nó sử dụng ngữ cảnh dài 2048-token, độ chính xác float16 (16-bit) và 175 tỷ tham số chưa từng có trước đó, yêu cầu 350GB dung lượng lưu trữ vì mỗi tham số chiếm 2 byte không gian, và đã thể hiện khả năng học "zero-shot" và "few-shot" tốt trên nhiều nhiệm vụ.[3]

Vào ngày 22 tháng 9 năm 2020, Microsoft thông báo rằng họ đã đạt được giấy phép độc quyền GPT-3. Người dùng khác vẫn có thể nhận đầu ra từ API công cộng của nó, nhưng chỉ Microsoft mới có quyền truy cập vào mô hình cơ bản.[4]

Tham khảo[sửa | sửa mã nguồn]

  1. ^ Vaswani, Ashish; Shazeer, Noam; Parmar, Niki; Uszkoreit, Jakob; Jones, Llion; Gomez, Aidan N; Kaiser, Łukasz; Polosukhin, Illia (2017). “Attention is All you Need” (PDF). Advances in Neural Information Processing Systems. Curran Associates, Inc. 30.
  2. ^ Bahdanau, Dzmitry; Cho, Kyunghyun; Bengio, Yoshua (1 September 2014). "Neural Machine Translation by Jointly Learning to Align and Translate". arΧiv:1409.0473 [cs.CL]. 
  3. ^ Radford, Alec; Narasimhan, Karthik; Salimans, Tim; Sutskever, Ilya (11 tháng 6 năm 2018). “Improving Language Understanding by Generative Pre-Training” (PDF). tr. 12. Lưu trữ (PDF) bản gốc ngày 26 tháng 1 năm 2021. Truy cập ngày 31 tháng 7 năm 2020.
  4. ^ Hao, Karen (23 tháng 9 năm 2020). “OpenAI is giving Microsoft exclusive access to its GPT-3 language model”. MIT Technology Review (bằng tiếng Anh). Lưu trữ bản gốc ngày 5 tháng 2 năm 2021. Truy cập ngày 25 tháng 9 năm 2020. Các công ty cho biết OpenAI sẽ tiếp tục cung cấp API hướng đến công chúng của mình, cho phép người dùng được chọn gửi văn bản đến GPT-3 hoặc các mô hình khác của OpenAI và nhận đầu ra của nó. Tuy nhiên, chỉ Microsoft mới có quyền truy cập vào mã nguồn cơ bản của GPT-3, cho phép họ nhúng, tái sử dụng và sửa đổi mô hình theo ý muốn.
Chúng tôi bán
Bài viết liên quan
5 Công cụ để tăng khả năng tập trung của bạn
5 Công cụ để tăng khả năng tập trung của bạn
Đây là bản dịch của bài viết "5 Tools to Improve Your Focus" của tác giả Sullivan Young trên blog Medium
Lý do không ai có thể đoán được thị trường
Lý do không ai có thể đoán được thị trường
Thực tế có nhiều ý kiến trái chiều về chủ đề này, cũng vì thế mà sinh ra các trường phái đầu tư khác nhau
Hướng dẫn cày Genshin Impact tối ưu và hiệu quả nhất
Hướng dẫn cày Genshin Impact tối ưu và hiệu quả nhất
Daily Route hay còn gọi là hành trình bạn phải đi hằng ngày. Nó rất thú vị ở những ngày đầu và rất rất nhàm chán về sau.
Chờ ngày lời hứa nở hoa (Zhongli x Guizhong / Guili)
Chờ ngày lời hứa nở hoa (Zhongli x Guizhong / Guili)
Nàng có nhớ không, nhữnglời ta đã nói với nàng vào thời khắc biệt ly? Ta là thần của khế ước. Nhưng đây không phải một khế ước giữa ta và nàng, mà là một lời hứa