Stable Diffusion

Stable Diffusion
Thiết kế bởiRunway, CompVis, và Stability AI
Phát triển bởiStability AI
Phát hành lần đầungày 22 tháng 8 năm 2022
Phiên bản ổn định
SD 3.5 (mô hình)[1] / ngày 22 tháng 10 năm 2024
Kho mã nguồngithub.com/Stability-AI/stablediffusion
Viết bằngPython[2]
Hệ điều hànhMọi hệ điều hành hỗ trợ nhân CUDA
Thể loạiMô hình chuyển văn bản thành hình ảnh
Giấy phépStability AI Community License
Websitestability.ai/stable-image

Stable Diffusion là một mô hình học sâu (deep learning), chuyển văn bản thành hình ảnh (text-to-image) được phát hành vào năm 2022. Nó được sử dụng chủ yếu để tạo ra các hình ảnh chi tiết dựa trên mô tả văn bản, tuy nhiên cũng có thể áp dụng cho các nhiệm vụ khác như inpainting, outpainting và tạo ra các phiên dịch hình ảnh-hình ảnh dựa trên một đề xuất văn bản (text-prompt)[3]. Nó được phát triển bởi các nhà nghiên cứu từ Nhóm CompVis tại Đại học Ludwig Maximilian ở Munich và Runway với sự đóng góp tính toán từ Stability AI và dữ liệu huấn luyện từ các tổ chức phi lợi nhuận[4][5][6][7]

Stable Diffusion là một mô hình lan truyền tiềm ẩn (latent diffusion model), một loại mạng nơ-ron nhân tạo sinh sâu (generative artificial neural network). Mã nguồn và model của nó đã được công khai phát hành dưới giấy phép CreativeML Open RAIL-M, và nó có thể hoạt động trên hầu hết các thiết bị máy tính thông thường được trang bị GPU tầm trung với ít nhất 8 GB VRAM. Điều này đánh dấu một sự khác biệt so với các mô hình chuyển văn bản thành hình ảnh độc quyền trước đây như DALL-E và Midjourney, chỉ có thể truy cập thông qua dịch vụ đám mây.

Tham khảo

[sửa | sửa mã nguồn]
  1. ^ "Stable Diffusion 3.5". Stability AI. Lưu trữ bản gốc ngày 23 tháng 10 năm 2024. Truy cập ngày 23 tháng 10 năm 2024.
  2. ^ Ryan O'Connor (ngày 23 tháng 8 năm 2022). "How to Run Stable Diffusion Locally to Generate Images". Truy cập ngày 4 tháng 5 năm 2023.
  3. ^ "Diffuse The Rest - a Hugging Face Space by huggingface-projects". huggingface.co. Truy cập ngày 12 tháng 7 năm 2023.
  4. ^ "Leaked deck raises questions over Stability AI's Series A pitch to investors". {{Chú thích web}}: |ngày lưu trữ= cần |url lưu trữ= (trợ giúp)
  5. ^ "Revolutionizing image generation by AI: Turning text into images". www.lmu.de (bằng tiếng Anh). Truy cập ngày 12 tháng 7 năm 2023.
  6. ^ "Stable Diffusion came from the Machine Vision & Learning research group (CompVis)". Twitter. Truy cập ngày 12 tháng 7 năm 2023.
  7. ^ "Stable Diffusion launch announcement". Stability AI (bằng tiếng Anh). Truy cập ngày 12 tháng 7 năm 2023.
Chúng tôi bán
Bài viết liên quan
Red Loong lại đeo một đống lò lửa trên lưng - Black Myth: Wukong
Red Loong lại đeo một đống lò lửa trên lưng - Black Myth: Wukong
Trong phần lore của Xích Nhiêm Long (Red Loong), có kể rất chi tiết về số phận vừa bi vừa hài và đầy tính châm biếm của chú Rồng này.
Focalors đã thay đổi vận mệnh của Fontaine như thế nào?
Focalors đã thay đổi vận mệnh của Fontaine như thế nào?
Focalor là tinh linh nước trong đầu tiên được thủy thần tiền nhiệm biến thành người, trải qua sự trừng phạt của thiên lý
Nhân vật Suzune Horikita - Classroom of the Elite
Nhân vật Suzune Horikita - Classroom of the Elite
Nếu mình không thể làm gì, thì cứ đà này mình sẽ kéo cả lớp D liên lụy mất... Những kẻ mà mình xem là không cùng đẳng cấp và vô giá trị... Đến khi có chuyện thì mình không chỉ vô dụng mà lại còn dùng bạo lực ra giải quyết. Thật là ngớ ngẩn...
Triết học thực hành: Những cuốn sách triết học bạn có thể thực sự ứng dụng trong cuộc sống
Triết học thực hành: Những cuốn sách triết học bạn có thể thực sự ứng dụng trong cuộc sống
Suy Tưởng có lẽ là cuốn sách “độc nhất vô nhị” từng được thực hiện: nó bản chất là cuốn nhật ký viết về những suy nghĩ riêng tư của Marcus Aurelius