Trang chủ Tin tức Bước đột phá AI của Deepseek: Chi phí được tiết lộ - 1,6 tỷ USD

Bước đột phá AI của Deepseek: Chi phí được tiết lộ - 1,6 tỷ USD

Feb 25,2025 Tác giả: Leo

Mô hình AI hiệu quả đáng ngạc nhiên của Deepseek thách thức những người khổng lồ trong ngành. Mặc dù ban đầu tuyên bố chỉ có chi phí đào tạo 6 triệu đô la cho mẫu Deepseek V3 mạnh mẽ của mình, một cái nhìn gần hơn cho thấy một khoản đầu tư đáng kể hơn nhiều.

Mô hình V3 của Deepseek tự hào có các công nghệ sáng tạo: Dự đoán đa điểm (MTP) , dự đoán đồng thời nhiều từ; Hỗn hợp các chuyên gia (MOE) , sử dụng 256 mạng lưới thần kinh để xử lý nâng cao; và sự chú ý tiềm ẩn đa đầu (MLA) , tập trung vào các yếu tố câu chính để cải thiện độ chính xác.

DeepSeek TestHình ảnh: Obligame.com

Tuy nhiên, việc bán phân tích đã phát hiện ra cơ sở hạ tầng đáng kể của Deepseek: khoảng 50.000 GPU phễu NVIDIA, bao gồm H800, H100 và H20, trải rộng trên nhiều trung tâm dữ liệu. Điều này thể hiện tổng đầu tư của máy chủ khoảng 1,6 tỷ đô la và chi phí hoạt động gần 944 triệu đô la.

DeepSeek V3Hình ảnh: Obligame.com

Deepseek, một công ty con của High Flyer, một quỹ phòng hộ của Trung Quốc, sở hữu các trung tâm dữ liệu của mình, thúc đẩy kiểm soát và đổi mới nhanh chóng. Bản chất tự tài trợ của nó góp phần vào sự nhanh nhẹn và ra quyết định nhanh chóng. Công ty thu hút tài năng hàng đầu, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm, chủ yếu từ các trường đại học Trung Quốc.

DeepSeekHình ảnh: Obligame.com

Con số 6 triệu đô la ban đầu chỉ bao gồm việc sử dụng GPU trước khi đào tạo, bỏ qua nghiên cứu, sàng lọc, xử lý dữ liệu và cơ sở hạ tầng. Đầu tư phát triển AI thực tế của Deepseek vượt qua 500 triệu đô la. Mặc dù vậy, cấu trúc nạc của nó cho phép đổi mới hiệu quả, không giống như các đối thủ cạnh tranh lớn hơn, quan liêu hơn.

DeepSeekHình ảnh: Obligame.com

Trong khi thành công của Deepseek bắt nguồn từ đầu tư đáng kể, những tiến bộ công nghệ và một nhóm lành nghề, thì câu chuyện "thân thiện với ngân sách" là sai lệch. Tuy nhiên, chi phí của nó vẫn thấp hơn đáng kể so với các đối thủ cạnh tranh; Ví dụ, mô hình R1 của Deepseek có giá 5 triệu đô la, so với 100 triệu đô la của TATGPT4. Ví dụ của Deepseek cho thấy một công ty AI độc lập được tài trợ tốt cạnh tranh thành công với các nhà lãnh đạo đã thành lập, mặc dù các khiếu nại chi phí ban đầu đòi hỏi phải giải thích cẩn thận.

Bài viết mới nhất

16

2025-07

SABREN SSD bao vây hiện giảm 40% trong bán flash

https://imgs.51tbt.com/uploads/99/681024d076595.webp

Có SSD dự phòng ngồi trong ngăn kéo thu thập bụi? Bây giờ là thời điểm hoàn hảo để mang đến cho nó cuộc sống mới, đặc biệt là với thỏa thuận nóng bỏng này từ Amazon. Trong một thời gian giới hạn, các thành viên của Amazon Prime có thể lấy Sabrent Rocket RGB USB Type-C SATA/NVME Solid State Drive (SSD) với giá chỉ $ 29,99, nhờ 10 đô la

Tác giả: LeoĐọc:1

16

2025-07

Hoàn thành Herc Thử thách Merc trong Bitlife: Hướng dẫn

https://imgs.51tbt.com/uploads/84/173915645167a96be38e40a.jpg

Đây là phiên bản SEO được tối ưu hóa và tinh tế của bài viết của bạn, giữ nguyên cấu trúc, trình giữ chỗ [TTPP] và cải thiện sự thân thiện với công cụ tìm kiếm và đọc cho Google: Thử thách này xoay quanh sức mạnh xây dựng tại phòng tập thể dục trong khi hoàn thành một loạt các vụ giết người tính toán. Nếu bạn

Tác giả: LeoĐọc:1

16

2025-07

"Cookierun Kingdom: Hướng dẫn Toppings cuối cùng được tiết lộ"

https://imgs.51tbt.com/uploads/47/682c7d1d78589.webp

Trong *Cookierun: Kingdom *, Toppings đóng vai trò là các mặt hàng tăng cường thống kê thiết yếu giúp tăng cường đáng kể hiệu quả chiến đấu của cookie của bạn. Giống như thiết bị RPG truyền thống, Toppings đóng vai trò nòng cốt trong việc xác định mức độ hoạt động của cookie của bạn trên tất cả các chế độ trò chơi

Tác giả: LeoĐọc:2

15

2025-07

Các chiến lược hàng đầu để tăng thứ hạng của bạn trong Standoff 2 nhanh chóng

https://imgs.51tbt.com/uploads/47/680fd07d506d9.webp

Trong thế giới nhịp độ nhanh của Standoff 2, leo lên hàng ngũ không chỉ là một mục tiêu, đó là một thử nghiệm thực sự về kỹ năng, chiến lược và tính nhất quán. Cho dù bạn chỉ mới bắt đầu hay nhằm mục đích đạt đến các tầng trên cùng, hiểu cách hệ thống xếp hạng hoạt động là hoàn toàn quan trọng. Trong những năm qua, vô số g

Tác giả: LeoĐọc:1