Startup Trung Quốc tung mô hình AI giá siêu rẻ nhưng mạnh ngang ChatGPT, Mỹ và Nvidia có nên lo lắng?
Mặc dù chưa tiết lộ chi tiết, nhưng chi phí đào tạo và phát triển mô hình AI của DeepSeek dường như chỉ bằng một phần nhỏ so với chi phí của OpenAI hay Meta Platforms.
DeepSeek, một startup AI mới chỉ hơn một năm tuổi, đã khiến giới công nghệ ở Thung lũng Silicon kinh ngạc khi ra mắt mô hình trí tuệ nhân tạo tiên tiến với hiệu suất tương đương các chatbot hàng đầu thế giới nhưng với chi phí thấp hơn đáng kể.
Được phát triển tại Hàng Châu, Trung Quốc, DeepSeek có thể gây ảnh hưởng lớn đến ngành công nghệ và chuỗi cung ứng toàn cầu, thách thức quan điểm phổ biến rằng AI trong tương lai sẽ đòi hỏi ngày càng nhiều năng lượng và tài nguyên để phát triển.
DeepSeek là gì?
DeepSeek là một startup Trung Quốc được thành lập năm 2023 bởi Lương Văn Phong (Liang Wenfeng), người đứng đầu quỹ đầu tư định lượng High-Flyer sử dụng AI. Công ty này chuyên phát triển các mô hình AI mã nguồn mở, và ứng dụng di động cùng tên của họ đã nhanh chóng leo lên vị trí số 1 trên bảng xếp hạng tải xuống của iPhone tại Mỹ sau khi ra mắt vào đầu tháng 1.
Khác với các chatbot như ChatGPT của OpenAI, DeepSeek cung cấp câu trả lời bằng cách giải thích lập luận trước khi đưa ra phản hồi cuối cùng. Công ty tuyên bố rằng phiên bản R1 của họ có thể cạnh tranh với các sản phẩm mới nhất của OpenAI và đã cấp phép cho cá nhân phát triển chatbot dựa trên công nghệ này.
DeepSeek R1 so với OpenAI và Meta AI
Mặc dù chưa tiết lộ chi tiết, nhưng chi phí đào tạo và phát triển mô hình AI của DeepSeek dường như chỉ bằng một phần nhỏ so với chi phí của OpenAI hay Meta Platforms.
Hiệu suất vượt trội này đặt ra câu hỏi về tính cần thiết của các khoản đầu tư khổng lồ vào phần cứng AI tiên tiến như GPU của Nvidia. Đồng thời, điều này cũng làm nổi bật tầm quan trọng của các biện pháp hạn chế xuất khẩu của Mỹ đối với các loại chip tiên tiến sang Trung Quốc – vốn nhằm ngăn chặn những đột phá như DeepSeek đang đạt được.
DeepSeek R1 đạt hoặc vượt qua các đối thủ trong nhiều bài kiểm tra hàng đầu, bao gồm AIME 2024 (bài toán học), MMLU (kiến thức tổng hợp) và AlpacaEval 2.0 (hỏi-đáp). Nó cũng nằm trong nhóm chatbot dẫn đầu trên bảng xếp hạng Chatbot Arena của UC Berkeley.
Vì sao Mỹ lo ngại?
Washington đã cấm xuất khẩu các công nghệ cao cấp như GPU tiên tiến sang Trung Quốc nhằm làm chậm sự phát triển AI của nước này, một lĩnh vực quan trọng trong cuộc cạnh tranh công nghệ Mỹ - Trung.
Tuy nhiên, sự phát triển của DeepSeek cho thấy các kỹ sư AI Trung Quốc đã tìm ra cách vượt qua những hạn chế này bằng cách tối ưu hóa hiệu suất dù tài nguyên hạn chế.
Hiện vẫn chưa rõ DeepSeek đã tiếp cận được bao nhiêu phần cứng AI tiên tiến, nhưng những gì họ thể hiện cho thấy các biện pháp kiểm soát thương mại của Mỹ chưa hoàn toàn hiệu quả trong việc kìm hãm tiến bộ AI của Trung Quốc.
DeepSeek bắt đầu gây chú ý khi nào?
DeepSeek  đã thu hút sự quan tâm từ khi ra mắt mô hình đầu tiên vào năm 2023. Đến tháng 11, công ty giới thiệu DeepSeek R1, một mô hình lý luận AI mô phỏng tư duy con người. Mô hình này làm nền tảng cho ứng dụng chatbot di động của họ, và khi ra mắt giao diện web vào tháng 1, nó nhanh chóng trở nên nổi tiếng toàn cầu như một lựa chọn thay thế OpenAI với chi phí thấp hơn nhiều. Nhà đầu tư Marc Andreessen thậm chí gọi DeepSeek là "khoảnh khắc Sputnik của AI".
Tính đến ngày 25/1, ứng dụng DeepSeek đã được tải xuống 1,6 triệu lần và đứng đầu bảng xếp hạng App Store của iPhone tại Úc, Canada, Trung Quốc, Singapore, Mỹ và Anh, theo dữ liệu từ App Figures.
Người sáng lập DeepSeek
Lương Văn Phong sinh năm 1985 tại Quảng Đông, tốt nghiệp cử nhân và thạc sĩ ngành kỹ thuật điện tử & thông tin tại Đại học Chiết Giang. Ông thành lập DeepSeek với vốn đăng ký chỉ 10 triệu NDT (khoảng 1,4 triệu USD), theo cơ sở dữ liệu doanh nghiệp Tianyancha.
Trong một cuộc phỏng vấn với 36kr, Lương cho rằng rào cản lớn nhất với sự phát triển AI của Trung Quốc không phải là vốn đầu tư mà là các lệnh hạn chế chip của Mỹ. Ông nhấn mạnh rằng phần lớn nhóm nghiên cứu của DeepSeek là những sinh viên tốt nghiệp từ các trường đại học hàng đầu Trung Quốc, đồng thời kêu gọi Trung Quốc xây dựng một hệ sinh thái chip AI nội địa như Nvidia  đã làm được.
"Đầu tư nhiều hơn không nhất thiết dẫn đến đổi mới nhiều hơn. Nếu không, các công ty lớn đã chiếm trọn mọi sự sáng tạo", ông Lương nói.
Vị trí của DeepSeek trong hệ sinh thái AI Trung Quốc
Các tập đoàn công nghệ lớn như Alibaba, Baidu và Tencent đã đầu tư mạnh vào AI, đặc biệt là phần cứng và khách hàng. Tuy nhiên, DeepSeek nổi bật với chiến lược mã nguồn mở, giúp nhanh chóng thu hút người dùng trước khi triển khai các mô hình kiếm tiền. Cùng với 01.AI của Lý Khai Phục, DeepSeek đang góp phần định hình cuộc đua AI tại Trung Quốc.
Nhờ chi phí thấp hơn, DeepSeek đã thúc đẩy giá thành phát triển AI giảm mạnh tại Trung Quốc. Các công ty lớn đã bước vào cuộc chiến giá cả khốc liệt, với nhiều đợt giảm giá liên tiếp trong suốt một năm rưỡi qua.
Tác động của DeepSeek lên thị trường AI toàn cầu
Sự thành công của DeepSeek có thể buộc OpenAI và các công ty AI Mỹ phải giảm giá để duy trì vị thế. Nó cũng đặt dấu hỏi về khoản đầu tư khổng lồ của các tập đoàn như Meta và Microsoft,mỗi bên cam kết chi 65 tỷ USD trở lên trong năm nay chủ yếu vào hạ tầng AI, trong khi DeepSeek đạt được kết quả cạnh tranh với chi phí thấp hơn nhiều.
Điều này đã tác động đến thị trường chứng khoán châu Á, khi các nhà đầu tư đổ xô mua cổ phiếu của các công ty liên quan đến DeepSeek như Iflytek, trong khi rút vốn khỏi chuỗi cung ứng chip như Advantest, do lo ngại nhu cầu chip AI sẽ giảm.
Hiện tại, các nhà phát triển trên toàn cầu đang thử nghiệm phần mềm của DeepSeek để xây dựng các công cụ mới. Điều này có thể đẩy nhanh việc áp dụng các mô hình AI lý luận tiên tiến, đồng thời tăng áp lực về các quy định kiểm soát AI trên toàn thế giới.
Hạn chế của DeepSeek
Giống như các mô hình AI khác của Trung Quốc, DeepSeek tự kiểm duyệt đối với các chủ đề nhạy cảm. Nó từ chối trả lời về sự kiện Thiên An Môn hay các câu hỏi chính trị nhạy cảm như khả năng Trung Quốc tấn công Đài Loan. Trong khi có thể đưa ra phản hồi chi tiết về Thủ tướng Ấn Độ Narendra Modi, chatbot này lại từ chối bình luận về Chủ tịch Trung Quốc Tập Cận Bình.
Ngoài ra, hạ tầng đám mây của DeepSeek đang bị thử thách bởi sự bùng nổ người dùng. Công ty đã gặp sự cố gián đoạn lớn vào ngày 27/1 và sẽ cần quản lý tốt hơn để duy trì hiệu suất khi lưu lượng truy cập tiếp tục tăng cao.