Alibaba vội vã ra mắt ‘bom tấn’ sau sự trỗi dậy thần tốc của DeepSeek
Hôm nay (29/1), tập đoàn công nghệ Trung Quốc Alibaba ra mắt phiên bản mới của mô hình trí tuệ nhân tạo Qwen 2.5 mà họ tuyên bố có thể vượt qua DeepSeek-V3, một mô hình đang khiến Thung lũng Silicon chao đảo.
Logo của Alibaba. (Ảnh: Reuters) |
Qwen 2.5-Max được công bố vào thời điểm khá bất thường – ngày đầu tiên của Tết Nguyên đán, khi hầu hết người Trung Quốc đang nghỉ làm và quây quần bên gia đình, cho thấy áp lực lớn từ sự trỗi dậy thần tốc của startup AI Trung Quốc DeepSeek trong 3 tuần qua không chỉ ảnh hưởng đến các đối thủ nước ngoài mà còn cả đối thủ trong nước.
“Qwen 2.5-Max vượt trội… gần như trên mọi phương diện so với GPT-4o, DeepSeek-V3 và Llama-3.1-405B”, Alibaba khẳng định trong thông báo đăng trên tài khoản WeChat chính thức của họ, đề cập đến mô hình AI tiên tiến nhất từ OpenAI và Meta.
Sự kiện hãng DeepSeek ra mắt trợ lý AI sử dụng mô hình DeepSeek-V3 hôm 10/1, cùng với việc phát hành mô hình R1 vào ngày 20/1, đã gây chấn động Thung lũng Silicon và khiến giá cổ phiếu công nghệ lao dốc. Chi phí phát triển và sử dụng cực kỳ thấp của startup Trung Quốc khiến giới đầu tư hoài nghi về kế hoạch đầu tư tốn kém của các công ty AI hàng đầu tại Mỹ.
Thành công của DeepSeek cũng khiến các đối thủ trong nước phải gấp rút nâng cấp mô hình AI của riêng họ.
Chỉ 2 ngày sau khi DeepSeek-R1 ra mắt, ByteDance – công ty mẹ của TikTok – đã phát hành bản cập nhật cho mô hình AI chủ lực của họ, tuyên bố vượt trội so với mô hình o1 của OpenAI mà Microsoft đầu tư.
DeepSeek tuyên bố mô hình R1 của họ có thể cạnh tranh với mô hình o1 của OpenAI về nhiều tiêu chí đánh giá hiệu suất.
Trong một cuộc phỏng vấn hiếm hoi với truyền thông Trung Quốc vào tháng 7 năm ngoái, Lương Văn Phong (Liang Wenfeng), nhà sáng lập bí ẩn của DeepSeek, cho biết startup của ông “không quan tâm” đến cuộc chiến giá cả mà mục tiêu chính là đạt được AGI (trí tuệ nhân tạo tổng quát). OpenAI định nghĩa AGI là các hệ thống tự trị có thể vượt qua con người trong hầu hết nhiệm vụ quan trọng.
Trong khi các tập đoàn công nghệ lớn của Trung Quốc như Alibaba có hàng trăm nghìn nhân viên, DeepSeek hoạt động giống như một phòng nghiên cứu, chủ yếu tuyển các sinh viên tốt nghiệp trẻ và nghiên cứu sinh tiến sĩ từ các trường đại học hàng đầu Trung Quốc.
Cũng trong cuộc phỏng vấn hồi tháng 7, ông Lương cho rằng các tập đoàn công nghệ lớn nhất Trung Quốc có thể không phù hợp với tương lai của ngành AI, khi so sánh chi phí cao và cơ cấu quản lý từ trên xuống của họ với mô hình vận hành tinh gọn và phong cách quản lý linh hoạt của DeepSeek.
“Các mô hình lớn đòi hỏi đổi mới liên tục, nhưng khả năng của các gã khổng lồ công nghệ có giới hạn", nhà sáng lập của DeepSeek nói.
>> Startup Trung Quốc gây sốc với mô hình AI sánh ngang ChatGPT nhưng chi phí rẻ bất ngờ 
Chân dung tỷ phú quỹ đầu cơ kín tiếng đứng sau Deepseek, khiến cả thế giới sửng sốt 
Liang Wenfeng, gã mọt sách với kiểu tóc kinh khủng đứng sau DeepSeek là ai?