Công ty khởi nghiệp trí tuệ nhân tạo Trung Quốc DeepSeek đã ám chỉ rằng, Trung Quốc sẽ sớm có chip nội địa "thế hệ tiếp theo" để hỗ trợ các mô hình AI của mình, đồng thời công bố bản cập nhật cho một trong những mô hình ngôn ngữ lớn của mình.
Trong một bình luận dưới bài đăng trên tài khoản WeChat chính thức, DeepSeek cho biết định dạng chính xác "UE8M0 FP8" của mẫu V3.1 mới phát hành được thiết kế riêng cho các chip thế hệ tiếp theo do Trung Quốc sản xuất, sẽ sớm ra mắt.
FP8, hay dấu chấm động 8 bit, là một định dạng xử lý dữ liệu có thể tăng cường hiệu quả tính toán cho việc đào tạo và suy luận các mô hình học sâu lớn.
Việc DeepSeek đề cập đến chip thế hệ tiếp theo sắp ra mắt của Trung Quốc có thể báo hiệu kế hoạch hợp tác chặt chẽ hơn với hệ sinh thái chip AI mới nổi của Trung Quốc trong bối cảnh Washington đang áp dụng các hạn chế xuất khẩu chất bán dẫn tiên tiến và Bắc Kinh đang thúc đẩy tự cung tự cấp chip.
Những bình luận này được đưa ra khoảng hai tuần sau khi Bắc Kinh được cho là đã thúc giục các nhà phát triển AI Trung Quốc sử dụng các giải pháp thay thế trong nước cho các bộ xử lý đồ họa của Nvidia được sử dụng trong đào tạo AI. Trong khi các nhà phân tích cho rằng các nhà sản xuất chip AI nội địa của Trung Quốc tụt hậu so với Nvidia về mặt tiến bộ công nghệ và quy mô, thì những công ty như Huawei đã và đang đạt được những tiến bộ.
Trong bài đăng hôm thứ Năm, DeepSeek không tiết lộ loại chip mà họ sử dụng để đào tạo V3.1, hay UE8M0 FP8 có thể tương thích với loại chip nội địa nào.
Đầu năm nay, DeepSeek đã gây chấn động thế giới công nghệ sau khi phát hành mô hình suy luận R1, mô hình này chứng minh được khả năng tương đương với các đối thủ phương Tây như OpenAI, bất chấp việc các biện pháp kiểm soát xuất khẩu của Hoa Kỳ hạn chế công ty sử dụng các chip đào tạo AI tiên tiến nhất của Nvidia.
Trước đó, vào tháng 12, công ty đã phát hành mô hình V3, được cho là đã được đào tạo trên khoảng 2.000 chip kém tiên tiến hơn của Nvidia.
Sau những đột phá về mô hình của DeepSeek, Hoa Kỳ đã thắt chặt hơn nữa các hạn chế xuất khẩu vào tháng 4, trên thực tế đã cấm các chip H20 của Nvidia, vốn được thiết kế đặc biệt để đáp ứng các hạn chế xuất khẩu trước đó đối với Trung Quốc.
Tháng trước, các quan chức từ chính quyền Trump cho biết họ có kế hoạch cho phép Nvidia tiếp tục vận chuyển chip sang Trung Quốc. Tuy nhiên, H20 hiện đang bị giám sát chặt chẽ tại Trung Quốc, với việc các cơ quan quản lý được cho là yêu cầu các công ty không mua chip cho đến khi hoàn tất đánh giá an ninh quốc gia.
Các nhà phân tích chip đã nói rằng, các công ty như Huawei, vốn đang tìm cách xây dựng một hệ sinh thái chip AI thay thế tại Trung Quốc, có thể được hưởng lợi từ việc thiếu vắng H20 của Nvidia trên thị trường.
DeepSeek cho biết hôm thứ Năm (21/8) rằng, phiên bản V3.1 của họ đi kèm với "những thay đổi lớn", bao gồm thời gian phản hồi nhanh hơn và kiến trúc lập luận lai cho phép mô hình hỗ trợ cả chế độ lập luận và phi lập luận. Các mô hình lập luận có thể thực hiện các tác vụ phức tạp hơn thông qua quy trình suy nghĩ logic từng bước.
Bắt đầu từ ngày 6 tháng 9, công ty cũng sẽ điều chỉnh giá sử dụng API của mô hình, cho phép các nhà phát triển ứng dụng và sản phẩm web khác tích hợp DeepSeek trên nền tảng của họ.