Khoảng ba tháng sau khi Huawei Technologies bị Washington đưa vào danh sách đen thương mại năm 2019, chủ tịch luân phiên của công ty khi đó là Eric Xu Zhijun đã công bố thứ mà ông tuyên bố là "bộ xử lý AI mạnh nhất thế giới" - Ascend 910 - được thiết kế để đào tạo các mô hình trí tuệ nhân tạo (AI).
Tuy nhiên, sáng kiến chip AI tiên tiến của Huawei đột nhiên phải đối mặt với một trở ngại lớn một năm sau đó vào tháng 8 năm 2020, khi Bộ Thương mại Hoa Kỳ thắt chặt các hạn chế bằng cách cấm bán các sản phẩm và dịch vụ bán dẫn - có nguồn gốc từ bất kỳ nơi nào có công nghệ Hoa Kỳ - cho công ty và các chi nhánh của công ty mà không có giấy phép cần thiết.
Do đó, nhà cung cấp của Huawei là Taiwan Semiconductor Manufacturing Co, nhà sản xuất chip theo hợp đồng lớn nhất và tiên tiến nhất thế giới, đã ngừng kinh doanh với công ty Trung Quốc này và đơn vị thiết kế mạch tích hợp (IC) HiSilicon của công ty này để tuân thủ các hạn chế của Hoa Kỳ.
Vào thời điểm đó, theo một số nhà phân tích, tiên lượng có vẻ rất tồi tệ đối với Huawei. Paul Trolio của công ty tư vấn rủi ro chính trị Eurasia Group có trụ sở tại New York cho biết: "Nếu đủ số công ty tuân thủ trên toàn cầu, khả năng tạo ra các giải pháp thay thế của Huawei sẽ bị suy yếu nghiêm trọng, khiến sự tồn tại liên tục của công ty này như một thực thể thương mại khả thi bị nghi ngờ".
Quay trở lại năm 2025, Huawei vẫn kiên cường trước các lệnh trừng phạt của Hoa Kỳ.
Jensen Huang, nhà sáng lập kiêm giám đốc điều hành của gã khổng lồ chip AI Nvidia, là nhà lãnh đạo ngành nổi bật nhất nhận ra sự trỗi dậy của Huawei trong lĩnh vực IC. “Nhìn chung, các biện pháp kiểm soát xuất khẩu đã thất bại. Thực tế cho thấy điều đó”, Huang nói với các phóng viên bên lề hội chợ Computex tháng trước tại Đài Bắc. Ông kêu gọi Nhà Trắng hạ thấp rào cản đối với việc bán chip AI trước khi các công ty Mỹ nhường thị trường Trung Quốc cho các đối thủ như Huawei.
Đánh giá của Huang được đưa ra sau khi Nvidia tiết lộ vào tháng 4 rằng chính phủ Hoa Kỳ hiện yêu cầu phải có giấy phép để xuất khẩu chip H20 của mình sang Trung Quốc. Công ty đã phải chịu khoản phí 4,5 tỷ đô la Mỹ trong quý đầu tiên kết thúc vào ngày 27 tháng 4 do tồn kho dư thừa và nghĩa vụ mua hàng đối với H20.
Trong quý thứ hai, Nvidia dự kiến sẽ lỗ 8 tỷ đô la Mỹ do lệnh cấm chip H20. Bộ xử lý đồ họa (GPU) H20 được thiết kế cho thị trường Trung Quốc sau khi Hoa Kỳ ban hành các biện pháp kiểm soát xuất khẩu trước đó.
Hiệu suất của chip Ascend so với GPU theo yêu cầu của Nvidia đã được đưa vào tầm ngắm trong tuần này, sau khi phát hành một bài báo kỹ thuật được các nhà nghiên cứu từ Huawei và công ty khởi nghiệp về cơ sở hạ tầng AI của Trung Quốc SiliconFlow cùng nhau viết.
Theo bài báo, kiến trúc trung tâm dữ liệu tiên tiến do Huawei cung cấp năng lượng Ascend – CloudMatrix 384, cùng với giải pháp phục vụ CloudMatrix-Infer – đã vượt trội hơn khuôn khổ phục vụ nhanh SGLang dựa trên GPU Nvidia cho các mô hình ngôn ngữ lớn (LLM), ở cả giai đoạn suy luận và giải mã, khi chạy mô hình lý luận R1 của DeepSeek.
Hệ thống CloudMatrix, mà bài báo dự kiến sẽ "định hình lại nền tảng của cơ sở hạ tầng AI", bao gồm 384 đơn vị xử lý thần kinh (NPU) Ascend 910C và 192 đơn vị xử lý trung tâm máy chủ Kunpeng, được kết nối với nhau thông qua một bus thống nhất cung cấp băng thông cực cao và độ trễ thấp.
Kiến trúc hiệu quả cao này phản ánh cam kết của Huawei trong việc vượt qua các hạn chế về công nghệ của Hoa Kỳ, khi công ty này mở rộng ranh giới về hiệu suất của hệ thống AI.
Theo đánh giá trước đó của SemiAnalysis, CloudMatrix của Huawei cạnh tranh trực tiếp với hệ thống GB200 NVL72 quy mô giá đỡ của Nvidia trong việc giảm bớt tình trạng tắc nghẽn cho các trung tâm dữ liệu.
Trong giai đoạn giải mã để tạo đầu ra từ mô hình AI, các phát hiện của bài báo Huawei-SiliconFlow cho thấy CloudMatrix đã ghi lại 1.943 mã thông báo mỗi giây cho mỗi NPU cho bộ đệm khóa-giá trị dài 4.000 chiều dài - một cấu trúc bộ nhớ cho phép sử dụng bộ xử lý AI hiệu quả hơn.
Cùng giai đoạn này cho thấy thời gian tạo đầu ra luôn dưới 50 mili giây cho mỗi mã thông báo, mang lại hiệu quả 1,29 mã thông báo mỗi giây cho mỗi nghìn tỷ phép tính dấu phẩy động mỗi giây.
Bài báo cho biết: "Những kết quả này cùng nhau thiết lập CloudMatrix384, kết hợp với giải pháp phục vụ ngang hàng CloudMatrix-Infer của chúng tôi, là một nền tảng có khả năng mở rộng, thông lượng cao và cấp sản xuất để triển khai LLM quy mô lớn".
Bài báo cũng cung cấp thông tin chi tiết về bộ xử lý AI 910C của Huawei lần đầu tiên. Con chip này có kiến trúc hai đế, tích hợp hai đế tính toán giống hệt nhau trong một gói duy nhất. Các đế này chia sẻ tám ngăn xếp bộ nhớ trên gói và giao tiếp thông qua một kết nối băng thông cao, cho phép truyền dữ liệu nhanh chóng, điều này rất quan trọng đối với khối lượng công việc AI chuyên sâu.
"Huawei tụt hậu một thế hệ về chip, nhưng giải pháp mở rộng quy mô của họ có thể được cho là đi trước một thế hệ so với các sản phẩm hiện tại của Nvidia và AMD [Advanced Micro Devices] trên thị trường", báo cáo của SemiAnalysis cho biết.
Điều đó tương tự như những phát biểu của nhà sáng lập kiêm giám đốc điều hành Huawei Nhậm Chính Phi trong một cuộc phỏng vấn trang nhất gần đây do tờ Nhân dân Nhật báo, cơ quan ngôn luận chính thức của Đảng Cộng sản Trung Quốc, đăng tải. Ren thừa nhận rằng chip Ascend của công ty có trụ sở tại Thâm Quyến này vẫn tụt hậu so với các đối thủ cạnh tranh của Hoa Kỳ "một thế hệ".
Tuy nhiên, ông nói thêm rằng, việc sử dụng các phương pháp như "xếp chồng và nhóm" đã mang lại hiệu suất tính toán tương đương với các hệ thống tiên tiến nhất trên thế giới.
Nhà đầu tư công nghệ Kevin Xu, người sáng lập kiêm giám đốc thông tin của Interconnected Capital, cho biết: "Hiệu suất của một chip đơn lẻ không quan trọng bằng sức mạnh kết hợp của một nhóm chip hoạt động song song".
Ông chỉ ra rằng việc xây dựng các hệ thống quy mô lớn đòi hỏi chuyên môn về mạng - một trình độ của Huawei, công ty vẫn là nhà cung cấp thiết bị viễn thông lớn nhất thế giới. "Quy định kiểm soát xuất khẩu của Hoa Kỳ đã làm chậm tiến độ phát triển AI tại Trung Quốc, nhưng nó cũng thúc đẩy nỗ lực của Trung Quốc nhằm nội địa hóa mọi bước sản xuất chip AI tiên tiến", Xu cho biết. Ông nói thêm rằng Nvidia không còn là nguồn cung cấp chip AI đáng tin cậy cho Trung Quốc đại lục nữa, ngay cả khi công ty được phép bán lại trên thị trường.
Trong khi đó, ông trùm tiền điện tử và AI của chính quyền Trump, David Sacks, đã cảnh báo rằng Trung Quốc đã trở nên thành thạo trong việc trốn tránh các biện pháp kiểm soát xuất khẩu của Hoa Kỳ và chậm hơn nhiều nhất là hai năm so với khả năng thiết kế chất bán dẫn của Hoa Kỳ, theo báo cáo của Bloomberg vào thứ Sáu.
Ông chỉ ra rằng các mô hình AI đột phá của DeepSeek vào đầu năm nay cho thấy Trung Quốc vẫn có thể tiến bộ ngay cả khi các biện pháp kiểm soát xuất khẩu được áp dụng.
Sacks cho biết các hạn chế chặt chẽ của Hoa Kỳ đối với việc bán chip AI cho các đồng minh của Hoa Kỳ - dựa trên quy tắc "AI Diffusion" thời Biden, mà chính quyền Trump đã hủy bỏ - có thể vô tình tạo ra một cơ hội trên toàn cầu cho Huawei và các công ty Trung Quốc khác.
"Nếu chúng ta quá hạn chế về mặt doanh số bán hàng của Hoa Kỳ cho thế giới, tôi nghĩ rằng sẽ đến lúc chúng ta tự trách mình và nói rằng, 'Đột nhiên Huawei xuất hiện ở khắp mọi nơi khi chúng ta từng có thị trường cho riêng mình. Tại sao chúng ta không tận dụng điều đó và khóa chặt nó?'", ông nói.
Những nhận xét đó lặp lại những bình luận mà Huang của Nvidia đưa ra bên lề hội nghị VivaTech tuần trước tại Paris, nơi ông cảnh báo rằng Huawei có thể mở rộng hoạt động kinh doanh chất bán dẫn của mình nếu lệnh hạn chế xuất khẩu chip của Hoa Kỳ vẫn được áp dụng. "Nếu Hoa Kỳ không muốn tham gia vào Trung Quốc, Huawei đã bảo vệ Trung Quốc", Huang nói. "Huawei [cũng] bảo vệ mọi người khác".
Tuy nhiên, Huawei dự kiến sẽ không xuất xưởng quá 200.000 bộ xử lý AI tiên tiến của mình trong năm nay, Thứ trưởng Bộ Thương mại Hoa Kỳ phụ trách Công nghiệp và An ninh Jeffrey Kessler đã phát biểu tại phiên điều trần của quốc hội vào tuần trước. Ông ước tính rằng "hầu hết hoặc toàn bộ" số chip đó sẽ được cung cấp cho các doanh nghiệp trong Trung Quốc. Con số đó sẽ không đáng kể so với hơn 1 triệu GPU H20 dành riêng cho Trung Quốc do Nvidia sản xuất trong chín tháng cuối năm 2024, theo báo cáo vào tháng 1 của công ty nghiên cứu SemiAnalysis của Hoa Kỳ.
Tuy nhiên, theo ước tính của các nhà phân tích từ Mizuho Securities, Huawei có thể xuất xưởng nhiều hơn con số mà Kessler đã nói với các nhà lập pháp Hoa Kỳ.
Theo Mizuho, khoảng 700.000 đơn vị thuộc dòng Ascend 910 của Huawei - bao gồm 910A, 910B và 910C - dự kiến sẽ được xuất xưởng vào năm 2025, bất chấp những thách thức về năng suất mà nhà sản xuất chip theo hợp đồng lớn nhất của Trung Quốc, Semiconductor Manufacturing International Corp, phải đối mặt ở nút 7 nanomet (nm),.
Suy đoán về cách Huawei xoay xở để tăng sản lượng chip Ascend đã chỉ ra sự huy động chuỗi cung ứng thiết bị chip của Trung Quốc.
SiCarrier, một nhà sản xuất thiết bị bán dẫn của Trung Quốc có quan hệ với Huawei, đã nhận được sự hoan nghênh rộng rãi khi lần đầu tiên công khai trưng bày hàng chục máy sản xuất và thử nghiệm chip mới tại Semicon China vào tháng 3. Điều đó đã làm dấy lên suy đoán về khả năng đóng góp của SiCarrier vào quá trình phát triển chip 7 nm của Huawei tại địa phương, ban đầu được sử dụng trong điện thoại Mate 60 Pro 5G ra mắt vào năm 2023.
Việc sản lượng chip Ascend ổn định sẽ báo hiệu điều tốt lành cho các công ty AI của Trung Quốc, chẳng hạn như iFlytek và SenseTime, vốn đã chuyển sang mua chip sản xuất tại địa phương.
Liu Qingfeng, người sáng lập kiêm chủ tịch của công ty chuyên về nhận dạng giọng nói iFlytek, cho biết vào đầu tháng này rằng công ty của ông đã sử dụng chip trong nước, chẳng hạn như Ascend 910B của Huawei, mặc dù điều đó có thể làm chậm quá trình phát triển mô hình AI trong ba tháng. Công ty đã bị cấm mua chip tiên tiến của Hoa Kỳ kể từ khi bị Washington đưa vào danh sách đen thương mại vào tháng 10 năm 2019.
Trong khi đó, SenseTime do Hồng Kông thành lập đã đầu tư mạnh vào việc xây dựng cơ sở hạ tầng AI của mình bằng chip do Trung Quốc sản xuất - bao gồm cả chip của Huawei, Cambricon Technologies và Hygon Information Technology - để giảm thiểu rủi ro từ cuộc chiến công nghệ đang diễn ra giữa Hoa Kỳ và Trung Quốc.
Yang Fan, đồng sáng lập SenseTime và chủ tịch đơn vị cơ sở hạ tầng AI SenseCore, cho biết vào tháng 4 rằng số lượng chip trong nước tại các trung tâm dữ liệu của công ty đang "tăng rất nhanh" và "tiếp tục tăng lên hàng năm".
Tuy nhiên, thách thức trước mắt đối với các nhà cung cấp chip trong nước là đáp ứng nhu cầu tiềm năng lớn từ các công ty công nghệ lớn nhất của Trung Quốc, dẫn đầu là Alibaba Group Holding và Tencent Holdings, sau khi họ sử dụng hết lượng chip Nvidia hiện có.
Alex Yao, giám đốc nghiên cứu vốn chủ sở hữu Trung Quốc tại JPMorgan, cho biết: "Các công ty công nghệ lớn đã tăng cường chi tiêu vốn trong các quý vừa qua và tích trữ hàng tồn kho". “Điều đó có nghĩa là trong sáu đến mười hai tháng tới, họ không cần phải lo lắng về sức mạnh tính toán.”
Trong một phân khúc khác của chuỗi cung ứng chip của Trung Quốc, Empyrean Technology, Primarius Technologies và Semitronix đang ngày càng được chú ý với tư cách là nhà cung cấp thay thế phần mềm tự động hóa thiết kế điện tử (EDA) sau khi Washington chỉ đạo các nhà cung cấp hàng đầu thế giới dừng bán hàng tại Trung Quốc đại lục theo các hạn chế xuất khẩu mới của Hoa Kỳ.
Các nhà cung cấp EDA hàng đầu Cadence Design Systems, Synopsys và Siemens EDA đã xác nhận rằng họ đã nhận được thông báo từ Cục Công nghiệp và An ninh của Bộ Thương mại Hoa Kỳ về các hạn chế đối với phần mềm của họ, có thể được sử dụng để phát triển chip AI tiên tiến.
Empyrean nhìn thấy cả thách thức và cơ hội trong tình hình này. Công ty hiện có thể cung cấp khoảng 80 phần trăm trong tổng số 58 công cụ EDA được sử dụng trong toàn bộ quy trình sản xuất chip, Yu Han, giám đốc tiếp thị cấp cao tại Empyrean, cho biết tại một sự kiện của ngành vào thứ Sáu.
Yu cho biết Empyrean đặt mục tiêu cung cấp tất cả các công cụ đó trong tương lai, biến công ty thành một trong những nhà cung cấp EDA hàng đầu thế giới. Ông chỉ ra rằng phần khó khăn nhất là thiết lập một hệ sinh thái vững chắc, đòi hỏi "sự hợp tác với ngành công nghiệp bán dẫn của Trung Quốc".
Theo một phân tích gần đây từ công ty tư vấn bán dẫn ICWise có trụ sở tại Thượng Hải, ngoài những nghi ngờ dai dẳng về hiệu quả của bộ xử lý trong nước, người dùng những con chip này cũng có thể phải đối mặt với các vấn đề về tuân thủ khi các mô hình AI mà họ phát triển được áp dụng ở thị trường nước ngoài.
Yao của JPMorgan cho biết các nhà phát triển mô hình AI của Trung Quốc tập trung nhiều hơn vào hiệu quả triển khai phần cứng của họ.
Nhưng với các hạn chế công nghệ của Hoa Kỳ vẫn còn hiệu lực, Huawei có vẻ sẽ được hưởng lợi khi công ty tiếp tục nâng cao tiêu chuẩn về hiệu suất chip AI bằng mọi kỹ thuật có thể, đồng thời dẫn đầu nỗ lực tự cung tự cấp chất bán dẫn của Trung Quốc.
Khi được hỏi về lệnh trừng phạt của Hoa Kỳ trong cuộc phỏng vấn với tờ People's Daily, Nhậm Chính Phi, CEO của Huawei cho biết ông hiếm khi nghĩ đến điều đó vì việc cân nhắc về những khó khăn là "vô ích". "Tôi không nghĩ về những khó khăn", ông nói. "Tôi chỉ tiến về phía trước từng bước một".