Hướng dẫn công nghệ
Cách DeepSeek sử dụng phương pháp chưng cất để đào tạo mô hình trí tuệ nhân tạo
Minh Ngọc - Chủ Nhật, 23/02/2025 8:34 SA
Vietnet24h - Phòng thí nghiệm trí tuệ nhân tạo Trung Quốc DeepSeek đã khuấy động thị trường vào tháng 1, gây ra một đợt bán tháo công nghệ và chất bán dẫn lớn sau khi công bố các mô hình AI mà họ cho là rẻ hơn và hiệu quả hơn so với các mô hình của Mỹ.
Nhưng nỗi sợ hãi và đột phá tiềm ẩn đã thúc đẩy đợt bán tháo này còn sâu sắc hơn nhiều so với một công ty khởi nghiệp AI. Thung lũng Silicon hiện đang tính đến một kỹ thuật trong phát triển AI được gọi là chưng cất, một kỹ thuật có thể đảo ngược bảng xếp hạng AI.
 
Chưng cất là một quá trình trích xuất kiến ​​thức từ một mô hình AI lớn hơn để tạo ra một mô hình nhỏ hơn. Nó có thể cho phép một nhóm nhỏ hầu như không có nguồn lực nào tạo ra một mô hình tiên tiến.
 
Một công ty công nghệ hàng đầu đầu tư nhiều năm và hàng triệu đô la để phát triển một mô hình hàng đầu từ đầu. Sau đó, một nhóm nhỏ hơn như DeepSeek lao vào và đào tạo mô hình chuyên biệt hơn của riêng mình bằng cách đặt câu hỏi cho mô hình "giáo viên" lớn hơn. Quá trình này tạo ra một mô hình mới có khả năng gần như mô hình của công ty lớn nhưng đào tạo nhanh hơn và hiệu quả hơn.
 
“Kỹ thuật chưng cất này cực kỳ mạnh mẽ và cực kỳ rẻ, và nó dành cho bất kỳ ai”, Ali Ghodsi, CEO của Databricks, cho biết, đồng thời nói thêm rằng ông hy vọng sẽ thấy sự đổi mới khi nói đến cách xây dựng các mô hình ngôn ngữ lớn hay LLM. “Chúng ta sẽ thấy rất nhiều sự cạnh tranh cho LLM. Đó là những gì sẽ xảy ra trong kỷ nguyên mới mà chúng ta đang bước vào”.
 
Hiện nay, chưng cất đang cho phép các công ty khởi nghiệp và phòng nghiên cứu ít vốn cạnh tranh ở vị trí tiên tiến nhanh hơn bao giờ hết.
 
Các nhà nghiên cứu tại Berkeley cho biết, sử dụng kỹ thuật này, họ đã tái tạo mô hình lý luận của OpenAI với giá 450 đô la trong 19 giờ vào tháng trước. Ngay sau đó, các nhà nghiên cứu tại Stanford và Đại học Washington đã tạo ra mô hình lý luận của riêng họ chỉ trong 26 phút, sử dụng chưa đến 50 đô la tín dụng tính toán, họ cho biết. Công ty khởi nghiệp Hugging Face đã tái tạo tính năng mới nhất và hấp dẫn nhất của OpenAI, Nghiên cứu sâu, dưới dạng thử thách mã hóa trong 24 giờ.
 
DeepSeek không phát minh ra quá trình chưng cất, nhưng nó đã đánh thức thế giới AI về tiềm năng phá vỡ của nó. Nó cũng mở ra sự trỗi dậy của một trật tự nguồn mở mới — một niềm tin rằng tính minh bạch và khả năng tiếp cận thúc đẩy sự đổi mới nhanh hơn so với nghiên cứu đóng cửa.
 
"Nguồn mở luôn chiến thắng trong ngành công nghệ", Arvind Jain, CEO của Glean, công ty tạo ra công cụ tìm kiếm hỗ trợ AI cho các doanh nghiệp, cho biết. "Bạn không thể đánh bại được động lực mà một dự án nguồn mở thành công thực sự có thể tạo ra".
 
Bản thân OpenAI đã quay lại chiến lược nguồn đóng của mình sau thành tích của DeepSeek.
 
"Cá nhân tôi nghĩ rằng chúng ta đã đi sai hướng trong lịch sử và cần tìm ra một chiến lược nguồn mở khác", CEO của OpenAI Sam Altman đã viết trong một bài đăng trên Reddit vào ngày 31 tháng 1.
 
Sự kết hợp giữa sức hút mới tìm thấy của quá trình chưng cất và sự gia tăng phổ biến của nguồn mở đang hoàn toàn thay đổi động lực cạnh tranh trong AI.
Bắc Kinh áp dụng DeepSeek để dẫn đầu việc áp dụng AI khi tìm kiếm động lực tăng trưởng mới Vietnet24h - DeepSeek cũng đã làm rung chuyển hệ sinh thái AI của Trung Quốc, với các tổ chức nhà nước cũng như các công ty công nghệ lớn, bao gồm cả các đối thủ cạnh tranh, tận dụng kiến ​​trúc nguồn mở của nó.
Mô hình AI của Deepseek, là một tác phẩm tốt nhất của Trung Quốc nhưng hơi quá "cường điệu", Giám đốc điều hành của Google Deepmind nói Vietnet24h - Mô hình AI của Deepseek, có lẽ là tác phẩm hay nhất của Trung Quốc, Demis Hassabis, CEO của Google Deepmind cho biết vào Chủ nhật.
Tin khác cùng chuyên mục
Tin đọc nhiều
Camera sau của Galaxy S26 sẽ có thông số kỹ thuật tương tự như S25. Vietnet24h - Samsung đang lên kế hoạch trang bị camera sau có thông số kỹ thuật tương tự cho mẫu Galaxy S26 tiêu chuẩn ra mắt năm sau với tên gọi Galaxy S25.
Phần mềm mới của Nvidia có thể giúp theo dõi xem các chip AI của hãng được sử dụng đến đâu. Vietnet24h - Dịch vụ tùy chọn mới của Nvidia sẽ cung cấp dữ liệu định vị địa lý, giúp xác định quốc gia mà các GPU cụ thể đang hoạt động.
Digital Twin – “Bản sao số” đang cách mạng hóa công nghiệp và đời sống Việt Nam Vietnet24h - Trong kỷ nguyên Công nghiệp 4.0 và Chuyển đổi số quốc gia, khái niệm Digital Twin (Bản sao số) đang nổi lên như một “vũ khí bí mật” giúp doanh nghiệp tối ưu vận hành, giảm chi phí và dự đoán tương lai với độ chính xác chưa từng có.
SAMSUNG GALAXY Z FLIP 7 “ĐỐI ĐẦU” IPHONE 17 PRO: “SIÊU PHẨM” NÀO XỨNG ĐÁNG 1.099 USD NHẤT NĂM 2025? Vietnet24h - Điện thoại gập không còn là “hàng thử nghiệm” nữa! Chúng đang “chiến đấu sòng phẳng” với các flagship truyền thống.
Meta Connect 2025: Kính thông minh tích hợp AI chiếm vị trí trung tâm Vietnet24h - Meta đã chi hàng tỷ đô la để cố gắng đưa thực tế ảo (VR) trở thành xu hướng với người tiêu dùng. Khi chuyển hướng chiến lược metaverse sang kính thông minh, các nhà đầu tư sẽ theo dõi phản ứng của công chúng.
Virtual Twin: mô hình kỹ thuật số mô phỏng chính xác một thực thể vật lý hoặc hệ thống trong thế giới thực Vietnet24h - Virtual Twin (Song sinh số) là một mô hình kỹ thuật số được tạo ra để mô phỏng chính xác một thực thể vật lý hoặc hệ thống trong thế giới thực, như sản phẩm, quy trình sản xuất, hoặc thậm chí là toàn bộ nhà máy, thành phố.
Google Maps cho phép xem lại đường phố từ quá khứ, bạn đã thử chưa? Vietnet24h - Chỉ với vài cú nhấn trên ứng dụng hoặc máy tính, bạn có thể quay lại thời điểm năm 2010 để xem phố xá lúc đó như thế nào. Đây là tính năng Street View mở rộng mà nhiều người dùng vẫn chưa khám phá hết.
Google Search tiết lộ những tính năng sáng tạo có thể thay đổi trải nghiệm trực tuyến của bạn Vietnet24h - Các công cụ tìm kiếm vẫn là đồng minh đáng tin cậy của chúng ta trong hành trình tìm kiếm thông tin, với 16,4 tỷ truy vấn mỗi ngày chỉ tính riêng trên Google.
Google Maps nên lo lắng: Apple Maps giờ thông minh hơn và... nhớ cả bạn thích đi đâu! Vietnet24h - Apple vừa tung bản cập nhật iOS 26 khiến cộng đồng công nghệ xôn xao. Apple Maps không chỉ dẫn đường mà còn ghi nhớ thói quen di chuyển, gợi ý theo sở thích cá nhân và bảo mật tuyệt đối. Đây chính là điều mà Google Maps – với mọi dữ liệu khổng lồ – vẫn chưa thể làm được.
Apple và cuộc "đại tu hệ điều hành" tại WWDC 2025: Khi con số không chỉ là ký hiệu Vietnet24h - Tại WWDC 2025, Apple không đơn thuần giới thiệu các phiên bản phần mềm kế tiếp mà đang vẽ lại cả triết lý định danh sản phẩm và trải nghiệm người dùng. Việc chuyển từ iOS 19 sang iOS 26 không phải chỉ là đổi số, mà là tín hiệu của một chiến lược hợp nhất, đồng bộ và hướng tới tương lai của toàn hệ sinh thái Apple.
Robot gia dụng LG CLOiD – trọng tâm chiến lược robot mới của LG Vietnet24h - Hôm Chủ nhật, LG Electronics đã ra mắt robot dịch vụ gia đình mới của mình, LG CLOiD, trước thềm triển lãm thương mại CES 2026 sẽ khai mạc vào thứ Ba (6/1) tại Las Vegas.
Công ty Meiko của Nhật Bản lên kế hoạch xây dựng nhà máy sản xuất mạch in tại Việt Nam cho điện thoại AI của Samsung. Vietnet24h - Nhà máy sẽ được đặt tại khu công nghiệp Quảng Minh, gần thủ đô Hà Nội, và khởi công xây dựng trong năm tài chính 2026, bắt đầu từ tháng 4. Sản xuất hàng loạt dự kiến ​​bắt đầu vào năm tài chính 2027.
Điểm danh 10 sự kiện công nghệ nổi bật toàn cầu năm 2025 Vietnet24h - Vietnet24h tổng hợp và phân tích 10 sự kiện công nghệ lớn nhất toàn cầu năm 2025 - Năm bản lề của AI, bán dẫn và trật tự công nghệ mới.
SKT ra mắt mô hình AI độc lập khổng lồ với 500 tỷ tham số. Vietnet24h - SK Telecom hôm thứ Ba cho biết họ đã ra mắt A.X K1, mô hình trí tuệ nhân tạo đầu tiên của quốc gia với 500 tỷ tham số, nhằm mục đích mở rộng khả năng tiếp cận dịch vụ AI của công chúng và triển khai chúng tại các khu công nghiệp.
Apple cần cho ra mắt một Siri được hỗ trợ bởi trí tuệ nhân tạo tốt đến mức thuyết phục được người dùng iPhone đời cũ nâng cấp lên phiên bản mới. Vietnet24h - Trong phần lớn thời gian của năm, Apple đã phải đối phó với thuế quan do Tổng thống Donald Trump áp đặt và nhận định rằng hãng đã tụt hậu so với các đối thủ trong lĩnh vực trí tuệ nhân tạo.
Samsung được cấp phép xuất thiết bị sản xuất chip sang Trung Quốc – tín hiệu điều chỉnh chiến lược quản lý chuỗi cung ứng bán dẫn Vietnet24h - Tin Reuters ngày 30/12/2025 cho biết Samsung Electronics đã nhận được giấy phép hàng năm từ chính quyền Hoa Kỳ cho phép công ty tiếp tục vận chuyển máy móc sản xuất chip (chipmaking equipment) sang các cơ sở của hãng tại Trung Quốc trong năm 2026.
Việc Nvidia đẩy mạnh công nghệ HBM 16 lớp làm tăng thêm thách thức cho các nhà sản xuất chip nhớ Vietnet24h - Samsung, SK, Micron chạy đua để đáp ứng các yêu cầu kỹ thuật ngày càng khắt khe hơn khi Nvidia đẩy nhanh lộ trình phát triển trí tuệ nhân tạo.
Việt Nam nổi lên như một trung tâm nghiên cứu và phát triển trọng điểm cho các ông lớn công nghệ Hàn Quốc. Vietnet24h - Các tập đoàn lớn như Samsung, LG thành lập các trung tâm nghiên cứu và phát triển tại Việt Nam.
Samsung dự kiến ​​sẽ sớm trưng bày các bộ linh kiện tại Austin cho cảm biến hình ảnh của iPhone Vietnet24h - Công ty công nghệ khổng lồ của Hàn Quốc đang tuyển dụng quản lý và kỹ sư kết nối.
Theo một nhà phân tích, thỏa thuận giữa Nvidia và Groq được cấu trúc để duy trì "ảo tưởng về cạnh tranh". Vietnet24h - Groq mô tả thỏa thuận này là một “thỏa thuận cấp phép không độc quyền”, một công cụ mà các ông lớn công nghệ gần đây đã sử dụng một phần để tránh sự giám sát của cơ quan quản lý.
Từ “robot trình diễn” đến nền tảng mở: Unitree và bước ngoặt mới của ngành robot tiêu dùng Vietnet24h - Việc Unitree Robotics công bố nền tảng cho phép người dùng điều khiển robot thông qua smartphone không đơn thuần là một cải tiến giao diện người dùng.
Tàu vũ trụ thương mại đầu tiên của Hàn Quốc dự kiến ​​phóng vào ngày 22 tháng 11 tại Brazil Vietnet24h - HANBIT-Nano, tên lửa đẩy thương mại đầu tiên của Hàn Quốc do Innospace phát triển, sẽ được phóng vào lúc 3 giờ chiều ngày 22 tháng 11 tại Brazil (giờ địa phương), công ty cho biết hôm thứ Sáu (7/11).
Tương Lai Robot Hình Người: Từ “CMO” Đến Người Bạn Đồng Hành Của Nhân Loại Vietnet24h - Boston, ngày 3/10/2025 – Trong một động thái gây chấn động, robot hình người Uri – từng là Unitree G1 – vừa được bổ nhiệm làm Giám đốc Marketing (CMO) cho Series, nền tảng mạng xã hội cạnh tranh trực tiếp với LinkedIn.
PCIM Asia Shanghai 2025: Cuộc Cách Mạng Công Nghệ Điện Tử Công Suất – Phỏng Vấn Độc Quyền Với CEO EPC Về Tương Lai GaN Và AI Vietnet24h - Phóng viên Vietnet24h đã có cơ hội phỏng vấn độc quyền ông Alexander Lidow, Tiến sĩ khoa học, Tổng Giám đốc điều hành EPC (Efficient Power Conversion) – một trong những nhà tiên phong về công nghệ Gallium Nitride (GaN).
Triển Lãm Robot Tại Thượng Hải 2025: Đa Robot, Đa Nhiệm Vụ Và Tương Lai Việc Làm Tự Động Hóa Vietnet24h - Thượng Hải, Trung Quốc, ngày 27/9/2025 – Trong khuôn khổ China International Industry Fair (CIIF) 2025, Triển lãm Robot (Robot Show) đang diễn ra sôi nổi từ ngày 23 đến 27/9 tại Trung tâm Triển lãm và Hội nghị Quốc gia (National Exhibition and Convention Center, địa chỉ: 333 Songze Avenue, Quận Thanh Phổ, Thượng Hải).
Mark Zuckerberg ra mắt kính Meta Ray-Ban Display giá 799 đô la Vietnet24h - Hôm thứ Tư, Mark Zuckerberg đã ra mắt chiếc kính Meta Ray-Ban Display trị giá 799 đô la, chiếc kính thông minh đầu tiên của công ty truyền thông xã hội này dành cho người tiêu dùng với màn hình tích hợp.
SK hynix ra mắt DRAM di động cắt nhiệt đầu tiên Vietnet24h - Gã khổng lồ chip nhớ cho biết họ là công ty đầu tiên phát triển vật liệu High-K EMC, giải quyết hiệu quả vấn đề sinh nhiệt và suy giảm hiệu suất do truyền dữ liệu nhanh cho các ứng dụng AI trên thiết bị.
WindRunner: Chuyến bay chưa cất cánh của ngành điện gió Vietnet24h - Nằm tại Boulder, Colorado, một công ty khởi nghiệp tên Radia đang ấp ủ chế tạo chiếc máy bay lớn nhất thế giới. Nhưng trước khi WindRunner có thể vươn lên bầu trời với những cánh turbine khổng lồ trong khoang, họ phải vượt qua những giới hạn tưởng chừng không thể: từ kỹ thuật, quy định cho đến niềm tin thị trường.
Trung Quốc: Robot trí tuệ nhân tạo đầu tiên học tiến sĩ nghệ thuật Vietnet24h - Xueba 01 – robot hình người được phát triển tại Thượng Hải – vừa chính thức được ghi danh vào chương trình tiến sĩ 4 năm về kịch nghệ. Đây là lần đầu tiên một cỗ máy được công nhận tư cách nghiên cứu sinh trong lĩnh vực nghệ thuật biểu diễn tại Trung Quốc.
Bê tông thông minh và giấc mơ về một ngành xây dựng trung hòa carbon Vietnet24h - Trong bối cảnh biến đổi khí hậu trở thành một trong những thách thức cấp bách nhất của nhân loại, một đột phá từ Đại học Southern California (USC) có thể định hình lại ngành xây dựng – lĩnh vực vốn là một trong những nguồn phát thải CO₂ lớn nhất toàn cầu. Nhưng lần này, vật liệu truyền thống như bê tông không chỉ là một phần của vấn đề, mà đang được tái định nghĩa để trở thành một phần của giải pháp.