Thị trường
Rủi ro của việc giảm dần dữ liệu văn bản đối với AI
Mộc Đức - Thứ Hai, 10/06/2024 10:49 SA
Vietnet24h - Việc dữ liệu văn bản do con người tạo ra ngày càng trở nên khan hiếm có thể gây rủi ro lớn đối với khả năng phát triển của công nghệ AI. Thông tin này được thể hiện trong báo cáo mới từ Fortune, với sự lo lắng cao độ về thách thức 'Nút thắt cổ chai' đối với các gã khổng lồ công nghệ.
Trong bối cảnh cuộc đua công nghệ AI đang diễn ra sôi động, một thách thức mới đã xuất hiện trên chân trời: 'Nút thắt cổ chai' đang đặt ra những rủi ro không nhỏ cho các gã khổng lồ công nghệ như Google và Meta. Theo một báo cáo mới từ Fortune, dữ liệu văn bản do con người tạo ra đang dần trở nên khan hiếm, đe dọa đến khả năng phát triển của AI.
 
Nhóm nghiên cứu Epoch, trong báo cáo công bố ngày 6/6, cảnh báo rằng vào khoảng năm 2026-2032, các công ty có thể sẽ đối mặt với tình trạng hết dữ liệu để đào tạo AI. AI tạo sinh (GenAI) đang được coi là "cơn sốt vàng" mới, nhưng cuộc chạy đua khai thác dữ liệu có thể khiến nguồn tài nguyên này cạn kiệt nhanh chóng.
 
Trong ngắn hạn, các công ty như OpenAI và Google đang nỗ lực bảo vệ nguồn dữ liệu của mình, thậm chí không ngần ngại chi trả để tiếp cận dữ liệu chất lượng cao cho việc đào tạo AI. Hình ảnh CEO OpenAI Sam Altman và CEO Microsoft Satya Nadella tại một sự kiện của OpenAI vào tháng 6/2023 là minh chứng cho mối quan hệ hợp tác sâu rộng giữa các công ty hàng đầu trong lĩnh vực này.
 
Tamay Besiroglu, tác giả chính của nghiên cứu, nhấn mạnh rằng trong tương lai, sẽ không còn đủ nguồn dữ liệu mới từ các bài viết, blog, tin tức và bình luận trên mạng xã hội để duy trì đà tăng trưởng của AI. Ông cảnh báo rằng khi thông tin nhạy cảm hoặc riêng tư không thể sử dụng, "nút thắt cổ chai" sẽ ngày càng trở nên rõ ràng.
 
Besiroglu cũng đưa ra quan điểm: "Nếu chúng ta gặp hạn chế về lượng dữ liệu, việc mở rộng các mô hình AI sẽ trở nên bất khả thi." Các nghiên cứu chỉ ra rằng, dữ liệu chất lượng cao dưới dạng văn bản có thể sẽ không đủ để "nuôi" cỗ máy AI vào năm 2026, đặt ra một thách thức lớn cho các công ty như OpenAI, Google, Meta và Microsoft trong cuộc đua AI.
 
Tuy nhiên, không phải tất cả đều đồng tình với quan điểm về "nút thắt cổ chai" trong ngành AI. Nicolas Papernot, phó giáo sư về kỹ thuật máy tính tại Đại học Toronto, cho rằng: "Chúng ta không nhất thiết phải đào tạo các mô hình ngày càng lớn hơn. Có thể phát triển các hệ thống AI chuyên biệt cho từng nhiệm vụ cụ thể." Ông cũng bày tỏ lo ngại rằng việc đào tạo nhiều hệ thống AI trên cùng một kho dữ liệu có thể làm giảm hiệu suất mô hình, thậm chí dẫn đến "sụp đổ mô hình". Ông cảnh báo rằng việc đào tạo AI dựa trên dữ liệu do chính nó tạo ra có thể làm sâu thêm những sai lầm của trí tuệ nhân tạo, như phân biệt chủng tộc và sai lệch thông tin.
Selena Deckelmann, Giám đốc sản phẩm và công nghệ của Wikipedia, nhấn mạnh: "Con người đang tạo ra một dạng tài nguyên mới - dữ liệu. Tại Wikipedia, chúng tôi đặt ra hạn chế đối với cách các công ty sử dụng nội dung do con người biên soạn, nhằm bảo vệ nguồn dữ liệu và khuyến khích tình nguyện viên tiếp tục đóng góp nội dung chất lượng cao." Bà cũng chỉ ra rằng điều quan trọng là làm sao để nội dung do con người tạo ra không chỉ tồn tại mà còn được truy cập một cách công bằng.
 
Nhóm nghiên cứu Epoch cũng đưa ra quan điểm rằng việc các công ty trả tiền cho hàng triệu người tạo văn bản có thể không phải là giải pháp tiết kiệm chi phí. OpenAI đang tiếp cận vấn đề này theo một cách mới: CEO Sam Altman đã tuyên bố sử dụng dữ liệu tổng hợp để đào tạo AI tại một sự kiện của Liên Hợp Quốc. Dữ liệu tổng hợp bao gồm cả nội dung do con người và AI tạo ra, kể cả những nội dung kém chất lượng.
 
Altman không phủ nhận những thách thức liên quan đến việc này. Ông nhấn mạnh rằng các công ty như OpenAI cần phải cân nhắc việc giảm bớt sự phụ thuộc vào dữ liệu và tập trung vào việc cải thiện mô hình AI. "Sẽ có những điều bất ngờ xảy ra nếu chúng ta đào tạo mô hình AI dựa trên kho dữ liệu tổng hợp," Altman nói. "Chưa chắc chắn liệu sáng kiến này có mang lại hiệu quả tốt hay không."

Cuộc đua công nghệ AI đang đối mặt với một nút thắt cổ chai nghiêm trọng - sự khan hiếm dữ liệu văn bản do con người tạo ra. Điều này đặt ra thách thức lớn cho các công ty công nghệ, đặc biệt là các gã khổng lồ như Google và Meta, khi họ phụ thuộc vào dữ liệu chất lượng cao để phát triển AI. Để vượt qua nút thắt này, các công ty cần phải sáng tạo trong việc thu thập, xử lý và sử dụng dữ liệu. Điều này có thể bao gồm việc đầu tư vào công nghệ tổng hợp dữ liệu, hợp tác với các tổ chức phi lợi nhuận để thu thập dữ liệu cộng đồng, hoặc phát triển các giải pháp AI có khả năng học hiệu quả với lượng dữ liệu nhỏ hơn. Ngoài ra, cần phải chú trọng đến việc đảm bảo quyền riêng tư và bảo mật dữ liệu, đồng thời thúc đẩy sự phát triển của các tiêu chuẩn đạo đức trong lĩnh vực AI.
OPPO công bố cam kết giúp mọi người có thể sử dụng điện thoại AI, mang các tính năng AI sáng tạo đến khoảng 50 triệu người dùng vào năm 2024 Vietnet24h - Được thúc đẩy bởi niềm tin rằng điện thoại thông minh là thiết bị AI cá nhân quan trọng nhất, OPPO đang đưa AI tổng hợp vào tất cả các dòng sản phẩm điện thoại thông minh OPPO khi hãng cam kết mang điện thoại AI đến với mọi người.
Sự thật đằng sau AI: một cảnh báo từ những người trong cuộc Vietnet24h - Trong bối cảnh công nghệ AI đang phát triển với tốc độ chóng mặt, một nhóm gồm 13 chuyên gia và cựu chuyên gia đến từ OpenAI và Google DeepMind đã lên tiếng, bày tỏ quan ngại sâu sắc về việc các công ty hàng đầu trong lĩnh vực này đang giữ kín thông tin quan trọng liên quan đến những rủi ro tiềm ẩn của AI.
Tin khác cùng chuyên mục
Tin đọc nhiều
Khủng hoảng rò rỉ dữ liệu tại Coupang và những cảnh báo chiến lược cho an ninh mạng quốc gia Vietnet24h - Vụ việc cảnh sát Hàn Quốc mở cuộc điều tra quy mô lớn liên quan đến rò rỉ dữ liệu tại nền tảng thương mại điện tử Coupang – theo thông tin từ Reuters ngày 1/12/2025 – đang thu hút sự chú ý đặc biệt của giới chuyên gia an ninh mạng quốc tế.
Tăng trưởng thị trường trong tương lai phụ thuộc vào máy tính cá nhân tích hợp AI Vietnet24h - Trong quý 3 năm nay, doanh số máy Mac đã tăng gấp đôi, vượt xa tốc độ tăng trưởng của toàn bộ thị trường PC.
Doanh số bán máy Mac của Apple tăng gấp đôi, nhưng Lenovo vẫn dẫn đầu: Tăng trưởng thị trường trong tương lai phụ thuộc vào máy tính cá nhân tích hợp AI Vietnet24h - Công ty công nghệ đa quốc gia của Mỹ, Apple, đang chứng kiến ​​sự tăng trưởng đáng kể về doanh số iPhone.
Liệu AI của Google có còn trung lập khi bị “cấy” quảng cáo? Vietnet24h - Việc tích hợp quảng cáo vào AI Overviews và AI Mode khiến không ít người lo ngại rằng công cụ tìm kiếm của Google đang dần trở thành nền tảng định hướng hành vi tiêu dùng thay vì phản ánh nhu cầu thực sự của người dùng. Phải chăng AI đang bị thương mại hóa quá nhanh, quá sâu?
Sự cố Facebook và lời cảnh tỉnh về rủi ro phụ thuộc vào nền tảng số Vietnet24h - Sau hai ngày hỗn loạn vì loạt nhóm lớn trên Facebook "bay màu" không lý do rõ ràng, cộng đồng mạng Việt Nam có thể tạm thở phào khi các hội nhóm đã được khôi phục. Nhưng phía sau sự phục hồi nhanh chóng đó là những câu hỏi lớn chưa có lời giải – về sự phụ thuộc tuyệt đối vào nền tảng, quyền kiểm soát cộng đồng, và rủi ro ngày càng cao từ những lỗi kỹ thuật “tập trung hóa”.
Phần mềm độc hại SparkKitty: Khi thư viện ảnh trở thành cánh cửa cho tội phạm mạng tấn công ví tiền số Vietnet24h - Sự xuất hiện của SparkKitty – một biến thể mới trong họ trojan SparkCat – đã đánh dấu một bước tiến nguy hiểm trong chiến thuật tấn công mạng. Không chỉ đánh cắp dữ liệu như thông thường, loại mã độc này nhắm đến chính thư viện ảnh cá nhân – một kho lưu trữ tưởng chừng vô hại – để trích xuất những thông tin có thể mở toang cánh cửa vào ví tiền điện tử của nạn nhân.
Lỗ hổng zero-day trên Chrome: Báo động đỏ cho an ninh mạng toàn cầu Vietnet24h - Khi trình duyệt trở thành "cửa ngõ" mặc định để tiếp cận thế giới số, một lỗ hổng zero-day trên Chrome không chỉ đơn thuần là một lỗi kỹ thuật – mà là lời nhắc nghiêm khắc về mức độ mong manh của hệ sinh thái số hiện đại.
Safari và bài toán bảo mật bị bỏ ngỏ: Khi sự im lặng của Apple trở thành rủi ro của người dùng Vietnet24h - Một lỗ hổng trong tính năng toàn màn hình của trình duyệt Safari đang phơi bày hàng triệu người dùng Apple trước những chiến dịch lừa đảo tinh vi. Nhưng điều đáng báo động hơn cả không nằm ở bản thân lỗ hổng – mà ở thái độ có phần thờ ơ của Apple trước cảnh báo từ giới nghiên cứu bảo mật.
Việt Nam vào top 30 thế giới về tốc độ mạng: Nhưng hàng trăm bản làng vẫn mòn mỏi đợi sóng Vietnet24h - Trong khi người dân thành phố tận hưởng Internet 5G tốc độ cao, thì ở Sơn La, hơn 600 thôn bản vẫn chưa có đường truyền mạng. Câu chuyện kết nối số tại Việt Nam vẫn là bức tranh hai mảng sáng – tối, đòi hỏi những hành động quyết liệt hơn từ cơ quan quản lý và doanh nghiệp viễn thông.
Game Pet Samkok chiếm top 1 tại Việt Nam, nổi bật ở Thái Lan và Indonesia Vietnet24h - Chỉ sau một ngày phát hành, Pet Samkok – Báo Thủ 3Q do SohaGame phát triển – đã vươn lên đứng đầu App Store, Google Play tại Việt Nam và được Apple chọn hiển thị nổi bật tại Thái Lan, Indonesia, đánh dấu bước tiến mới của game Việt tại thị trường Đông Nam Á.
Quý III năm 2025 - Quý đầu tiên ngành bán dẫn toàn cầu đạt doanh thu trên 200 tỷ USD. Vietnet24h - Theo báo cáo của Omdia, doanh thu bán dẫn trong quý 3 tăng 14,5% so với quý trước, đạt 216 tỷ đô la, đây là lần đầu tiên doanh thu hàng quý vượt quá 200 tỷ đô la.
Nhu cầu chip AI Trung Quốc khiến NVIDIA “cân đong” sản lượng H200 Vietnet24h - NVIDIA đang xem xét tăng sản lượng chip H200 – dòng chip xử lý AI hiệu năng cao – sau khi nhu cầu từ phía các công ty công nghệ Trung Quốc vượt quá sức cung hiện tại - phản ánh tương tác phức tạp giữa địa chính trị, chuỗi cung ứng toàn cầu và cạnh tranh công nghệ AI.
Cổ phiếu Broadcom giảm 11% bất chấp lợi nhuận ấn tượng, trong khi "nỗi lo ngại về trí tuệ nhân tạo" đè nặng lên Oracle và Nvidia. Vietnet24h - Kết quả kinh doanh tốt hơn mong đợi của Broadcom vẫn không đủ để ngăn các nhà đầu tư ồ ạt bán tháo cổ phiếu.
Samsung và KT xác nhận tính khả thi của công nghệ 6G AI-RAN trên mạng thương mại. Vietnet24h - Samsung Electronics và KT đã chứng minh công nghệ mạng truy cập vô tuyến trí tuệ nhân tạo (AI-RAN) 6G có khả năng hoạt động ổn định trên mạng thương mại của công ty viễn thông.
Nvidia phản hồi về thông tin cho rằng DeepSeek của Trung Quốc đang sử dụng chip AI Blackwell bị cấm của hãng. Vietnet24h - Nvidia đã bác bỏ một báo cáo cho rằng công ty khởi nghiệp AI DeepSeek của Trung Quốc đang sử dụng chip Blackwell nhập lậu để phát triển mẫu sản phẩm sắp ra mắt của mình.
Chu kỳ tăng trưởng mạnh mẽ của bộ nhớ được củng cố khi nhu cầu HBM thúc đẩy lợi nhuận của Samsung và SK Hynix. Vietnet24h - Giá DRAM tăng vọt 420% do nguồn cung wafer chuyển sang sản xuất chip AI, gây ra tình trạng thiếu hụt toàn cầu.
Samsung hướng tới việc giành lại ngôi vương DRAM trong bối cảnh bộ nhớ phục hồi Vietnet24h - Samsung Electronics đang sẵn sàng giành lại vị thế nhà cung cấp DRAM số 1 thế giới trong quý IV, sau nhiều tháng cạnh tranh gay gắt với đối thủ cùng thành phố SK hynix, các nguồn tin trong ngành cho biết hôm Chủ nhật (7/12).
Siêu chu kỳ bộ nhớ được xây dựng khi nhu cầu về HBM thúc đẩy lợi nhuận của Samsung và SK Hynix Vietnet24h - Giá DRAM tăng vọt 420% khi nguồn cung wafer chuyển sang chip AI, gây ra tình trạng thiếu hụt toàn cầu.
Tập đoàn ô tô Hyundai ra mắt nền tảng robot di động tại Nhật Bản Vietnet24h - Tập đoàn ô tô Hyundai của Hàn Quốc cho biết hôm thứ Tư rằng họ đã ra mắt nền tảng robot di động sản xuất hàng loạt đầu tiên, được thiết kế cho nhiều ứng dụng công nghiệp và hàng ngày, tại một triển lãm robot lớn ở Nhật Bản.
Các công ty Hàn Quốc càn quét Giải thưởng Đổi mới CES, dẫn đầu lĩnh vực AI Vietnet24h - Các công ty Hàn Quốc đã chiếm 60% tổng số giải thưởng trong kết quả các giải thưởng đổi mới được công bố trước thềm CES 2026, triển lãm điện tử tiêu dùng và công nghệ thông tin lớn nhất thế giới sẽ được tổ chức tại Las Vegas, Hoa Kỳ vào tháng 1 năm sau.
Điện thoại gập: Từ thử nghiệm đến phân khúc tăng trưởng thực sự Vietnet24h - Bức tranh thị trường mới: tăng trưởng mạnh mẽ, nhưng vẫn là phân khúc nhỏ.
Samsung dẫn đầu thị trường điện thoại màn hình gập toàn cầu trong quý 3 năm nay Vietnet24h - Samsung Electronics Co. đã củng cố vị trí dẫn đầu trên thị trường điện thoại thông minh màn hình gập toàn cầu trong quý 3, theo dữ liệu ngành công nghiệp công bố hôm thứ Bảy (6/12).
IDC cho biết iPhone 17 sẽ thúc đẩy doanh số kỷ lục của Apple vào năm 2025 Vietnet24h - IDC dự báo Apple sẽ xuất xưởng 247,4 triệu chiếc iPhone vào năm 2025, tăng hơn 6% so với cùng kỳ năm trước.
Apple đang thách thức cơ quan chống độc quyền của Ấn Độ về khoản tiền phạt tiềm tàng lên tới 38 tỷ đô la Vietnet24h - Apple đang thách thức luật chống độc quyền của Ấn Độ, theo đó công ty này có thể phải chịu mức phạt 38 tỷ đô la.
Doanh số iPhone của Apple sẽ vượt Samsung lần đầu tiên sau 14 năm Vietnet24h - Counterpoint Research cho biết Apple sẽ xuất xưởng khoảng 243 triệu chiếc iPhone trong năm nay so với 235 triệu chiếc của Samsung.
Điện thoại thông minh gập ba của Samsung sẽ được sản xuất với số lượng 'không đáng kể' Vietnet24h - Samsung đã sản xuất từ ​​20.000 đến 30.000 linh kiện cho điện thoại thông minh gập ba, hay còn gọi là điện thoại gập đôi.
iPhone 17 giúp Apple khởi sắc trở lại tại thị trường Trung Quốc Vietnet24h - Trong bối cảnh thị trường điện thoại thông minh Trung Quốc tiếp tục suy giảm, việc Apple ghi nhận mức tăng trưởng 22% doanh số iPhone trong tháng đầu tiên sau khi ra mắt dòng iPhone 17 là một diễn biến đáng chú ý.
Nintendo nâng dự báo doanh số Switch 2 lên 19 triệu máy Vietnet24h - Nintendo vừa công bố nâng dự báo doanh số Switch 2 lên 19 triệu chiếc trong năm tài chính kết thúc tháng 3/2026, tăng từ mức 15 triệu chiếc trước đó.
Doanh số bán iPhone của Apple tăng vọt, lập kỷ lục doanh thu trong quý 4 năm 2025 và triển vọng lạc quan cho năm 2026 Vietnet24h - Từ tháng 7 đến tháng 9, doanh số bán iPhone đã đạt 49,03 tỷ đô la, tăng 6,1% so với mức 46,22 tỷ đô la trong quý IV năm tài chính trước đó.