Tiêu dùng
Rủi ro của việc giảm dần dữ liệu văn bản đối với AI
Mộc Đức - Thứ Hai, 10/06/2024 10:49 SA
Vietnet24h - Việc dữ liệu văn bản do con người tạo ra ngày càng trở nên khan hiếm có thể gây rủi ro lớn đối với khả năng phát triển của công nghệ AI. Thông tin này được thể hiện trong báo cáo mới từ Fortune, với sự lo lắng cao độ về thách thức 'Nút thắt cổ chai' đối với các gã khổng lồ công nghệ.
Trong bối cảnh cuộc đua công nghệ AI đang diễn ra sôi động, một thách thức mới đã xuất hiện trên chân trời: 'Nút thắt cổ chai' đang đặt ra những rủi ro không nhỏ cho các gã khổng lồ công nghệ như Google và Meta. Theo một báo cáo mới từ Fortune, dữ liệu văn bản do con người tạo ra đang dần trở nên khan hiếm, đe dọa đến khả năng phát triển của AI.
 
Nhóm nghiên cứu Epoch, trong báo cáo công bố ngày 6/6, cảnh báo rằng vào khoảng năm 2026-2032, các công ty có thể sẽ đối mặt với tình trạng hết dữ liệu để đào tạo AI. AI tạo sinh (GenAI) đang được coi là "cơn sốt vàng" mới, nhưng cuộc chạy đua khai thác dữ liệu có thể khiến nguồn tài nguyên này cạn kiệt nhanh chóng.
 
Trong ngắn hạn, các công ty như OpenAI và Google đang nỗ lực bảo vệ nguồn dữ liệu của mình, thậm chí không ngần ngại chi trả để tiếp cận dữ liệu chất lượng cao cho việc đào tạo AI. Hình ảnh CEO OpenAI Sam Altman và CEO Microsoft Satya Nadella tại một sự kiện của OpenAI vào tháng 6/2023 là minh chứng cho mối quan hệ hợp tác sâu rộng giữa các công ty hàng đầu trong lĩnh vực này.
 
Tamay Besiroglu, tác giả chính của nghiên cứu, nhấn mạnh rằng trong tương lai, sẽ không còn đủ nguồn dữ liệu mới từ các bài viết, blog, tin tức và bình luận trên mạng xã hội để duy trì đà tăng trưởng của AI. Ông cảnh báo rằng khi thông tin nhạy cảm hoặc riêng tư không thể sử dụng, "nút thắt cổ chai" sẽ ngày càng trở nên rõ ràng.
 
Besiroglu cũng đưa ra quan điểm: "Nếu chúng ta gặp hạn chế về lượng dữ liệu, việc mở rộng các mô hình AI sẽ trở nên bất khả thi." Các nghiên cứu chỉ ra rằng, dữ liệu chất lượng cao dưới dạng văn bản có thể sẽ không đủ để "nuôi" cỗ máy AI vào năm 2026, đặt ra một thách thức lớn cho các công ty như OpenAI, Google, Meta và Microsoft trong cuộc đua AI.
 
Tuy nhiên, không phải tất cả đều đồng tình với quan điểm về "nút thắt cổ chai" trong ngành AI. Nicolas Papernot, phó giáo sư về kỹ thuật máy tính tại Đại học Toronto, cho rằng: "Chúng ta không nhất thiết phải đào tạo các mô hình ngày càng lớn hơn. Có thể phát triển các hệ thống AI chuyên biệt cho từng nhiệm vụ cụ thể." Ông cũng bày tỏ lo ngại rằng việc đào tạo nhiều hệ thống AI trên cùng một kho dữ liệu có thể làm giảm hiệu suất mô hình, thậm chí dẫn đến "sụp đổ mô hình". Ông cảnh báo rằng việc đào tạo AI dựa trên dữ liệu do chính nó tạo ra có thể làm sâu thêm những sai lầm của trí tuệ nhân tạo, như phân biệt chủng tộc và sai lệch thông tin.
Selena Deckelmann, Giám đốc sản phẩm và công nghệ của Wikipedia, nhấn mạnh: "Con người đang tạo ra một dạng tài nguyên mới - dữ liệu. Tại Wikipedia, chúng tôi đặt ra hạn chế đối với cách các công ty sử dụng nội dung do con người biên soạn, nhằm bảo vệ nguồn dữ liệu và khuyến khích tình nguyện viên tiếp tục đóng góp nội dung chất lượng cao." Bà cũng chỉ ra rằng điều quan trọng là làm sao để nội dung do con người tạo ra không chỉ tồn tại mà còn được truy cập một cách công bằng.
 
Nhóm nghiên cứu Epoch cũng đưa ra quan điểm rằng việc các công ty trả tiền cho hàng triệu người tạo văn bản có thể không phải là giải pháp tiết kiệm chi phí. OpenAI đang tiếp cận vấn đề này theo một cách mới: CEO Sam Altman đã tuyên bố sử dụng dữ liệu tổng hợp để đào tạo AI tại một sự kiện của Liên Hợp Quốc. Dữ liệu tổng hợp bao gồm cả nội dung do con người và AI tạo ra, kể cả những nội dung kém chất lượng.
 
Altman không phủ nhận những thách thức liên quan đến việc này. Ông nhấn mạnh rằng các công ty như OpenAI cần phải cân nhắc việc giảm bớt sự phụ thuộc vào dữ liệu và tập trung vào việc cải thiện mô hình AI. "Sẽ có những điều bất ngờ xảy ra nếu chúng ta đào tạo mô hình AI dựa trên kho dữ liệu tổng hợp," Altman nói. "Chưa chắc chắn liệu sáng kiến này có mang lại hiệu quả tốt hay không."

Cuộc đua công nghệ AI đang đối mặt với một nút thắt cổ chai nghiêm trọng - sự khan hiếm dữ liệu văn bản do con người tạo ra. Điều này đặt ra thách thức lớn cho các công ty công nghệ, đặc biệt là các gã khổng lồ như Google và Meta, khi họ phụ thuộc vào dữ liệu chất lượng cao để phát triển AI. Để vượt qua nút thắt này, các công ty cần phải sáng tạo trong việc thu thập, xử lý và sử dụng dữ liệu. Điều này có thể bao gồm việc đầu tư vào công nghệ tổng hợp dữ liệu, hợp tác với các tổ chức phi lợi nhuận để thu thập dữ liệu cộng đồng, hoặc phát triển các giải pháp AI có khả năng học hiệu quả với lượng dữ liệu nhỏ hơn. Ngoài ra, cần phải chú trọng đến việc đảm bảo quyền riêng tư và bảo mật dữ liệu, đồng thời thúc đẩy sự phát triển của các tiêu chuẩn đạo đức trong lĩnh vực AI.
OPPO công bố cam kết giúp mọi người có thể sử dụng điện thoại AI, mang các tính năng AI sáng tạo đến khoảng 50 triệu người dùng vào năm 2024 Vietnet24h - Được thúc đẩy bởi niềm tin rằng điện thoại thông minh là thiết bị AI cá nhân quan trọng nhất, OPPO đang đưa AI tổng hợp vào tất cả các dòng sản phẩm điện thoại thông minh OPPO khi hãng cam kết mang điện thoại AI đến với mọi người.
Sự thật đằng sau AI: một cảnh báo từ những người trong cuộc Vietnet24h - Trong bối cảnh công nghệ AI đang phát triển với tốc độ chóng mặt, một nhóm gồm 13 chuyên gia và cựu chuyên gia đến từ OpenAI và Google DeepMind đã lên tiếng, bày tỏ quan ngại sâu sắc về việc các công ty hàng đầu trong lĩnh vực này đang giữ kín thông tin quan trọng liên quan đến những rủi ro tiềm ẩn của AI.
Tin khác cùng chuyên mục
Tin đọc nhiều
Màn hình gập tiếp theo của Samsung: Ba cách Vietnet24h - Ra mắt tại hội nghị thượng đỉnh APEC ở Gyeongju, điện thoại gập ba của Samsung báo hiệu chương tiếp theo trong đổi mới màn hình gập.
Cách mạng hóa hành trình rèn luyện sức khỏe của bạn với Huấn luyện viên sức khỏe cá nhân tiên tiến được hỗ trợ bởi AI của Fitbit Vietnet24h - Fitbit ra mắt bản xem trước công khai của Huấn luyện viên Sức khỏe Cá nhân chạy bằng Gemini.
Samsung, Google, Qualcomm hợp tác để cạnh tranh với Apple trong cuộc đua XR Vietnet24h - Hôm thứ Tư tuần này (22/10), Samsung Electronics đã ra mắt Dự án Moohan, chiếc kính thực tế mở rộng được mong đợi từ lâu, đánh dấu bước tiến táo bạo của hãng vào cuộc đua công nghệ nhập vai đầy rủi ro mà Vision Pro của Apple đang thống trị.
Lần đầu tiên OpenAI “đánh thẳng” vào Google Chrome: trình duyệt AI mới và cơn sóng đầu tư toàn cầu Vietnet24h - OpenAI vừa chính thức phát hành trình duyệt web trên nền tảng trí tuệ nhân tạo mang tên ChatGPT Atlas — một bước đi rõ ràng nhằm thách thức vị thế thống trị của Google Chrome trong thị trường trình duyệt.
Honda Motor Co., Ltd. tung sản phẩm cắt cỏ “phi người lái” tại Mỹ – bước đột phá trong thiết bị cảnh quan chuyên nghiệp Vietnet24h - Hãng Honda vừa công bố sẽ ra mắt toàn cầu dòng máy cắt cỏ ngồi lái sử dụng pin mang tên ProZision tại triển lãm Equip Exposition 2025 diễn ra từ 21‑24/10/2025 tại Louisville, Kentucky (Mỹ).
Apple thách thức Qualcomm với modem nội bộ trong iPad Pro M5 mới Vietnet24h - Chiếc iPad Pro M5 mới nhất của Apple đã được ra mắt, thể hiện một nâng cấp "chip-and-ship" khá nhỏ nhặt mà hầu hết người dùng có thể bỏ qua.
AI Đang Thay Đổi Cuộc Chơi Tìm Việc: Từ Sơ Yếu Lý Lịch Đến Ảnh Chân Dung Vietnet24h - Công nghệ trí tuệ nhân tạo (AI) đang làm thay đổi cách chúng ta tiếp cận thị trường lao động.
Microsoft mang “Copilot + Manus” lên Windows 11, đưa AI vào trung tâm trải nghiệm người dùng Vietnet24h - Microsoft vừa công bố một loạt tính năng AI mới dành cho Windows 11, trong đó nổi bật là việc thử nghiệm “Copilot Manus” — một bước tiến nhằm biến mọi máy tính Windows 11 thành trung tâm AI cá nhân.
Anthropic ra mắt Claude Haiku 4.5, một mô hình AI nhỏ hơn và rẻ hơn Vietnet24h - Anthropic đã công bố Claude Haiku 4.5, một mô hình trí tuệ nhân tạo nhỏ hơn, rẻ hơn và dành cho tất cả người dùng.
Đánh Giá iPhone 17: Lựa Chọn Hoàn Hảo Nhất Của Apple Năm 2025 Vietnet24h - Apple đã chính thức ra mắt dòng iPhone 17 vào ngày 19/9/2025, sau đợt đặt trước từ 12/9, mang đến một thiết bị cân bằng hoàn hảo giữa giá cả và hiệu năng.
EVA Air cấm ký gửi tai nghe Bluetooth Vietnet24h - Theo hãng hàng không, các thiết bị điện tử như tai nghe Bluetooth phải được để trong hành lý xách tay.
Oppo Find X9 Pro: Siêu phẩm “điên rồ” nhất 2025, pin 7.500 mAh, camera 200 MP, giá gần 42 triệu đồng Vietnet24h - Siêu phẩm Trung Quốc này mang đến pin 7.500 mAh trong thân máy mỏng 8 mm, màn hình sáng 3.600 nits, camera tele 200 MP cùng hiệu năng “khủng” từ chip MediaTek Dimensity 9500.
Đánh giá iPad Pro 13 inch (M5): Siêu mạnh, siêu thừa, siêu đắt! Vietnet24h - Apple lại tiếp tục “đốt tiền” vào chip khủng cho thiết bị bị… kìm hãm bởi hệ điều hành. iPad Pro 13 inch (M5) chính là minh chứng rõ nhất.
Google Pixel Watch 4: Kẻ Thay Đổi Cuộc Chơi Trong Ngành Đồng Hồ Thông Minh Vietnet24h - Google Pixel Watch 4 đánh dấu bước đột phá, khắc phục các hạn chế của các phiên bản trước, mang đến trải nghiệm đồng hồ thông minh hoàn chỉnh.
Apple Watch Series 11 Đối Đầu Series 10: Bước Tiến Nhỏ, Hiệu Quả Lớn Vietnet24h - Apple tiếp tục giữ đúng nhịp độ ra mắt thường niên với Apple Watch Series 11, đã trình làng vào tháng 9 vừa qua.
Samsung Galaxy S24 Plus Giảm Sốc 10 Triệu: Flagship Cao Cấp Giá Tầm Trung, Dùng Tốt Đến 2031! Vietnet24h - Hà Nội, ngày 3/10/2025 – Với mức giá giảm từ 27 triệu xuống chỉ còn 16 triệu đồng, Samsung Galaxy S24 Plus đang gây bão tại Việt Nam, trở thành “ngôi sao” flagship giá rẻ, ngang ngửa máy tầm trung nhưng hiệu năng và trải nghiệm vượt xa.
Phong trào toàn cầu bảo vệ trẻ em trực tuyến thúc đẩy làn sóng công nghệ an toàn AI Vietnet24h - Một phong trào toàn cầu nhằm bảo vệ trẻ em an toàn trực tuyến đang ngày càng phát triển, với các quy định mới nghiêm ngặt được đưa ra tại Vương quốc Anh và Hoa Kỳ.
Galaxy Watch8 series trở thành trợ thủ công nghệ mới của các tín đồ biohacking Vietnet24h - Biohacking hay ‘hack tuổi sinh học’ là việc biến dữ liệu sức khỏe cá nhân thành những thay đổi nhỏ mỗi ngày nhằm cải thiện thể chất và kéo dài tuổi thọ.
Apple cân nhắc khôi phục dịch vụ sửa chữa iPad tại cửa hàng vào cuối năm Vietnet24h - Apple đang đẩy mạnh dịch vụ khách hàng bằng cách có thể thay đổi cách thức xử lý việc sửa chữa iPad tại Hoa Kỳ.
Galaxy S26 Pro tỏa sáng trong báo cáo về pin, trong khi S26 Edge gặp nhiều thách thức Vietnet24h - Tin đồn đang lan truyền rằng dòng Galaxy S26 sắp ra mắt có thể sẽ giới thiệu bốn mẫu máy ấn tượng, phá vỡ bộ ba truyền thống.