Tiêu dùng
Câu chuyện từ chương trình Singer 2024: AI gặp lỗi khi làm bài toán đơn giản
Phan Khôi - Thứ Sáu, 19/07/2024 7:00 CH
Vietnet24h - Trong bối cảnh AI đang dần trở thành công cụ hữu ích giúp con người xử lý nhiều công việc phức tạp, một tình huống bất ngờ xảy ra khi các mô hình trí tuệ nhân tạo gặp khó khăn với một bài toán đơn giản: so sánh 9,9 và 9,11.
Theo SCMP, câu chuyện bắt đầu từ chương trình truyền hình thực tế Singer 2024 do Đài truyền hình Hồ Nam sản xuất và phát sóng cuối tuần trước ở Trung Quốc. Trong chương trình, thí sinh Sun Nan nhận được 13,8% lượt bình chọn trực tuyến, vượt qua thí sinh người Mỹ Chanté Moore với 13,11% phiếu bầu. Tuy nhiên, điều này đã gây ra một làn sóng chỉ trích trên mạng xã hội khi nhiều người cho rằng "11 phải lớn hơn 8", ý nói thí sinh Moore biểu diễn tốt hơn nhưng lại thua.
 
Sự việc trở nên thú vị hơn khi một số người dùng thử hỏi các mô hình AI phổ biến về vấn đề này và nhận được kết quả bất ngờ. Hai chatbot phổ biến tại Trung Quốc là Kimi của Moonshot AI và Baixiaoying của Baichuan đều trả lời sai rằng 9,11 lớn hơn 9,9. Điều này đã dẫn đến một loạt phàn nàn từ người dùng, buộc các nhà phát triển phải sửa thuật toán và đưa ra lời xin lỗi.
 
Nguyên nhân của sai sót này được giải thích là do phương pháp "chuỗi suy nghĩ" mà các AI sử dụng. Cụ thể, khi tách số sau dấu phẩy, AI so sánh 11 với 9 và kết luận rằng 11 lớn hơn, dẫn đến khẳng định sai lầm rằng 9,11 lớn hơn 9,9. Một số mô hình AI như Qwen LLM của Alibaba phải sử dụng Python Code Interpreter để tính toán câu trả lời, trong khi Ernie Bot của Baidu phải thực hiện một quá trình diễn giải phức tạp mới đưa ra đáp án đúng.
 
Trái ngược, một số AI khác lại trả lời chính xác khá nhanh. Doubao LLM của ByteDance đưa ra ví dụ dễ hiểu: "Nếu bạn có 9,90 đô la Mỹ và 9,11 đô la Mỹ, rõ ràng 9,90 nhiều hơn".
 
Tại Việt Nam, người dùng cũng thử nghiệm với các mô hình AI phổ biến và nhận được kết quả tương tự. ChatGPT chạy GPT-3.5 và GPT4-o đều phản hồi sai rằng 9,9 bé hơn. Các mô hình khác như Claude 3.5, Sonnet và Mistral AI cũng trả lời không chính xác, trong khi Gemini của Google đưa ra đáp án đúng.
Theo Wu Yiquan, nhà nghiên cứu khoa học máy tính tại Đại học Chiết Giang, việc AI không giỏi toán rất phổ biến do các mô hình ngôn ngữ lớn (LLM) không sở hữu khả năng toán học thực sự. Chúng dự đoán câu trả lời dựa trên dữ liệu đào tạo mà không hiểu sâu về toán học. "Một số LLM hoạt động tốt trong bài kiểm tra toán có thể là do 'nhiễm dữ liệu', nghĩa là thuật toán đã ghi nhớ câu trả lời vì các câu hỏi tương tự đã có trong dữ liệu đào tạo của nó", Yiquan giải thích.
 
Trước đó, trên mạng xã hội X, nhà nghiên cứu Bill Yuchen Lin của Allen Institute và kỹ sư Riley Goodside của Scale AI cũng đã nêu ra những thiếu sót cơ bản về toán học của LLM. Cả hai cho rằng người dùng không nên tin tưởng hoàn toàn vào các mô hình AI, bởi chúng nhiều lần bị phát hiện trả lời sai hoặc gặp tình trạng "ảo giác", tức là bịa ra câu trả lời sao cho nghe có vẻ thuyết phục nhất.
Trí tuệ nhân tạo thúc đẩy làn sóng đầu tư mạo hiểm tại Mỹ Vietnet24h - Lĩnh vực trí tuệ nhân tạo đang làm nên cơn sốt đầu tư tại Mỹ, khi dòng vốn mạo hiểm đổ vào công nghệ này đạt mức cao nhất trong hai năm qua. Sự phục hồi ấn tượng này không chỉ phản ánh niềm tin của các nhà đầu tư mà còn mở ra triển vọng tăng trưởng đầy hứa hẹn cho ngành công nghiệp AI.
Tin khác cùng chuyên mục
Tin đọc nhiều
Sony hé lộ màu sắc mới cho tai nghe WH-1000XM6: Liệu màu hồng cát có phải là xu hướng tiếp theo? Vietnet24h - Những tuần gần đây, Sony đã có một lịch trình dày đặc, với việc ra mắt LinkBuds Clip vào tháng trước, một đoạn teaser cho sự ra mắt được mong đợi của tai nghe cao cấp và những đồn đoán đầu tiên về điện thoại thông minh Xperia 1 VIII và Xperia 10 VIII.
Samsung nhắm đến Roborock với robot hút bụi mới tích hợp trí tuệ nhân tạo Vietnet24h - Số liệu ngành cho thấy Roborock hiện đang thống trị thị trường robot hút bụi Hàn Quốc, nắm giữ hơn 50% thị phần.
Samsung muốn nói gì về "trí tuệ nhân tạo tác nhân" trong dòng Galaxy S26 sắp ra mắt? Vietnet24h - Tháng trước, Samsung Electronics đã ăn mừng lợi nhuận quý IV kỷ lục, phần lớn nhờ nhu cầu chip nhớ tăng mạnh, nhưng bức tranh lại không mấy khả quan đối với bộ phận điện thoại thông minh của hãng.
Apple 2026: Giai đoạn “đa chiều hoá sản phẩm” và củng cố hệ sinh thái Vietnet24h - Apple đang chuẩn bị cho một năm 2026 năng động với loạt sản phẩm mới, phản ánh định hướng chiến lược rõ rệt: đa dạng hoá danh mục thiết bị, cân bằng giữa dòng cao cấp và phổ thông, và củng cố trải nghiệm hệ sinh thái xuyên suốt.
Dyson thiết kế robot hút bụi phù hợp với thói quen lau nhà bằng khăn ướt của người Hàn Quốc Vietnet24h - Dyson đã gia nhập thị trường máy hút bụi robot đầy cạnh tranh của Hàn Quốc với một sản phẩm hứa hẹn sẽ chủ động loại bỏ vết bẩn và liên tục kiểm tra xem việc loại bỏ đã thành công hay chưa.
Samsung Galaxy S26 Plus sẽ sở hữu màn hình 6,66 inch Vietnet24h - Mẫu điện thoại sắp ra mắt của Samsung, Galaxy S26 Plus, thuộc dòng Galaxy S26 mới, sẽ sở hữu màn hình 6,66 inch, giống như Galaxy S25 Plus.
Dự án máy sấy quần áo thế hệ tiếp theo của Samsung sẽ nhận được sự hỗ trợ từ Bộ Năng lượng Hoa Kỳ (DOE) Vietnet24h - Dự án nghiên cứu máy sấy quần áo thế hệ tiếp theo của Samsung Electronics sẽ nhận được sự hỗ trợ từ Bộ Năng lượng Hoa Kỳ (DOE), công ty cho biết hôm thứ Năm.
Google ra mắt tính năng Trí tuệ Cá nhân trong ứng dụng Gemini, cạnh tranh trực tiếp với tính năng Intelligence của Apple. Vietnet24h - Google cho biết công cụ Trí tuệ Cá nhân mới của họ hiện đang trong giai đoạn thử nghiệm beta trên ứng dụng Gemini và sẽ được tích hợp vào Chế độ AI vào cuối năm nay.
SK Telecom ra mắt trợ lý ảo thế hệ mới trên xe hơi. Vietnet24h - SK Telecom đã giới thiệu trợ lý trí tuệ nhân tạo (AI) trong xe hơi, A. Auto, đưa sản phẩm này ra thị trường thông qua việc triển khai trên mẫu xe Filante mới ra mắt của Renault Korea.
Home Companion: Thấu hiểu về Samsung Bespoke AI 2026 Vietnet24h - Đội ngũ lãnh đạo ngành hàng Thiết bị Kỹ thuật số của Samsung nhấn mạnh những cải tiến hàng đầu và tầm nhìn về ngôi nhà thông minh tương lai
iPhone Air sau 4 tháng: có đáng mua ở thời điểm này? Vietnet24h - Apple từng kỳ vọng iPhone Air — chiếc iPhone mỏng nhất và nhẹ nhất từ trước đến nay — sẽ mở ra một phân khúc mới giữa các mẫu iPhone truyền thống.
Indonesia tạm thời chặn truy cập vào Grok vì nội dung khiêu dâm Vietnet24h - Hôm thứ Bảy, Indonesia đã tạm thời chặn chatbot Grok của Elon Musk do lo ngại về nội dung khiêu dâm do trí tuệ nhân tạo tạo ra, trở thành quốc gia đầu tiên từ chối quyền truy cập vào công cụ AI này.
MacBook Pro 14-inch và chiến lược “ổn định hóa đỉnh cao” của Apple trong kỷ nguyên Apple Silicon Vietnet24h - MacBook Pro 14-inch không mang đến cuộc cách mạng về thiết kế. Tuy nhiên, chính sự “không đổi” này lại phản ánh một thông điệp rõ ràng: Apple đã đạt đến độ chín của nền tảng phần cứng.
Đánh giá iPhone Air: Thiết kế siêu mỏng có đáng để đánh đổi không? Vietnet24h - Apple lần đầu tiên trình làng iPhone Air với thiết kế siêu mỏng chỉ 5,6 mm — điểm nhấn lớn về mặt thẩm mỹ và cảm giác cầm. Tuy nhiên, mức độ mỏng này đi kèm với một số “hy sinh” đáng kể so với dòng Pro của hãng.
EVA Air cấm ký gửi tai nghe Bluetooth Vietnet24h - Theo hãng hàng không, các thiết bị điện tử như tai nghe Bluetooth phải được để trong hành lý xách tay.
Oppo Find X9 Pro: Siêu phẩm “điên rồ” nhất 2025, pin 7.500 mAh, camera 200 MP, giá gần 42 triệu đồng Vietnet24h - Siêu phẩm Trung Quốc này mang đến pin 7.500 mAh trong thân máy mỏng 8 mm, màn hình sáng 3.600 nits, camera tele 200 MP cùng hiệu năng “khủng” từ chip MediaTek Dimensity 9500.
Đánh giá iPad Pro 13 inch (M5): Siêu mạnh, siêu thừa, siêu đắt! Vietnet24h - Apple lại tiếp tục “đốt tiền” vào chip khủng cho thiết bị bị… kìm hãm bởi hệ điều hành. iPad Pro 13 inch (M5) chính là minh chứng rõ nhất.
Google Pixel Watch 4: Kẻ Thay Đổi Cuộc Chơi Trong Ngành Đồng Hồ Thông Minh Vietnet24h - Google Pixel Watch 4 đánh dấu bước đột phá, khắc phục các hạn chế của các phiên bản trước, mang đến trải nghiệm đồng hồ thông minh hoàn chỉnh.
Apple Watch Series 11 Đối Đầu Series 10: Bước Tiến Nhỏ, Hiệu Quả Lớn Vietnet24h - Apple tiếp tục giữ đúng nhịp độ ra mắt thường niên với Apple Watch Series 11, đã trình làng vào tháng 9 vừa qua.
Samsung Galaxy S24 Plus Giảm Sốc 10 Triệu: Flagship Cao Cấp Giá Tầm Trung, Dùng Tốt Đến 2031! Vietnet24h - Hà Nội, ngày 3/10/2025 – Với mức giá giảm từ 27 triệu xuống chỉ còn 16 triệu đồng, Samsung Galaxy S24 Plus đang gây bão tại Việt Nam, trở thành “ngôi sao” flagship giá rẻ, ngang ngửa máy tầm trung nhưng hiệu năng và trải nghiệm vượt xa.