Tuần này, thành phố Las Vegas, Hoa Kỳ, đã khoác lên mình bộ phim khoa học viễn tưởng.
Robot hình người tập đấm bốc, nhảy múa và giả vờ điều hành các cửa hàng nhỏ. Công ty Sharpa của Singapore đã trưng bày một bàn tay robot chơi bóng bàn và chia bài blackjack.
Khắp Las Vegas, các công ty công nghệ đã sử dụng triển lãm thương mại CES thường niên để tiết lộ tầm nhìn về tương lai và tuyên bố mạnh mẽ rằng trí tuệ nhân tạo vật lý đang sẵn sàng cho một năm bùng nổ.
“Ngành công nghiệp robot hình người đang dựa trên công việc của các nhà máy AI mà chúng ta đang xây dựng cho các ứng dụng AI khác,” Giám đốc điều hành Nvidia, Jensen Huang, cho biết tại một cuộc họp báo hôm thứ Ba.
Nvidia, công ty năm ngoái đã trở thành công ty có giá trị nhất thế giới, đã công bố phiên bản mới của mô hình ngôn ngữ thị giác mang tên Gr00t dành cho robot hình người, có khả năng chuyển đổi dữ liệu đầu vào từ cảm biến thành điều khiển chuyển động cơ thể robot, cũng như một phiên bản của mô hình Cosmos dành cho khả năng suy luận và lập kế hoạch của robot.
Ông Huang cho biết ông kỳ vọng sẽ thấy những robot có một số khả năng ngang tầm con người trong năm nay.
“Tôi biết công nghệ đang phát triển nhanh như thế nào,” ông nói. Công ty của ông nhấn mạnh các mối quan hệ đối tác với các tập đoàn như Boston Dynamics, Caterpillar và LG.
Các nhà văn khoa học viễn tưởng đã mơ về khoảnh khắc này trong nhiều thập kỷ. Trong phim hoạt hình “The Jetsons” có Rosey, một người máy giúp việc. Trong “Star Wars”, C-3PO đã giúp Luke Skywalker cứu lấy thiên hà. Tuy nhiên, trong thực tế, robot hình người cho đến nay vẫn chưa thể thể hiện được trí thông minh hoặc sự linh hoạt cần thiết để trở nên thực sự hữu ích, một vấn đề mà các kỹ sư đã trăn trở từ lâu.
Rồi trí tuệ nhân tạo tạo sinh (generative AI) xuất hiện với sự ra mắt của ChatGPT của OpenAI vào cuối năm 2022. Công nghệ học sâu tương tự được sử dụng trong ChatGPT có thể được dùng để dạy robot cách đi bộ, sử dụng tay hoặc gấp quần áo. Nhiều người trong ngành coi ô tô tự lái là biểu hiện thương mại lớn đầu tiên của trí tuệ nhân tạo vật lý.
Các ông lớn trong ngành đang đầu tư mạnh.
Ngoài Nvidia, các nhà sản xuất chip khác như Advanced Micro Devices và Qualcomm cũng đã có những thông báo gây tiếng vang liên quan đến robot tại CES. Hôm thứ Hai, DeepMind của Google cho biết họ sẽ hợp tác với Boston Dynamics của Hyundai, trước đây là một bộ phận của Google, để phát triển các mô hình AI mới cho robot Atlas của mình.
McKinsey ước tính rằng thị trường cho cái mà họ gọi là robot đa năng có thể đạt 370 tỷ đô la vào năm 2040, với các trường hợp sử dụng hàng đầu bao gồm “logistics kho bãi, sản xuất nhẹ, hoạt động bán lẻ, nông nghiệp và chăm sóc sức khỏe”.
Nhưng một số nhà phân tích nhanh chóng chỉ ra rằng còn một chặng đường dài từ sàn triển lãm đến nhà máy, hoặc đến gia đình.
“Mặc dù robot hình người là thứ thu hút sự chú ý của mọi người, và đó là loại hình bắt mắt nhất của triển lãm, nhưng chúng ta vẫn còn một chặng đường rất, rất dài để có thể thương mại hóa chúng”, Ben Wood, nhà phân tích trưởng tại CCS Insight, cho biết trong một cuộc phỏng vấn.
Xây dựng bộ não
Theo danh sách các nhà triển lãm chính thức của CES, 40 công ty tại sự kiện đã đề cập đến robot hình người trên trang web của triển lãm. Hiệp hội Công nghệ Tiêu dùng (CTA), đơn vị tổ chức CES, chưa cho biết có bao nhiêu công ty robot hình người đã trình bày tại sự kiện năm nay, nhưng Chủ tịch CTA Kinsey Fabrizio cho biết số lượng robot công nghiệp và tiêu dùng tại triển lãm đang tăng lên.
Hôm thứ Hai, CEO của AMD, Lisa Su, đã tiết lộ một robot hình người mới từ Generative Bionics của Ý, một công ty mà AMD đang hỗ trợ tài chính. Robot này, có tên Gene.01, dự kiến sẽ được triển khai vào cuối năm nay trong các môi trường công nghiệp như xưởng đóng tàu.
Công ty Generative Robotics đang sử dụng bộ xử lý đồ họa (GPU) dựa trên nền tảng đám mây của AMD để huấn luyện và tinh chỉnh các mô hình của mình.
“Điều này cho phép chúng tôi tùy chỉnh thế hệ mô hình tiếp theo trên GPU của họ,” Giám đốc điều hành của Generative Robotics, Daniele Pucci, cho biết. “Đó chính là bộ não.”
Hiện tại, doanh số bán chip robot chỉ chiếm một phần nhỏ trong hoạt động kinh doanh của Nvidia, và AMD báo cáo chúng là doanh số bán hàng “nhúng”, thuật ngữ dùng cho chip công nghiệp. Doanh thu “internet vạn vật” của Qualcomm chiếm khoảng 18% doanh thu của công ty trong năm tài chính gần nhất.
Nhưng họ nhìn thấy cơ hội giành được khách hàng từ một nhóm các nhà sản xuất robot mới bằng cách cung cấp cho họ không chỉ chip, mà còn toàn bộ hệ sinh thái phần mềm để giúp việc phát triển dễ dàng hơn.
“Tất cả điều này là về việc bất kỳ người chơi lớn nào tự thiết lập mình như một điểm đến duy nhất cho cộng đồng phát triển robot,” Wood nói.
Trong khi ngành công nghệ đang say mê các mô hình ngôn ngữ lớn trong sự bùng nổ của trí tuệ nhân tạo tạo sinh, nhiều robot đang được hỗ trợ bởi các mô hình ngôn ngữ thị giác. Chúng có thể kết hợp dữ liệu cảm biến từ robot với các mô hình trí tuệ nhân tạo truyền thống để cho phép suy luận hoặc lập kế hoạch, chẳng hạn như tìm đường đi qua một sàn nhà lộn xộn đầy chướng ngại vật.
Cùng với những thông báo về VLM của Nvidia tại CES, Qualcomm đã giới thiệu dòng chip robot mới có tên Dragonwing, có thể sử dụng VLM của công ty. Qualcomm đang sử dụng điều khiển từ xa để dạy cho VLM những kỹ năng cụ thể, chẳng hạn như cách sử dụng bộ truyền động để nắm bắt vật thể.
Một lĩnh vực đặc biệt thu hút sự chú ý của Nvidia là y học.
Công ty đã trưng bày một robot từ công ty LEM Surgical sử dụng chip Thor của họ. Robot này được mô tả là hình người, nhưng nó không có chân. Thay vào đó, nó có ba cánh tay, hai cánh tay để sử dụng dụng cụ và một cánh tay điều khiển một mô-đun giống khuôn mặt gồm camera và cảm biến. Chức năng duy nhất của nó là hỗ trợ các bác sĩ trong phẫu thuật cột sống.
Ở khu vực triển lãm khác, Nvidia đã trình diễn một robot hình người của Trung Quốc có tên Agibot, sử dụng mô hình ngôn ngữ phức tạp để trò chuyện với người tham dự, mặc dù nó gặp khó khăn khi đứng trên thảm trải sàn sang trọng của trung tâm hội nghị.
Những gì robot có thể làm được ngay bây giờ
Cũng tại triển lãm, LG của Hàn Quốc lần đầu tiên giới thiệu robot hình người có bánh xe CLOiD.
Trong buổi trình diễn, CLOiD, được thiết kế cho gia đình, hứa sẽ làm bữa sáng và lấy một chiếc khăn ướt từ người thuyết trình rồi cho vào máy giặt.
Nhưng nó hoạt động chậm. Gấp một chiếc khăn hình chữ nhật được người thuyết trình trải ra mất khoảng 30 giây.
Tốc độ không phải là mối lo ngại duy nhất. Các chuyên gia cũng lo lắng về sự an toàn và những thiệt hại mà robot gia dụng có thể gây ra.
“Gia đình rất thiếu cấu trúc,” Jeff Burnstein, chủ tịch Hiệp hội Phát triển Tự động hóa, cho biết. “Bạn không thể lên kế hoạch cho việc một đứa trẻ chạy vào robot hoặc robot cán qua thú cưng.”
Một số robot hình người đầu tiên trên thị trường có thể thiên về sự thú vị và hào nhoáng hơn là năng suất. Công ty Unitree Robotics của Trung Quốc đã trưng bày robot G1 trị giá 70.000 đô la tại CES. Đám đông lớn đã được thưởng thức màn trình diễn đấm bốc và khiêu vũ ngay trên sàn triển lãm.
Các công ty công nghệ lớn nhất thế giới đang đặt cược rằng thị trường đang phát triển nhanh chóng. Ông Huang của Nvidia cho biết tuần này rằng robot đang trải qua "khoảnh khắc ChatGPT" của riêng mình.
Modar Alaoui, đối tác quản lý tại ALM Ventures, nhận thấy robot đang nhanh chóng chuyển từ sự mới lạ sang thực tế.
"Thế hệ tiếp theo sẽ lớn lên cùng những cỗ máy này dù chúng ta có chấp nhận hay không," ông nói.