(KTSG) - Con robot chỉ có một tay của Google được đặt cạnh chiếc bàn có để ba con thú bằng nhựa: một sư tử, một cá voi và một khủng long. Khi người kỹ sư ra lệnh cho robot “Hãy nhặt lên con thú đã tuyệt chủng”, chú robot chạy rì rì vài giây rồi giương cánh tay ra, chậm rãi kẹp lấy con khủng long và nhấc lên cao.
- Thiếu lao động, doanh nghiệp nhỏ Đức tăng cường sử dụng robot
- Thời của robot cộng tác với con người đang đến
Cuộc biểu diễn do Google trình bày cho báo chí tại California đã không thể nào xảy ra cách đây chỉ vài năm; robot cơ học không thể nào nhận diện và biết “con thú đã tuyệt chủng” chính là con khủng long. Nhưng theo tờ New York Times, một cuộc cách mạng đang âm thầm diễn ra trong lĩnh vực xây dựng robot khi người ta kết hợp các robot tự động với các mô hình ngôn ngữ lớn nằm sau các chương trình trí tuệ nhân tạo (AI) như ChatGPT hay Bard. Google là người tiên phong trong lĩnh vực này khi tích hợp AI vào robot như thể trao cho chúng bộ não thông minh, giúp chúng hiểu biết môi trường chung quanh và giải các bài toán đặt ra cho chúng. Mô hình robot mới nhất Google dùng trong buổi biểu diễn là RT-2.
Vincent Vanhoucke, người đứng đầu bộ phận robot của Google DeepMind, cho biết sự tích hợp thành công này buộc họ phải xem xét lại toàn bộ chương trình nghiên cứu của họ, vì nhiều điều tưởng đâu là khám phá lớn nay không còn giá trị và những điều trước đây bị xem là rào cản lớn nay được vượt qua một cách dễ dàng. Mặc dù cho đến nay robot chưa có sự khéo léo, linh hoạt như con người, nhưng tích hợp AI vào bên trong chúng đã giúp chúng có được kỹ năng hiểu biết, khả năng điều chỉnh cử chỉ theo lệnh bằng ngôn ngữ - một bước đột phá lớn trong tự động hóa.
Để hiểu được bước ngoặc này, cần biết cách người ta chế tạo robot trước đây như thế nào. Cả chục năm nay, các kỹ sư huấn luyện robot làm một tác vụ cơ học như lật một miếng thịt bằm đang chiên bằng cách lập trình cho chúng theo danh sách các bước thao tác rất cụ thể, thậm chí nâng miếng thịt lên cao bao nhiêu cen ti mét cũng phải ghi ra, lật nó bao nhiêu độ, phải nói cụ thể. Sau đó, robot được cho chạy thử, các kỹ sư quan sát, tinh chỉnh những sai sót nhiều lúc chỉ vì cái kẹp cách miếng thịt vài cen ti mét là đã không thành công. Họ phải thử tới thử lui cho đến khi robot làm được, một quá trình mất thời gian và công sức. Và giả sử thử đổi miếng thịt bằm bằng sườn nướng, các kỹ sư có thể phải làm lại ngay từ đầu.
Cũng chính vì các hạn chế này mà robot phần cứng có những tiến bộ rất chậm so với phần mềm. OpenAI ban đầu cũng có một nhóm chuyên về robot, nhưng đã giải thể vào năm 2021 với lý do tiến triển quá chậm, thiếu dữ liệu chất lượng cao để huấn luyện. Năm 2017, Google bán công ty chuyên chế tạo robot là Boston Dynamics cho Tập đoàn công nghệ SoftBank của Nhật Bản. Nay Boston Dynamics chuyển chủ, thuộc quyền sở hữu của Hyundai và tồn tại dường như chủ yếu để làm các video về các chú robot dẻo dai, linh hoạt.
Các nhà nghiên cứu ở Google bỗng nảy ra ý tưởng, thay vì lập trình cho các tác vụ cụ thể, từng cái, từng cái, tạo sao không dạy cho robot các mô hình ngôn ngữ AI như ChatGPT để chúng tự học các kỹ năng mới. Nỗ lực đầu tiên của Google kết nối AI tạo sinh với robot là một dự án nghiên cứu được đặt tên PaLM-SayCan, ra mắt vào năm ngoái. Dự án này tạo ra sự chú ý của cộng đồng tự động hóa nhưng kết quả không được là bao. Robot chưa có khả năng nhận diện hình ảnh, một kỹ năng thiết yếu nếu muốn chúng hoạt động ngoài đời thật. Chúng có thể viết ra hướng dẫn theo từng bước cho các tác vụ khác nhau nhưng chưa thể biến các bước đó thành hành động cụ thể.
Hollywood đã “huấn luyện” cho con người một nỗi sợ robot hay người máy, như trong loạt phim “Terminator”. Nay ý tưởng trao cho robot khả năng hiểu biết, lập luận, lên kế hoạch rồi thực thi, kể cả tùy biến theo tình huống là ý tưởng có thể gây một nỗi sợ tương tự.
Model robot mới nhất của Google, RT-2 có thể làm được điều đó; tức họ thành công trong việc xây dựng một hệ thống AI không chỉ có khả năng thấy và phân tích thế giới chung quanh mà còn có thể ra lệnh cho robot di chuyển trong thế giới đó. Như ChatGPT hay Bard có thể học để đoán từ gì sẽ xuất hiện tiếp theo từ trước để làm nên bài thơ hay bài luận, RT-2 có thể học để đoán cánh tay của robot sẽ phải di chuyển như thế nào để nhặt trái banh hay ném lon coca rỗng vào thùng rác.
Trong buổi biểu diễn nói trên, robot RT-2 của Google có thể làm được nhiều chuyện, như “di chuyển chiếc xe Volkswagen mô hình đến cạnh lá cờ Đức”. Nó có thể hiểu lệnh nói bằng nhiều loại ngôn ngữ khác nhau và biết gắn kết các thứ trừu tượng như kết nối Lionel Messi với bóng đá. Tuy nhiên nó cũng còn nhiều sai sót như khi được hỏi loại trái cây gì nằm trên bàn, nó chỉ nói “màu trắng” chứ không nhận ra quả chuối.
Google hiện chưa có kế hoạch bán robot RT-2 hay đưa chúng ra giới thiệu với thị trường rộng rãi, nhưng tiềm năng của chúng là rất lớn. Có thể dùng robot như thế trong kho hàng, trong văn phòng, phụ việc nhà hay hỗ trợ người già, người khuyết tật. Dĩ nhiên di chuyển đồ vật ở thế giới thật là phức tạp gấp nhiều lần các thí nghiệm trong phòng, chưa kể hiện tượng “ảo giác” của các mô hình ngôn ngữ có thể dẫn tới hiểu sai, làm sai. Google trang bị cho RT-2 nhiều chức năng an toàn như đằng sau lưng có một nút bấm to màu đỏ để khi cần bấm vào là ngắt kết nối. Hệ thống cũng trang bị nhiều cảm biến để tránh va chạm vào người hay đồ vật khác. Phần mềm cài cho robot có những rào chắn an toàn như ra lệnh cho nó không được nâng thùng đồ lên nếu trong thùng có nước (vì nước có thể gây chạm mạch cho nó).
Hollywood đã “huấn luyện” cho con người một nỗi sợ robot hay người máy, như trong loạt phim “Terminator”. Nay ý tưởng trao cho robot khả năng hiểu biết, lập luận, lên kế hoạch rồi thực thi, kể cả tùy biến theo tình huống là ý tưởng có thể gây ra một nỗi sợ tương tự. Đó cũng là một rào cản nữa mà các chú robot có trang bị AI như RT-2 của Google phải vượt qua.