Công nghệ robot tự học di chuyển trên mọi địa hình. Mới đây các nhà khoa học từ Google và Berkeley mới phát mình ra một loại robot. Có thể tự học cách di chuyển ở hầu hết mọi địa hình. Dựa trên nguyên lý của kỹ thuật có tên gọi là tự học tăng cường sâu tên tiếng anh là “deep Reinforcement Learning”. Những kỹ thuật này trước đây phải được mô phỏng, lập trình trên máy tính. Mà giờ đây đã có thể tự áp dụng cho robot tự học điều đó. Học tăng cường với học sâu, giúp quy mô của học máy truyền thống được mở rộng khá nhiều với sức mạnh tính toán dữ liệu to lớn.
Table of Contents
Công nghệ robot tự học cách di chuyển
Rainbow Dash có thể đi bộ trên nhiều bề mặt như tấm nệm xốp hoặc thảm lau chân với nhiều điểm gấp khúc ngẫu nhiên. Lĩnh vực chế tạo robot đã ngày càng tiến bộ. Trong đó có con robot mang lên Rainbow Dash với khả năng tự học cách đi bộ. Mẫu robot bốn chân này chỉ cần vài giờ để học cách đi lùi và tiến, rẽ phải và trái. Các nhà nghiên cứu từ Google, UC Berkeley và viện công nghệ Georgia. Đã xuất bản một bài báo trên trang ArXiv mô tả một kỹ thuật AI thống kê được gọi là học tăng cường sâu. Mà họ đã sử dụng để tạo ra thành tựu robot thông minh thế hệ mới.
Hầu hết các kỹ thuật tự học thông minh trước đây. Đều diễn ra trong môi trường mô phỏng máy tính. Tuy nhiên, Rainbow Dash đã sử dụng công nghệ này để học cách đi bộ trong môi trường vật lý thực tế. Hơn nữa, nó có thể làm như vậy mà không cần một cơ chế giảng dạy chuyên dụng. Chẳng hạn như người hướng dẫn hoặc dữ liệu lập trình sẵn. Rainbow Dash đã thành công khi đi bộ trên nhiều bề mặt. Bao gồm nệm xốp mềm và thảm lau chân với nhiều điểm gấp khúc ngẫu nhiên.
Kỹ thuật học sâu của robot
Các kỹ thuật học sâu mà robot sử dụng bao gồm. Một loại học máy thử đúng và sai liên tục bằng cách tương tác nhiều lần với môi trường. Cách này tương tự như các trò chơi máy tính dùng phương pháp kỹ thuật số. Học cách chơi để giành chiến thắng. Hình thức học máy này khác biệt rõ rệt với học tập có giám sát. Hoặc không giám sát truyền thống. Trong đó các mô hình học máy đòi hỏi dữ liệu đào tạo phải được phân định rõ ràng. Học tăng cường sâu kết hợp các phương pháp học tăng cường với học sâu. Trong đó quy mô của học máy truyền thống được mở rộng đáng kể bằng sức mạnh của các phép tính toán khổng lồ.
Mặc dù nhóm nghiên cứu cho rằng Rainbow Dash đã học cách tự đi lại. Sự can thiệp của con người vẫn đóng một vai trò quan trọng trong việc đạt được mục tiêu đó. Các nhà nghiên cứu đã phải tạo ra các đường ranh giới. Robot phải học cách đi bộ để giữ cho nó không rời khỏi khu vực. Họ cũng đã phải nghĩ ra các thuật toán cụ thể để ngăn robot rơi xuống. Một trong số đó là tập trung vào việc kìm hãm chuyển động của robot. Để ngăn ngừa tai nạn và thiệt hại do rơi xuống. Việc học tăng cường robot thường diễn ra trong môi trường kỹ thuật số. Trước khi các thuật toán được chuyển sang dạng vật lý để bảo vệ sự an toàn của robot.
Tương lai cho công nghệ robot tự học
Thành công của Rainbow Dash đạt được sau khoảng một năm. Các nhà nghiên cứu tìm ra cách cho robot học môi trường vật lý thực tế thay vì dạng ảo như trước đây. Chelsea Finn, giáo sư trợ lý Stanford liên kết với Google nói: “Loại bỏ con người khỏi quá trình học tập của robot là điều thực sự khó khăn. Bằng cách cho phép robot học tự chủ. Nó có thể hoạt động gần gũi hơn với khả năng học sâu tăng cường trong thế giới thực“.
“Mặc dù nhiều thuật toán học tập không giám sát hoặc học tập củng cố sâu đã được chứng minh trong mô phỏng, nhưng việc áp dụng chúng trên robot trong các thử nghiệm thực tiễn là không hề đơn giản. Đầu tiên, học củng cố sâu đòi hỏi lượng dự liệu đào tạo đầu vào rất lớn, và việc thu thập dữ liệu robot cũng rất tốn kém.
Thứ hai, quá trình đào tạo đòi hỏi phải dành nhiều thời gian để giám sát robot. Nếu chúng ta cần một người giám sát robot và tự thiết lập lại nó mỗi khi nó vấp ngã – hàng trăm hoặc hàng ngàn lần – sẽ mất rất nhiều nỗ lực và thời gian để huấn luyện robot. Càng mất nhiều thời gian, việc mở rộng quy mô học tập cho robot trong nhiều môi trường khác nhau sẽ càng trở nên khó khăn”, Jie Tan, một trong những kỹ sư chủ chốt của dự án cho biết.