최신논문
구글, 인간 수준 경쟁 로봇 탁구 달성
작성자
하이룽룽
작성일
2024-08-08 10:58
조회
461
https://arxiv.org/abs/2408.03906
실제 세계 작업에서 인간 수준의 속도와 성능을 달성하는 것은 로봇 연구 커뮤니티의 북극성입니다. 이 연구는 그 목표를 향한 한 걸음을 내딛고 경쟁 탁구에서 아마추어 인간 수준의 성능을 달성한 최초의 학습된 로봇 에이전트를 제시합니다. 탁구는 인간 선수가 고급 수준의 숙련도를 달성하기 위해 수년간의 훈련을 받아야 하는 신체적으로 힘든 스포츠입니다. 이 논문에서 우리는 (1) (i) 에이전트의 역량을 모델링하고 시뮬레이션 대 실제 격차를 메우는 데 도움이 되는 자세한 기술 설명자가 있는 저수준 컨트롤러, (ii) 저수준 기술을 선택하는 고수준 컨트롤러로 구성된 계층적이고 모듈식 정책 아키텍처, (2) 실제 세계에 기반을 둔 작업 분포를 정의하고 자동 커리큘럼을 정의하는 반복적 접근 방식을 포함하여 제로샷 시뮬레이션 대 실제를 가능하게 하는 기술, (3) 보이지 않는 상대에 대한 실시간 적응을 제공합니다. 정책 성과는 로봇이 45%(13/29) 승리한 29회의 로봇 대 인간 경기를 통해 평가되었습니다. 모든 인간은 보이지 않는 플레이어였고, 그들의 기술 수준은 초보자에서 토너먼트 수준까지 다양했습니다. 로봇은 가장 진보된 플레이어와의 모든 경기에서 졌지만, 초보자와의 경기에서는 100%, 중급 플레이어와의 경기에서는 55%의 경기에서 승리하여, 견고한 아마추어 인간 수준의 성과를 보여주었습니다. 경기 영상은 이 URL 에서 볼 수 있습니다.
실제 세계 작업에서 인간 수준의 속도와 성능을 달성하는 것은 로봇 연구 커뮤니티의 북극성입니다. 이 연구는 그 목표를 향한 한 걸음을 내딛고 경쟁 탁구에서 아마추어 인간 수준의 성능을 달성한 최초의 학습된 로봇 에이전트를 제시합니다. 탁구는 인간 선수가 고급 수준의 숙련도를 달성하기 위해 수년간의 훈련을 받아야 하는 신체적으로 힘든 스포츠입니다. 이 논문에서 우리는 (1) (i) 에이전트의 역량을 모델링하고 시뮬레이션 대 실제 격차를 메우는 데 도움이 되는 자세한 기술 설명자가 있는 저수준 컨트롤러, (ii) 저수준 기술을 선택하는 고수준 컨트롤러로 구성된 계층적이고 모듈식 정책 아키텍처, (2) 실제 세계에 기반을 둔 작업 분포를 정의하고 자동 커리큘럼을 정의하는 반복적 접근 방식을 포함하여 제로샷 시뮬레이션 대 실제를 가능하게 하는 기술, (3) 보이지 않는 상대에 대한 실시간 적응을 제공합니다. 정책 성과는 로봇이 45%(13/29) 승리한 29회의 로봇 대 인간 경기를 통해 평가되었습니다. 모든 인간은 보이지 않는 플레이어였고, 그들의 기술 수준은 초보자에서 토너먼트 수준까지 다양했습니다. 로봇은 가장 진보된 플레이어와의 모든 경기에서 졌지만, 초보자와의 경기에서는 100%, 중급 플레이어와의 경기에서는 55%의 경기에서 승리하여, 견고한 아마추어 인간 수준의 성과를 보여주었습니다. 경기 영상은 이 URL 에서 볼 수 있습니다.
전체 0