최신논문
(2023년 7월)딥마인드 유전 프로그래밍 분야의 최신 작업 AutoRobotics-Zero
작성자
admin
작성일
2024-06-25 11:57
조회
596

현실 세계에 배치되는 자율 로봇은 환경 변화에 빠르게 적응하는 제어 정책이 필요합니다. 이를 위해 우리는 제로샷 적응형 정책을 처음부터 발견하는 AutoML-Zero 기반 방법인 AutoRobotics-Zero(ARZ)를 제안합니다. 모델 매개변수만 최적화되는 신경망 적응 정책과 달리 ARZ는 선형 레지스터 시스템의 표현력을 최대한 활용하여 제어 알고리즘을 구축할 수 있습니다. 우리는 갑작스러운 환경 변화에 적응하기 위해 모델 매개변수를 조정하고 추론 알고리즘을 즉시 변경하는 모듈식 정책을 발전시킵니다. 우리는 개별 팔다리가 갑자기 부러질 때 넘어지지 않도록 안전한 제어 정책을 발전시키는 현실적인 시뮬레이션된 4족 보행 로봇에 대한 방법을 시연합니다. 이는 널리 사용되는 두 가지 신경망 기준선이 실패하는 어려운 작업입니다. 마지막으로 Cataclysmic Cartpole이라고 불리는 새롭고 도전적인 비고정 제어 작업에 대한 방법을 자세히 분석합니다. 결과는 ARZ가 갑작스러운 환경 변화에 훨씬 더 강력하고 간단하고 해석 가능한 제어 정책을 구축할 수 있다는 우리의 연구 결과를 확인시켜 줍니다.
전체 0