뉴스/정보

OpenAI 규칙 기반 보상을 통한 모델 안전 동작 개선

작성자
하이룽룽
작성일
2024-07-25 01:36
조회
579
https://openai.com/index/improving-model-safety-behavior-with-rule-based-rewards/

 

규칙 기반 보상을 통한 모델 안전 동작 개선

우리는 RBR(Rule-Based Rewards)을 활용하는 새로운 방법을 개발하고 적용했으며, 이 방법은 광범위한 인적 데이터 수집 없이 모델이 안전하게 작동하도록 조정합니다
전체 0