뉴스/정보
GPT-4o 시스템 카드
작성자
작성일
2024-08-09 09:30
조회
638
https://openai.com/index/gpt-4o-system-card/
GPT-4o 1은 텍스트, 오디오, 이미지, 비디오의 모든 조합을 입력으로 받아들이고 텍스트, 오디오, 이미지 출력의 모든 조합을 생성하는 자기 회귀 옴니 모델입니다. 텍스트, 비전, 오디오에 걸쳐 엔드투엔드로 학습되므로 모든 입력과 출력은 동일한 신경망에서 처리됩니다.
GPT-4o는 평균 320밀리초, 최대 232밀리초 만에 오디오 입력에 응답할 수 있으며 이는 인간의 응답 시간 과 유사합니다.2 대화에서. 영어 텍스트와 코드에서 GPT-4 Turbo 성능과 일치하며, 비영어 언어 텍스트에서 상당한 개선이 이루어졌고, API에서 훨씬 빠르고 50% 저렴합니다. GPT-4o는 기존 모델에 비해 시각 및 오디오 이해에서 특히 뛰어납니다.
백악관 3 에 대한 자발적인 공약과 일관되게 안전하게 AI를 구축하려는 우리의 노력에 따라 우리는 준비 프레임워크를 포함하는 GPT-4o 시스템 카드를 공유하고 있습니다.(새 창에서 열립니다)5개의 평가. 이 시스템 카드에서 우리는 음성 대 음성(음성)에 초점을 맞춰 여러 범주에 걸친 GPT-4o의 기능, 한계 및 안전성 평가를 자세히 살펴보고 텍스트 및 이미지 기능과 안전성과 정렬을 강화하기 위해 취한 조치도 평가합니다. 또한 일반적인 자율 기능에 대한 제3자 평가와 GPT-4o 텍스트 및 비전 기능의 잠재적 사회적 영향에 대한 논의도 포함합니다.
GPT-4o 1은 텍스트, 오디오, 이미지, 비디오의 모든 조합을 입력으로 받아들이고 텍스트, 오디오, 이미지 출력의 모든 조합을 생성하는 자기 회귀 옴니 모델입니다. 텍스트, 비전, 오디오에 걸쳐 엔드투엔드로 학습되므로 모든 입력과 출력은 동일한 신경망에서 처리됩니다.
GPT-4o는 평균 320밀리초, 최대 232밀리초 만에 오디오 입력에 응답할 수 있으며 이는 인간의 응답 시간 과 유사합니다.2 대화에서. 영어 텍스트와 코드에서 GPT-4 Turbo 성능과 일치하며, 비영어 언어 텍스트에서 상당한 개선이 이루어졌고, API에서 훨씬 빠르고 50% 저렴합니다. GPT-4o는 기존 모델에 비해 시각 및 오디오 이해에서 특히 뛰어납니다.
백악관 3 에 대한 자발적인 공약과 일관되게 안전하게 AI를 구축하려는 우리의 노력에 따라 우리는 준비 프레임워크를 포함하는 GPT-4o 시스템 카드를 공유하고 있습니다.(새 창에서 열립니다)5개의 평가. 이 시스템 카드에서 우리는 음성 대 음성(음성)에 초점을 맞춰 여러 범주에 걸친 GPT-4o의 기능, 한계 및 안전성 평가를 자세히 살펴보고 텍스트 및 이미지 기능과 안전성과 정렬을 강화하기 위해 취한 조치도 평가합니다. 또한 일반적인 자율 기능에 대한 제3자 평가와 GPT-4o 텍스트 및 비전 기능의 잠재적 사회적 영향에 대한 논의도 포함합니다.
전체 0