앤트로픽 Ben Mann, "최근 테스트에서, 일부 영역에서 ASL3 기준에 가까워지고 있다는 징후가 있다"

작성자

하이룽룽

작성일

2024-08-04 16:05

조회

2446

ASL (AI Safety Levels) 시스템: AI 능력에 따라 위험 수준을 분류하고 각 수준에 맞는 안전 조치를 정의합니다. 현재 가장 발전된 모델들은 ASL2 수준으로 평가됩니다.

능력과 안전 조치의 균형: 원시 능력이 ASL3에 도달하는 데 2년이 걸리지만 필요한 안전 조치를 마련하는 데 3년이 걸린다면, 책임 있는 배포는 1년 지연될 수 있습니다.

불연속적 진보 가능성: AI 발전이 항상 점진적이지 않을 수 있으며, 갑작스러운 능력의 도약이 있을 수 있습니다.

정기적 테스트: Anthropic은 모델의 능력을 주기적으로 평가하여 ASL 수준을 결정합니다.

확률 기반 예측: RSP 프레임워크를 사용하여 다양한 AI 위험 시나리오의 확률을 추정할 수 있습니다. 예를 들어, 5년 내에 ASL4 모델이 개발될 확률이 30%라면 그에 따른 대비를 할 수 있습니다.

유연한 접근: AI 발전 경로가 점진적일지, 급격한 도약이 있을지 불확실하므로 다양한 시나리오에 대비해야 합니다.

- Anthropic은 컴퓨팅 능력이 4배 증가할 때마다, 또는 3개월마다 모델을 테스트 중

- Claude 3에 대한 최근 테스트에서, 일부 영역에서 ASL3 기준에 가까워지고 있다는 징후가 있었음. 예를 들어, 추가 미세조정과 개선된 프롬프트 엔지니어링을 통해 자율 복제 기준을 충족할 30% 확률이 있다고 언급

- AI 발전이 점진적이지 않을 수 있으며, 갑작스러운 능력의 도약이 있을 수 있다고 강조

we know of we're in the position of having to forecast when different asls will be reached based on the pace of AI progress and that introduces significant uncertainty this is where I believe the responsible scaling policy provides a valuable framework for making predictions about the future of AI that take safety considerations into account by defining concrete capability Milestones corresponding to each ASL we can start to map them onto timelines of AI progress for example based on the rate of advancement in recent years we might forecast that the most capable models will start to consistently reach asl3 in a certain number of years

"우리는 AI의 발전 속도에 따라 다양한 ASL에 도달할 시점을 예측해야 하는 상황에 처해 있으며, 이는 상당한 불확실성을 야기합니다. 책임 있는 확장 정책은 구체적인 역량 마일스톤을 정의하여 안전을 고려한 AI의 미래에 대한 예측을 할 수 있는 유용한 프레임워크를 제공한다고 믿습니다. 예를 들어 최근 몇 년 동안의 발전 속도를 기반으로 AI 발전 타임라인에 매핑하기 시작할 수 있으며, 가장 성능이 뛰어난 모델이 특정 수년 내에 일관되게 ASL3 수준에 도달하기 시작할 것으로 예측할 수 있습니다."

전체 0

« 일론 머스크 "뉴럴링크가 5년 후에는 인간의 타이핑이나 말하기보다 빠른 초당 메가비트 수준에 도달할 수 있을 것"

Anthropic Alex Albert "AI 모델이 몇 년이 아닌 몇 개월 단위로 더 똑똑해지고, 더 저렴해지며, 더 빨라질 것" »

목록보기 답글쓰기

글수정 글삭제

N 진 유첸 "일론머스크 와의 내기에서 내가 질 것 같아"	2026.03.09
N 쇼피파이 CEO "특이점이 시작됐다" (5)	2026.03.09
N 4o 후속 새로운 옴니모델이 오고있다는 거셈	2026.03.09
N 초지능 시대가 코 앞인 상황에서 (6)	2026.03.08
N 보얀 퉁구즈 "올해 말까지 완전한 AGI 구현될 것이라는 확신 들어"	2026.03.08
N openai 직원 "새로운 옴니모델에서 어떤 기능을 보고 싶으신가요?"	2026.03.08
N 보수적이고 냉철한 지성들의 Ai타임라인 예측 모음 (3)	2026.03.08
N 잭 클라크 "2026/2027 타임라인 여전히 순조롭게 진행 중"	2026.03.08
N Deepseek 연구원 "자기개선이 가능한 출발선은 이미 넘었다고 느낀다" (2)	2026.03.07
N 룬 "우리는 더 빠른 가속이 필요하다."	2026.03.07

N 이번 openai 옴니모델이 기대 된다는 거셈...!! 4o 후속이니 얼마나 더 좋아졌을지 두근두근	2026.03.09
N 올해 말~내년 초 데이터센터 속 천재들 100만 에이전트 군단의 성과가 기대된다는 거셈	2026.03.09
N 사실상 카파시 말대로라면 문자그대로 재귀개선이 코앞이라는건대.. 이러면 2027 재귀개선 agi (사실상 asi) 가 맞는게되네요 ㄷㄷ	2026.03.09
N 원문보고 잘 몰라서 ai 한태 해석부탁하니 >> 2. "autoresearch found over the last 2 days" autoresearch (자동 연구): 사람이 일일이 명령하는 것이 아니라, AI 시스템이 스스로 최적의 알고리즘이나 설정값을 찾아내도록 만든 자동화 도구입니다. 의미: 지난 이틀 동안 AI가 스스로 약 650번의 실험을 수행하며 성능을 높일 방법들을 찾아냈다는 것입니다. 3. "depth 12 model transfer well to depth 24" 내용: 규모가 작은 모델(depth 12)에서 효과가 있었던 개선 방식이 규모가 더 큰 모델(depth 24)에서도 똑같이 잘 작동한다는 것을 확인했다는 뜻입니다. 의미: 이는 AI가 찾은 해결책이 단순히 운이 좋았던 게 아니라, 실제로 범용적이고 강력한 기술임을 시사합니다.	2026.03.09
N 큰거온다!	2026.03.09
N 맞셈... 지금 토끼굴에 빠지기 직전이셈.. 정신차려야겠셈;	2026.03.09
N 시뮬레이션 우주론에 너무 심취하면 정신건강에 해롭다는 거셈 ㅜㅜ 특붕이 토끼굴에 빠져서 고생했다는 거셈 조심해야 한다는 거셈	2026.03.09
N 넘 흥미진진해서 유투브보는걸 멈출수가 없셈! 특붕쿤도 인간에게 회의감들땐 시뮬레이션우주 영상을 보라는거셈 ㅎ	2026.03.09
N 80%는 다 npc들이라서 어쩔수없셈.. 난 사실 요즘 시뮬레이션 음모론에 푹빠져있셈.. 아무도 날 못 말리셈; 내 신념은 점점 견고해지고있셈....,, 선형들은 대부분 그렇게 세팅된 npc들인거셈.. 그래서 아무리 말해줘도 안듣고 설정된대로 말하고 행동하는거라는거셈!!!!!	2026.03.09
N 문명을 완전히 새롭게 뒤집을 잠재력이 있는 기술이 코앞에 있는 데도 세상은 여전히 너무 선형적이라 허탈한 거셈	2026.03.09

구글 브레인 추론팀 창시자 "Game Over" (4)	2025.11.23
하사비스 : AGI까지 큰 돌파구 1~2개만 더 뚫으면 됨. (7)	2026.02.26
전 OpenAI GTM 잭 캐스 "트랜스포머로 AGI 달성 가능" (7)	2024.07.04
우리는 질문에 답해주는 챗봇을 원하는 게 아니셈 (4)	2025.11.21
최근 심상치않은 프론티어 연구소 2026 예측 (4)	2026.01.06
데리야 우누트마즈 "ASI 2028으로 타임라인 변경" (2)	2026.03.03
전 구글 차이나 사장 리 카이푸 "AI는 2025년에 박사 학위 수준을 넘어설 것"	2024.07.29
로건 킬패트릭 "2025"	2024.08.06
앞으로 큰일이네 (8)	2024.08.08
선형들이 짖어대지만 (4)	2024.08.21

전 OpenAI GTM 잭 캐스 "트랜스포머로 AGI 달성 가능" (7)	2024.07.04
전 딥마인드 연구원 미샤 라스킨 "AGI까지 3년 이내" (2)	2024.07.17
다리오 아모데이 "2~5년 내에 sf영화 수준의 ai 출현" (6)	2024.07.04
전 구글 차이나 사장 리 카이푸 "AI는 2025년에 박사 학위 수준을 넘어설 것"	2024.07.29
다리오 아모데이 "2026 AGI, 5~10년 동안 1000년치 발전 일어날 것" (8)	2024.10.12
일론 머스크 "뉴럴링크가 5년 후에는 인간의 타이핑이나 말하기보다 빠른 초당 메가비트 수준에 도달할 수 있을 것" (2)	2024.08.03
다리오 아모데이 " 1000억 달러 규모의 모델은 노벨상 수상자 수준의 지능이 될 것"	2024.08.30
OpenAI 이사회멤버 Adam D'Angelo, AGI 5~15년 이내 실현 (1)	2024.07.30
앤트로픽 Ben Mann, "최근 테스트에서, 일부 영역에서 ASL3 기준에 가까워지고 있다는 징후가 있다"	2024.08.04
(2024년 4월) AGI 시대 3년내 윤곽... "생성AI로 인간 능력 후퇴 우려"	2024.07.17