앤트로픽 레드팀 리더 "1년 안에 Mythos는 아마 꽤 멍청해 보일 것"

작성자

하이룽룽

작성일

2026-05-14 08:29

조회

많은 사람들이 Mythos, Glasswing, 그리고 우리가/파트너들이 수정 중인 취약점들에 대해 궁금해해왔습니다. 오늘 우리는 그 이야기를 더 공유하기 시작하게 되어 매우 기대됩니다. (참고로 저는 @AnthropicAI 에서 Glasswing을 이끌고 있습니다.)

이번 주 XBOW와 영국 AI Security Institute(AISI)의 두 독립 평가 결과는 우리가 내부적으로 보고 있던 것을 확인해주었습니다. Claude Mythos Preview는 자율 사이버보안 능력에서 ‘단계적 도약(step change)’입니다. 우리는 이런 수준의 능력을 가진 모델들이 존재하는 세계를 매우 빠르게 대비하기 시작해야 합니다.

영국 AI Security Institute는 우리가 Project Glasswing 출시 때 제공했던 모델을 테스트했고, Mythos Preview가 그들의 end-to-end 사이버 레인지 두 개를 모두 해결한 최초의 모델이라는 사실을 확인했습니다. 그중 하나인 Cooling Tower는 이전까지 어떤 모델도 통과하지 못했던 과제였습니다. 그런데 공격자와 방어자는 모두 비용과 복잡성의 제약을 받습니다. Mythos는 그들이 의도적으로 낮게 설정한 250만 토큰 제한 아래에서, 8시간 이상 걸리는 것으로 추정된 모든 작업을 완료한 유일한 모델이기도 했습니다.

XBOW는 자사 공격 보안 벤치마크에서 Mythos를 테스트했고, “토큰 대비 전례 없는 정밀도(token-for-token, unprecedented precision)”라고 평가했습니다. 또한 미묘한 V8 샌드박스 작업에 성공한 유일한 모델이기도 했습니다.

다른 Glasswing 파트너들도 비슷한 이야기를 공유했습니다. 몇 주간의 테스트 동안 Mythos Preview는 수천 개에 달하는 (추정상) high/critical 심각도의 취약점을 발견하는 데 도움을 주었고, 어떤 경우에는 평소 1년 동안 찾던 양의 두 배를 찾아내기도 했습니다.

제가 이 이야기를 공유하는 이유는 Mythos를 홍보하기 위해서가 아닙니다. 사실 이건 Mythos 자체에 대한 이야기가 아닙니다. 이것은 양면적(dual-use) 능력 분야에서 최고의 인간 전문가들보다 더 뛰어나고, 더 빠르고, 더 저렴하며, 더 창의적인 모델들이 등장하는 세계를 준비하자는 이야기입니다. 분명히 우리는 가능한 한 안전한 방식으로, 그리고 특히 자원이 가장 부족한 방어자들에게 이런 모델들을 지원 수단으로 제공해야 합니다.

1년 안에 Mythos는 아마 꽤 멍청해 보일 것입니다. (더 새로운 모델들과 비교하면 말이죠.) 그리고 다른 곳에서는 Mythos 수준의 능력을 가진 모델을 공개적으로 혹은 가드레일 없이 배포할 수도 있습니다.

우리가 Project Glasswing을 시작한 이유는 Mythos Preview 같은 능력이 희귀한 상태로 남아있지 않을 것이며, 신중한 손 안에만 머무르지도 않을 것이기 때문입니다. 우리는 책임감 있는 방식으로 가능한 한 빠르게 방어자들에게 이를 제공하려 하고 있으며, 동시에 적절한 안전장치, 패치 및 취약점 공개 프로세스 같은 것들을 어떻게 설계해야 할지도 연구하고 있습니다.

그리고 분명히 말하지만, 우리의 롤아웃에서 컴퓨팅 자원이 제한 요소였던 적은 한 번도 없습니다.

며칠 내로 Glasswing 작업에 대한 더 자세한 업데이트를 공유할 예정입니다.

XBOW 보고서: xbow.com/blog/mythos-of…

UK AISI 보고서: aisi.gov.uk/blog/how-fast-…

전체 0

« 메타연구원 "어쩌면 그보다 더 빨리"

목록보기 답글쓰기

글수정 글삭제

N 앤트로픽 레드팀 리더 "1년 안에 Mythos는 아마 꽤 멍청해 보일 것"	08:29
N 다니엘 코코타일로 “사람들은 SF처럼 들리는 이야기를 진지하게 받아들이는 데 강한 거부감을 가지고 있습니다. 바로 그 점 때문에 지난 10년 동안 AI 발전에 대해 사람들이 그렇게 많이 틀렸다고 생각합니다.” (1)	2026.05.13
N 특붕이 보안기사 땄지만 (3)	2026.05.13
N 남은 시간이 촉박함 (2)	2026.05.12
N UBI (4)	2026.05.12
N 2026 재귀개선 AGI - 2027초지능 올듯요?. (11)	2026.05.12
N Thinking Machines 오디오·비디오·텍스트를 실시간으로 동시에 받아들이고, 생각하고, 말하고, 행동할 수 있는 모델 발표	2026.05.12
N Gemini Omni: 새로운 비디오 모델 등장	2026.05.11
N 딥마인드 야오순위 2026년 모델 전망: “finite context로 훈련하고, infinite context처럼 쓰는 방향이 중요하다” (1)	2026.05.11
N 올해 무한에 가까운 컨텍스트 나온다는데? (2)	2026.05.11

N 기사 자격증 3개 ㅅㅂ 술람이 개열심히 살고있었노	05:25
N ㄹㅇ이긴함 공감된다	05:25
N 난 준비 됐단말이셈 ㅠㅠ	01:35
N 일리야, 야콥, 투워렉 모두 딥러닝 굇수들이라 OpenAI에 모두 그대로 남아있었으면 구글 제미니 기도 못펴고 잡아먹었을 것 같다는 거셈.. 컴퓨팅 부족 때문에 떠난 것 같아 너무 아쉬움 더 많은 컴퓨팅을 확보해야 한다는 것이셈 그리고 일리야는 어서 새로운 산 꼭대기에서 특붕이들에게 멋진 경관을 보여달라는 것이셈	2026.05.13
N 개인적인 생각인대 일리야 퇴사후 트윗이나 뭐 레딧에서 oai 끝났다 뭐 이런소리나왔는대 ai발전이 늦춰지거나 벽에 막히긴 커녕 o1 - o3 나오고 gpt 5.5로 sota 먹고 그런거보면 제 개인적으로 일리야가 엄청난 인재 이고 공을 세웠지만 OAI 진짜 본체이자 두뇌는 야콥이 아니였을까싶은.. (연구 부사장 제리 투와렉도 연구 방향성때문에 야콥이랑 마찰있었는대 알트만이 야콥 선택해서 퇴사한걸로 아는대 그후 5.5 나 코덱스들보면 그 선택이 맞았던거같기도하고요 ) 특히SSI 침묵기간이 너무길어요... 올해 재귀개선온다 뭐 이런소리 나오는대 정말 초지능 오기전에 뭐가 보여주긴할지 .. 하사비스는 이제 인터뷰 나와서 공개적으로 2030전 AGI 언급하고 그러는대 일리야는 뭐 진짜 지하실에서 연금술이라도 하는건지..	2026.05.13
N 일리야가 그리운 밤이셈 요즘 SSI에서 뭐하고 지내는지 궁금	2026.05.13
N 마음이 아프셈 ㅠㅠ	2026.05.13
N 현재 미출시 된 미토스보다 더 강력한 모델이 내부적으로 존재한다고 가정하면 올해 말까지 데이터센터 속 천재들 시나리오는 가능해 보인다는 거셈 얼른 재귀개선으로 더 빠른 가속이 시작되면 좋겠다는 거셈...	2026.05.13
N oai 지하실에서 gpt 개발한 초창기 영웅들인대 외모나 육신은 껍데기에 불과한 지성체들인듯요.	2026.05.13
N 올해 챗지피티 모먼트 올거같셈? ㅠㅠ 너무 지치셈	2026.05.13

구글 브레인 추론팀 창시자 "Game Over" (4)	2025.11.23
하사비스 : AGI까지 큰 돌파구 1~2개만 더 뚫으면 됨. (7)	2026.02.26
전 OpenAI GTM 잭 캐스 "트랜스포머로 AGI 달성 가능" (7)	2024.07.04
우리는 질문에 답해주는 챗봇을 원하는 게 아니셈 (4)	2025.11.21
최근 심상치않은 프론티어 연구소 2026 예측 (4)	2026.01.06
데리야 우누트마즈 "ASI 2028으로 타임라인 변경" (2)	2026.03.03
최근 카파시도그렇고 진짜 (1)	2026.03.10
앤트로픽 내부적으로는 6~12개월 이내 AGI 달성할 것으로 예상한다고 해 (8)	2026.03.31
N 2026 재귀개선 AGI - 2027초지능 올듯요?. (11)	2026.05.12
전 구글 차이나 사장 리 카이푸 "AI는 2025년에 박사 학위 수준을 넘어설 것"	2024.07.29