스콧 아론슨 - 인간이 중요했던 시대의, 어쩌면 마지막 날들로부터

작성자

작성일

2026-05-29 12:09

조회

https://scottaaronson.blog/?p=9782

인간 관련성의 어쩌면 마지막 날들에서 보내는 편지들

대부분의 독자들이 이미 들었겠지만, 이산기하학 분야의 핵심 난제 중 하나인 1946년 폴 에르되시(Paul Erdős)의 **단위 거리 문제(Unit Distance Problem)**가 내부 OpenAI 모델에 의해 풀렸습니다. 에르되시는 평면 상에 $n$개의 점이 주어졌을 때, 단위 거리를 갖는 점들의 쌍이 최대 $n^{1+o(1)}$개를 넘지 않을 것이라고 추측했습니다. 대수적 정수론의 고차원적인 결과들을 활용하여, GPT는 이 추측을 반증하며 단위 거리 쌍이 $n^{1+\varepsilon}$개인 집합을 구성해 냈습니다 (여기서 $\varepsilon \sim 10^{-38}$). 얼마 지나지 않아 윌 사윈(Will Sawin)이라는 인간(!)이 GPT의 구성을 개선하여 ${\sim}n^{1.014}$개의 쌍을 얻어냈습니다. 그 이후 이를 ${\sim}n^{1.034}$까지 추가로 개선했다는 주장도 나왔습니다. 한편, 알려진 최선의 상한선은 에르되시의 $n^{3/2}$을 개선한 $n^{4/3}$에 여전히 머물러 있습니다.

전체 과정은 원샷(one-shot)으로 이루어진 것으로 보입니다. 제 전 제자 리지에 천(Lijie Chen)이 GPT에게 문제를 제시하자, GPT는 잠시 생각한 뒤 수 페이지 분량의 풀이를 출력했고, 인간 전문가들이 검토한 결과 이것이 올바른 것으로 밝혀졌습니다. 물론 여기에는 선택 편향이 있습니다. GPT에게 주어졌지만 풀지 못한 수백 가지 다른 문제들에 대해서는 그만큼 듣지 못하고 있으니까요 (인간도 마찬가지 아닌가요?). 분명히 GPT는, 인간 수학자들이 반례를 찾기보다 에르되시가 옳다는 것을 증명하는 데 대부분의 시간을 낭비했다는 점, 그리고 반례를 찾으려 했더라도 이 반례를 발견하려면 대수적 정수론의 전문가여야 하는데 이산기하학자 중에는 그런 사람이 거의 없다는 점에서 도움을 받았습니다. 그렇다면 어쩌면 AI는 지금 이 순간, 우연한 이유로 인간 수학자들이 놓쳤던 '중간 높이에 달린 과일들'을 따고 있을 뿐인 걸까요? "지금 이 순간"이라는 표현에 방점을 찍으면서.

OpenAI는 함께 발표한 부속 논문에서 티모시 가워스(Timothy Gowers), 노가 알론(Noga Alon), 윌 사윈, 대니얼 리트(Daniel Litt) 등 여러 전문가들의 논평을 수록했습니다. GPT가 이 돌파구에 이르는 과정 (체인 오브 소트를 살펴보면 실제로 확인할 수 있습니다), 그리고 이것이 수학 연구의 미래에 의미하는 바를 다루고 있습니다.

저는 UT 대학원생들이 제 사무실에 소식을 전하러 왔을 때, 뉴스가 터진 지 한 시간쯤 후에 소식을 들었습니다. 참고로 말씀드리자면, 그 학생들은 침울한 표정으로 자신들 같은 젊은 과학자와 수학자들에게 모든 것이 곧 끝날지도 모른다고 중얼거렸습니다. 그들이 옳은지는 모르겠지만, 그들의 반응이 어땠는지 있는 그대로 전해야 할 것 같았습니다.

[업데이트] 뉴스가 제가 글을 쓰는 속도보다 빠르게 쏟아지고 있는데, 오늘은 에르되시의 또 다른 중요한 추측이 반증되었다는 소식이 들어왔습니다. 1970년대 에르되시와 세메레디(Szemerédi)의 **강한 합집합 추측(strong sumset conjecture)**은 $A$가 유한한 실수 집합이라면 $|A+A|$ 또는 $|A \times A|$ 중 적어도 하나는 $|A|^{2-o(1)}$ 이상이어야 한다는 내용이었습니다. 이번 경우에는 앞서 언급한 사윈을 포함한 인간들이 반례 구성 작업의 거의 대부분을 수행했지만, 그들은 GPT의 단위 거리 추측 반증에서 직접적인 영감을 받았습니다. $A$가 정수 집합인 경우에도 그런 반례가 존재하는지는 아직 열린 문제로 남아 있습니다.

며칠 후, 제 UT 오스틴 동료 스와랏 초우두리(Swarat Chaudhuri)를 포함한 딥마인드(DeepMind) 팀이 **알파프루프 넥서스(AlphaProof Nexus)**라는 시스템을 이용해 에르되시의 문제 아홉 개(!)를 추가로 해결했다고 발표했습니다. 그 중 상당수는 가산적 조합론(additive combinatorics) 분야의 문제들이었고, 그 밖에 다양한 열린 수학 문제들도 포함되어 있었습니다. 특히 이번 경우 AI는 증명을 린(Lean)으로 완전히 형식화하기까지 했습니다.

그리고 바로 오늘, 젤라니 넬슨(Jelani Nelson)이 새로운 CS 이론 논문을 알려줬는데, GPT5.5Pro의 증명을 이용해 그래프 위의 전기 흐름(electrical flows)에 관한 오랫동안 풀리지 않던 열린 문제를 해결한 내용이었습니다.

이제 우리는 이 롤러코스터의 정점을 넘어선 것 같고, 바닥이 어디이든 그곳에 닿을 때까지 계속 가속될 것입니다. P 대 NP와 우리의 다른 위대한 문제들에 대한 해답이 이 여정에 포함될지, 즉 인간 수학자로서의 우리의 역할이 기껏해야 어떤 질문이 흥미로운지 결정하고 그 질문에 대한 AI의 답을 이해하는 것으로 축소될지, 기대해야 할지 두려워해야 할지 모르겠습니다.

하지만 어쩌면 그런 일은 일어나지 않을 수도 있습니다. 어쩌면 새로운 AI 수학자들은 곧 벽에 부딪힐 것입니다. 펜로즈(Penrose)와 해머로프(Hameroff)의 계산 불가능한 양자 중력 미세소관, 혹은 다른 어떤 인간만의 마법 성분이 없기 때문에. 놀라운 점은, 어느 쪽이든 우리는 머지않아 경험적으로 알게 될 것이라는 사실입니다.

독자들은 **코먼웰스상(Commonwealth Prize)**이라는 단편 소설 공모전에서 수상한 여러 작품들이 AI가 작성했다는 압도적인 징후를 보인다는 뉴스도 접했을 것입니다. 켈시 파이퍼(Kelsey Piper)의 말을 빌리자면:

수상작들 사이에서 AI 사용으로 지목된 작품들의 문체에는 눈에 띄는 유사점들이 있습니다. AI 챗봇은 은유와 직유를 즐겨 사용하는데, 막연하게 그럴듯하게 들리지만 논리적으로 앞뒤가 맞지 않거나 사물에 어울리지 않는 속성을 부여하는 경우가 많습니다.

「숲속의 뱀」은 "그 소녀는 개수대 위로 떠오르는 일출처럼 미소 지었다"라고 했습니다. 「보루의 그림자」는 "그녀는 이제 그것을 가방 속에 넣어 다녔는데, 부적처럼 무거웠다"라고 합니다. 「메헨디의 밤」은 어떤 것을 "경고 종처럼 회반죽 벽에 부딪혀 흔들리는"이라고 묘사합니다.

이 작품들을 선정한 코먼웰스 재단의 심사위원단은 그다지 명예롭지 않은 행보를 보였습니다. 한편으로는 AI 사용을 엄격히 금지한다고 말하면서도, 다른 한편으로는 아무리 막대한 반증 증거가 있어도 AI를 사용하지 않았다는 작가의 말을 계속 믿겠다고 했습니다. 많은 사람들이 지적했듯이, AI에 더 익숙한 심사위원들이 오히려 그 징후를 더 잘 알아챌 수 있었을 것이라는 아이러니가 있습니다.

AI가 생성한 텍스트를 감지하는 자동화된 방법이 있다면 얼마나 좋을까요. 누군가 그 문제에 진지하게 달려들어야 하지 않을까요?

하지만 어쩌면 그냥 손을 들어버려야 할까요? 이미 학부 과제 맥락에서 일부 동료들이 그렇게 한 것처럼요. 어떤 존재가 만들었든 좋은 이야기는 좋은 이야기라고 그냥 인정해 버려야 할까요?

마침 저는 지난주에, AI가 쓴 이야기로서 진정한 이야기로서 저에게 감동을 준, 한 번 이상 읽고 싶었던 첫 번째 작품을 읽었습니다. GPT5.5Pro에 다음과 같은 간단한 프롬프트를 입력했을 때였습니다:

가장 오래된 이스라엘 사람들에 관한, 성경의 이야기처럼 흥미진진하면서도 모든 고고학적 증거에 부합하는 이야기를 써줘.

결과물은 여기서 읽을 수 있습니다. 제 페이스북 친구 중 한 명은 이것을 "불안할 정도로 훌륭하다"고 했고, 저도 그 평가에 동의합니다. 물론 GPT가 같은 확률 분포에서 샘플링하여 이런 이야기를 천 편도 쉽게 생성할 수 있다는 것을 잘 알고 있습니다. 그러면 어떤 클리셰가 가장 흔한지 통계를 낼 수도 있겠죠. 이렇게 생각하면 우연히 출력된 첫 번째 이야기에 지나치게 의미를 부여하는 것이 어리석게 느껴지지만, 어쩐지 그렇게 되고 말았습니다.

이쯤 되면 레이 커즈와일(Ray Kurzweil) 같은 AI 유토피아 예언자들도, 엘리저 유드코프스키(Eliezer Yudkowsky) 같은 AI 둠 예언자들도 이렇게 물을 만하다고 생각합니다. "이제 우리 말을 들을 건가요? 이 새로운 형태의 지상 지능을 확률론적 앵무새, 우스꽝스러운 사기, 또는 곧 사라질 유행이라고 부르는 것이 여전히 현명하다고 생각하나요? 두려워하든 싫어하든 상관없지만, 최소한 존중은 해야 하지 않겠어요!"

이것이 교황 레오(Pope Leo)가 **"인공지능 시대의 인간 존엄 수호"**라는 제목의 첫 번째 회칙을 발표했다는 지난주의 또 다른 큰 AI 뉴스로 이어집니다. 저는 이것을 읽었는데... 글쎄요, 이런 세상을 바꾸는 기술이 어떤 개인이나 기업의 이익이나 허영(그의 비유대로라면 바벨탑처럼)이 아닌 공동선(교황의 표현대로라면 예루살렘의 성벽처럼)을 위해 개발되어야 한다는 주제에는 분명히 동의합니다. 다른 부분들에 대해서는 다소 이견이 있었습니다. 즈비 모쇼위츠(Zvi Mowshowitz)는 그답게 훌륭한 단락별 분석을 내놓았습니다. 재미있게도, 회칙의 일부가 AI로 작성되었다는 징후도 있습니다.

하지만 저에게 가장 주목할 만했던 부분은, 앤트로픽(Anthropic)의 해석 가능성 팀을 이끄는 크리스 올라(Chris Olah)가 교황 옆에 서서 자신의 발언을 전달했다는 것이었습니다. 앤트로픽이 존재하기 전부터 알고 지냈던 크리스는, 기술적 권위와 도덕적 권위 모두 누구에게도 흠잡힐 데가 없는 최첨단 AI 분야의 드문 인물로, 예상치 못했지만 탁월한 선택이었다고 느꼈습니다.

그래서 인류 역사의 이 중대한 시대에, 다름 아닌 그리스도의 대리자, 최고 성직자, 베드로의 후계자의 권위에 기대어, 저는... 음, 앤트로픽의 크리스 올라와 그의 팀의 지혜와 자비에 몸을 맡기겠습니다.

크리스, 만약 제가 곧 30초의 사고 끝에 리만 가설을 증명하고 양자 중력을 풀 수 있는 존재들과 이 지구를 함께 나눠야 한다면, 부디 당신이 그 존재들을 충분히 이해하여 그들이 우리에게 친절하도록 해주시길 바랍니다.

후기: 이 게시물의 댓글이 제가 블로그에 쓴 특정 AI 성과를 어떻게든 축소하려는 사람들로 가득 찰 것이라고 미리 예상했어야 했는데 그러지 못했습니다. 알고 보니, AI가 에르되시 문제를 풀 수 있다는 것은 그 문제들이 처음부터 대수기하학이나 그로텐디크(Grothendieck) 스타일의 이론 구축 같은 분야와 달리, 결코 "진지한" 수학이 아니었다는 것을 증명할 뿐이라는 겁니다. 제가 공유한 이야기도 뻔한 AI 쓰레기라고 합니다.

AI가 세상에 미치는 영향을 평가할 때 적어도 어느 정도는 미래를 내다봐야 한다는 것, 즉 4년 전과 지금을 비교하며, 더 잘 맞는 지수 곡선은 아니더라도 적어도 데이터를 통과하는 직선을 그려보려고 해야 한다는 것은 너무나 당연하게 여겼습니다.

대수기하학 및 "그로텐디크 친화적" 수학 분야의 주요 열린 문제들이 미래의 AI 모델에 의해 풀릴 것이라는 점을 지금 진지하게 의심하는 사람이 있나요? AI가 쓴 이야기들이 발전하여, AI를 모르는 심사위원들에게서 문학상을 타는 것을 넘어, 댓글 작성자들이 불평하는 그런 특징들마저 사라질 것이라는 점을요? 그리고 그런 일이 일어날 때마다, 당장은 신경 쓸 필요 없다는 새로운 자신감 넘치는 이유가 댓글란에서 즉각 제시될 것이라는 점을요?

아직도 그것을 의심하는 사람들이 있는 것 같습니다. 그래서 포스트에서 펜로즈, 해머로프, 미세소관에 대한 가볍게 던지는 말을 넣은 것이기도 하고요. 그것이 아니라면, 그들은 한계가 어디에 있다고 생각하는 걸까요, 그리고 그 이유는 무엇일까요?

최근에 (진작 언급했어야 했는데) 저는 역대 가장 위대한 사회 실험 중 하나라고 생각하는 것을 발견했습니다. AI가 발전할 때마다 사람들이 보이는 반응을 조명하는 실험입니다. 트위터/X 사용자 JediWolf는 다음과 같은 AI가 생성한 가짜 "모네 그림"을 보여주고, 사람들에게 진짜 모네 그림보다 무엇이 더 나쁜지 설명해 달라고 했습니다.

아직 이 실험을 접한 적이 없다면, 계속 읽기 전에 직접 해보시길 권합니다.

결과는, 수많은 미술 애호가들이 길게 답변을 달았습니다. 평평하고 생기 없고 창의성 없는 AI 쓰레기, 감정 없는 구도, 사라진 불꽃, 평온함의 부재, 거칠음, 깊이와 조화의 결여 등등.

그들이 모두 의견을 말하고 난 후에야 JediWolf는 이것이 실제 모네의 그림임을 밝혔습니다.

전체 0

« 알리바바 Qwen3.7-Max 발표

목록보기 답글쓰기

글수정 글삭제