인터뷰/예측
테렌스 타오 "세상은 지금 정말, 정말 예측 불가능합니다."
작성자
하이룽룽
작성일
2026-03-21 10:14
조회
11
전체 내용 요약
1) 케플러 이야기로 시작: “과학은 천재적 직관만이 아니라, 데이터와 검증의 산물이다”
대화는 케플러가 어떻게 행성운동 법칙을 발견했는지에서 시작한다.테렌스 타오는 케플러를 단순히 “법칙을 직감적으로 떠올린 천재”로만 보지 않는다. 케플러는 코페르니쿠스의 지동설 위에서 출발했고, 처음에는 행성 궤도가 완전한 원이며, 그 사이에 플라톤 입체가 들어맞는다는 매우 아름답고도 다소 신비주의적인 이론을 믿고 있었다고 설명한다.
즉, 처음의 케플러는 지금 기준으로 보면 상당히 미학적·형이상학적 편향을 가지고 있었다.
하지만 결정적 전환점은 티코 브라헤의 초정밀 관측 데이터였다.
브라헤는 막대한 자원을 들여 오랜 세월 동안 맨눈으로 행성 데이터를 축적했고, 그 데이터의 정밀도는 이전 시대보다 훨씬 높았다. 케플러는 결국 그 데이터를 바탕으로 자신의 아름다운 이론이 틀렸음을 인정해야 했고, 수년간의 시행착오 끝에 행성 궤도는 원이 아니라 타원이며, 면적속도 일정 법칙, 나아가 나중에는 **주기-거리 관계(제3법칙)**까지 찾아냈다.
핵심은 이것이다.
- 좋은 아이디어만으로는 부족하다.
- 고품질 데이터
- 정교한 검증
- 여러 잘못된 가설을 버리는 인내
- 그리고 마지막에야 나오는 설명 이론
2) 드워키시의 문제제기: “케플러는 고온(high-temperature) LLM 같았다”
드워키시는 케플러를 일종의 “고온 LLM”에 비유한다.즉, 케플러는 수많은 엉뚱하거나 이상한 관계를 마구 시도했고, 그 중 다수는 말이 안 됐지만, 검증 가능한 데이터셋이 있었기 때문에 결국 맞는 경험 법칙을 찾을 수 있었다는 것이다.
이 비유의 요지는 다음과 같다.
- 미래의 AI도 엄청난 수의 엉뚱한 가설을 생성할 수 있다.
- 그 가설들 대부분은 쓸모없을 수 있다.
- 하지만 브라헤의 데이터 같은 검증 인프라가 있으면,
- 그중 일부 경험 법칙은 실제 과학 발전의 씨앗이 될 수 있다.
먼저 경험적 규칙성을 대량 발굴하고,
그 뒤 인간이나 다음 단계 AI가 이를 더 깊은 이론으로 연결할 수 있다는 시각이다.
3) 타오의 핵심 관점: 이제 과학의 병목은 ‘아이디어 생성’이 아닐 수도 있다
타오는 여기에 부분적으로 동의하면서도 중요한 수정을 가한다.전통적으로 과학사는 “유레카의 순간”, 즉 아이디어 생성을 가장 위대한 부분으로 서술해왔다.
하지만 실제 과학은 훨씬 많은 단계로 이루어져 있다.
- 좋은 문제를 고르는 일
- 데이터 수집
- 분석 전략 설계
- 가설 생성
- 검증
- 설명과 서술
- 공동체 설득
문제는 그 다음 단계다.
- 무엇을 믿어야 하는가?
- 무엇이 의미 있는 진전인가?
- 무엇이 우연한 수치적 착시인가?
- 무엇이 장기적으로 다른 분야에까지 파급되는 개념인가?
4) 케플러의 제3법칙과 보데의 법칙: 적은 데이터는 쉽게 ‘가짜 규칙성’을 만든다
타오는 케플러 제3법칙을 현대적으로 보면, 사실상 6개 정도의 데이터 포인트를 가지고 한 회귀(regression) 와 비슷하다고 말한다.이건 놀랍지만, 동시에 매우 위험하다. 데이터가 너무 적기 때문이다.
이를 보여주는 역사적 사례가 보데의 법칙이다.
- 행성 간 거리가 어떤 등비수열 패턴을 따른다고 본 이론이 있었고,
- 심지어 발견되지 않은 천체의 존재까지 예측하는 듯 보였다.
- 실제로 몇몇 발견은 그 패턴과 들어맞아 사람들을 흥분시켰다.
- 그러나 나중에 해왕성이 발견되자 완전히 어긋났다.
타오는 이것이 오늘날 AI가 데이터에서 패턴을 뽑아내는 방식과도 연결된다고 본다.
AI가 엄청난 양의 후보 패턴을 만들 수 있지만, 그중 상당수는 “보데의 법칙”일 가능성이 있다는 것이다.
5) “새로운 통합 개념”은 어떻게 알아보는가?
드워키시는 흥미로운 질문을 던진다.미래에 AI가 수백만 개의 논문, 아이디어, 정리, 설명을 생성할 때, 그중 어떤 것이 진짜 중요한 통합적 개념인지 어떻게 알아볼 수 있을까?
예를 들면:
- 정보이론에서의 bit
- 딥러닝에서의 transformer
- 수학에서의 좌표계처럼, 여러 분야를 묶는 개념
그렇다면 AI 시대에는 “진짜 중요한 것”을 무엇으로 판별할 것인가?
타오는 이에 대해 즉시 객관적으로 판별하기는 거의 불가능하다고 본다.
왜냐하면 어떤 아이디어가 위대한지는 그 아이디어 자체만으로 결정되지 않고,
- 후대에 누가 채택하는지
- 어떤 문화·연구 공동체가 그것을 중심 표준으로 삼는지
- 어떤 응용이 뒤따르는지
즉, 위대한 개념은 종종 시간이 지나야만 위대함이 드러난다.
6) 옳은 이론은 처음엔 오히려 더 나빠 보일 수 있다
타오는 과학사에서 매우 중요한 패턴을 짚는다.- 코페르니쿠스의 태양중심설은 처음엔 프톨레마이오스 체계보다 덜 정확했다
- 뉴턴 역학은 강력했지만, 원격 작용 같은 심각한 철학적 문제를 안고 있었다
- 다윈의 진화론은 설득력 있었지만, 유전 메커니즘을 몰랐다
- 설명해야 할 부분이 비어 있고
- 기존 이론보다 덜 정교해 보이며
- 때로는 더 황당해 보이기도 한다
과학의 진전은 종종 잘못된 가정을 제거하는 일에서 시작되며, 처음엔 불완전해 보여도 장기적으로는 개념 지형 전체를 바꾼다.
7) 다윈과 뉴턴 비교: 데이터 루프가 강한 분야가 먼저 크게 발전할 가능성
드워키시는 흥미로운 비교를 한다.- 뉴턴 역학은 수식으로부터 매우 직접적인 예측과 검증이 가능했다
- 반면 다윈의 진화론은 개념적으로는 오히려 더 단순해 보일 수 있지만,
검증은 누적적·역사적·간접적이었다
타오는 여기에 더해, 과학에서 중요한 것은 단지 이론을 만드는 것이 아니라 남을 설득하는 것이라고 말한다.
다윈은 영어로, 평이하고 강력한 서사로 썼고, 분산되어 있던 사실들을 하나의 이야기로 엮었다.
반대로 뉴턴은 라틴어로 썼고, 너무 난해했고, 시대 자체도 훨씬 폐쇄적이었다.
즉, 과학 발전에는 객관적 증거만이 아니라,
- 설명력
- 서사
- 소통 능력
- 공동체 설득
8) “연역적 오버행(deductive overhang)”—우리는 이미 가진 정보에서 생각보다 훨씬 더 많이 뽑아낼 수 있다
타오는 천문학을 예로 들어, 과학자들이 이미 손에 쥔 데이터에서 생각보다 훨씬 많은 정보를 추출할 수 있다고 말한다.천문학은 데이터가 귀했기 때문에, 아주 작은 신호에서 최대한 많은 결론을 뽑아내는 능력이 유달리 발달한 분야다.
그는 재미있는 사례도 든다.
과학자들이 논문을 실제로 읽고 인용하는지 알아보기 위해, 참고문헌 오탈자가 얼마나 복사·전파되는지를 분석한 연구가 있었다.
이런 식으로 우리는 간접 흔적에서도 사회적·지적 행동 패턴을 추론할 수 있다.
이는 AI 시대에도 중요하다.
즉, 과학의 진전이나 진짜 영향력도 논문 숫자만이 아니라
- 인용의 질
- 오탈자 전파 패턴
- 컨퍼런스 언급 방식
- 후속 사용 양상
9) 인간 수학자와 AI의 차이: 인간은 깊이, AI는 폭
인터뷰 후반부로 갈수록 중요한 구분이 나온다.타오가 보기에 현재 AI는 폭(breadth) 에 강하고, 인간 전문가는 깊이(depth) 에 강하다.
인간 수학자는:
- 한 문제를 오래 붙들고
- 실패한 시도를 구조화하고
- 부분 진전을 쌓아가며
- 중간 손잡이(handhold)를 만든 뒤
- 거기서 다시 올라간다
- 많은 문제를 동시에 던져볼 수 있고
- 표준 기법을 대규모로 적용하며
- 낮은 장벽은 대량으로 돌파하지만
- “부분 진전을 축적해 다음 도약 발판으로 삼는 능력”은 약하다
- 깊이 중심의 인간식 연구
- 폭 중심의 AI식 탐색
이 결합된 하이브리드 체제로 갈 가능성이 높다고 본다.
10) 수학에서 AI가 실제로 잘하는 것과 아직 못하는 것
타오에 따르면, 현재 AI는 수학에서 다음 일을 꽤 잘한다.- 기존 문헌 찾기
- 표준 기법을 빠르게 대입하기
- 문헌 간 연결 고리 찾기
- 계산, 수치 실험, 그림 생성
- 보조적 정리나 형식화 보조
- 기존 기법이 80% 정도만 먹히고 마지막 20%가 막혔을 때
- 완전히 새로운 아이디어를 조직적으로 발전시키기
- 부분 진전을 축적하고 더 높은 수준의 전략으로 전환하기
- 장기적 상호작용 속에서 스스로 “이해”를 심화시키기
11) “성공 사례만 보면 AI가 엄청나 보인다” — 선택 편향 문제
타오는 AI가 에르되시 문제를 푼 사례들을 언급하며, 외부에서는 놀라운 돌파처럼 보이지만 실제로 체계적으로 보면 성공률은 훨씬 낮다고 말한다.핵심 메시지는:
- SNS와 뉴스에는 성공 사례만 퍼진다
- 하지만 표준화된 벤치마크로 보면,
- 개별 문제에서의 성공률은 여전히 낮다
- 다만 AI는 엄청난 규모로 시도할 수 있기 때문에, 몇 개의 성공 사례가 계속 나온다
그래서 객관적 평가를 위해선 실패 사례까지 포함한 표준 데이터셋과 정직한 공개가 중요하다고 본다.
12) 타오 자신의 생산성 변화: 더 깊어졌다기보다 더 풍부해졌다
타오는 AI가 자신의 생산성을 단순히 “몇 배”라고 표현하긴 어렵다고 말한다.왜냐하면 AI 덕분에 그는 이제
- 코드
- 시각화
- 수치 데이터
- 문헌 탐색
- 형식 정리
같은 부가 요소를 훨씬 쉽게 논문에 넣을 수 있게 되었기 때문이다.
즉,
- AI는 연구의 보조 층위를 크게 강화했다
- 하지만 핵심 난제 해결 깊이는 아직 크게 바꾸지 못했다
13) “인공지능”과 “인공적 영리함”의 차이
타오는 인간 협업 수학과 현재 AI의 차이를 설명하면서,지금 AI는 때로 매우 영리하지만, 아직 진짜 의미의 누적적 지능은 부족하다고 본다.
인간 수학자들은 대화 속에서:
- 아이디어를 내고
- 시험해보고
- 실패를 구조화하고
- 조금씩 수정하며
- 부분 성공을 발판으로 축적해 나간다
- 실패가 축적된 자산으로 남지 않고
- 세션이 리셋되면 거의 사라지며
- 스스로 자기 이해를 계속 발전시키는 느낌은 약하다
14) “AI가 리만가설을 풀면 인간은 이해를 얻을 수 있을까?”
타오는 이 질문에 대해 완전히 비관적이지 않다.어떤 정리는 원래부터 brute force에 가까운 방식으로만 해결될 수 있을지 모른다.
대표 사례가 4색정리다. 이 정리는 여전히 인간이 “아름다운 개념적 증명”을 손에 쥐었다고 보기 어렵다.
하지만 리만가설 같은 문제는 대체로
- 새로운 수학
- 또는 서로 멀리 떨어진 영역의 연결
이 필요할 가능성이 높다고 본다.
그 증명을 다시
- 요약하고
- 레마 단위로 분해하고
- 핵심 레마를 찾아내고
- 더 우아한 형태로 리팩토링하는
후처리 생태계가 생길 것이라고 본다.
일단 증명이라는 유물이 생기면,
그 다음엔 그것을 해석하고 정제하는 새로운 수학적 노동이 뒤따를 수 있다는 낙관이 있다.
15) 수학 전략을 위한 준형식 언어가 필요하다
타오는 현재 Lean 같은 도구가 증명은 형식화할 수 있지만,과학자들이 실제로 주고받는
- 직관
- plausibility
- 전략
- 추측
- 설명 서사
까지는 형식화하지 못한다고 본다.
수학적 전략과 과학적 추론 방식 자체를 어느 정도 준형식적으로 표현하는 언어가 필요할 수 있다고 말한다.
예로 그는 소수정리와 리만가설 주변의 직관을 든다.
우리는 소수를 완전히 엄밀하게 이해한 것은 아니지만,
오랜 데이터와 이론적 경험을 통해
“소수는 일정한 밀도의 무작위 집합처럼 행동한다”는 매우 강력한 휴리스틱 모델을 갖고 있다.
이런 것은 엄밀한 정리와 다르지만,
실제 수학자들의 판단과 확신을 강하게 이끈다.
즉, 미래 AI가 진짜 과학적 추론에 깊게 들어오려면,
단순한 형식 증명 언어를 넘어
사람들이 과학에서 실제로 하는 반정형적 사고를 담을 프레임워크가 필요하다는 문제의식이다.
16) 타오 자신의 학습법: 폭넓게 배우는 여우형(fox)
타오는 자신을 “고슴도치(한 분야를 깊게 파는 사람)”보다 “여우(여러 분야를 넓게 아는 사람)”에 가깝다고 본다.그의 학습법은 대략 이렇다.
- 이해할 수 있을 것 같은데 아직 이해 못한 트릭이 있으면 집요하게 파고든다
- 다른 분야 연구자와 협업하며 그 분야의 기본기와 감각을 배운다
- 배운 것은 반드시 글로 남긴다
- 블로그는 기억을 보존하는 장치이기도 하다
- 호기심
- 집요함
- 기록 습관
- 협업을 통한 확장성
에 있다는 점도 드러난다.
17) 시간 사용, 최적화, 그리고 ‘우연성’
인터뷰 말미에서 타오는 매우 인상적인 말을 한다.현대 사회는 모든 것을 최적화하려 하지만, 최적화의 과잉이 오히려 영감과 우연성을 죽일 수 있다는 것이다.
예를 들어:
- 팬데믹 이후 원격 회의는 효율적이지만 우연한 만남이 줄었다
- 검색 엔진은 원하는 논문을 바로 찾게 해주지만, 옆 논문을 우연히 발견하는 경험은 줄었다
- 연구에만 집중하는 환경은 단기적으로 생산적이지만, 장기적으로는 영감 고갈을 낳을 수 있다
이 점은 인터뷰 초반의 “케플러적 탐색”과도 묘하게 연결된다.
너무 잘 정리된 경로만 따라가면, 오히려 진짜 큰 발견을 놓칠 수 있다는 뜻이다.
테렌스 타오의 AI 발전 관련 발언
1) 아이디어 생성 비용이 거의 0이 된 시대
저는 AI가 아이디어 생성 비용을 거의 0에 가깝게 낮춰버렸다고 생각합니다. 인터넷이 소통 비용을 거의 0으로 낮춰버린 것과 아주 비슷한 방식으로요. 이것은 놀라운 일입니다. 하지만 그것만으로 풍요를 만들어내지는 않습니다. 이제 병목은 달라졌습니다. 우리는 지금 어떤 과학 문제에 대해서든 수천 개의 이론을 갑자기 생성할 수 있는 상황에 있습니다. 이제 우리는 그것들을 검증하고, 평가해야 합니다. 이것은 실제로 이것을 가려내기 위해 과학의 구조 자체를 바꿔야 한다는 뜻이기도 합니다.
전통적으로 우리는 벽을 세웠습니다. 과거에는, AI 슬롭이 있기 전에도, 아마추어 과학자들이 자기 나름의 우주 이론을 갖고 있었고, 그 중 다수는 거의 가치가 없었습니다. 그래서 우리는 동료심사 출판 시스템 같은 것을 만들어서, 신호가 높은 아이디어를 걸러내고 시험하려고 했습니다.
하지만 이제 우리는 가능한 설명들을 대규모로 생성할 수 있게 되었고, 그중 일부는 좋지만 많은 것들은 형편없습니다. 인간 심사자들은 이미 압도당하고 있습니다. 많은 학술지들이 AI 생성 투고물이 투고 시스템을 범람시키고 있다고 보고하고 있습니다.
AI로 온갖 것을 생성할 수 있게 된 것은 훌륭한 일입니다. 하지만 그것은 과학의 나머지 측면들—검증, 타당성 평가, 어떤 아이디어가 실제로 학문을 앞으로 나아가게 하고 어떤 것은 막다른 길이나 붉은 청어(red herring)인지 판별하는 일—이 따라잡아야 한다는 뜻입니다. 이것은 우리가 대규모로 하는 법을 아직 모르는 일입니다. 개별 논문 하나하나에 대해서는 과학자들 사이에 논쟁을 벌이고 몇 년 안에 합의에 도달할 수 있습니다. 하지만 하루에 이런 것이 천 개씩 생성된다면, 그 방식은 통하지 않습니다.
2) 무엇이 진짜 중요한 아이디어인지 즉시 판별하기 어려운 이유
많은 경우 그것은 시간의 시험을 거칩니다. 많은 위대한 아이디어들은 처음 제안되었을 때 사실 그다지 좋은 반응을 얻지 못했습니다. 나중에 다른 과학자들이 그것을 더 발전시키고 자기 분야에 적용할 수 있다는 것을 깨닫고 나서야 비로소 드러났습니다. 딥러닝 자체도 오랫동안 AI의 틈새 분야였습니다. 답을 제1원리 추론이 아니라 데이터 학습만으로 얻는다는 발상은 매우 논쟁적이었고, 실제로 성과를 내기까지 단지 긴 시간이 필요했습니다.
당신이 bit를 언급했는데요. 오늘날 보편적인 0과 1 말고도 다른 컴퓨터 구조 제안들이 있었습니다. 제 생각엔 trit, 그러니까 3값 논리 같은 것도 있었던 걸로 압니다. 어떤 다른 우주에서는 아마 다른 패러다임이 등장했을 수도 있습니다. 예를 들어 transformer는 현대의 모든 대형 언어 모델의 토대이고, 언어를 포착할 만큼 충분히 정교했던 최초의 딥러닝 아키텍처였습니다. 하지만 꼭 그렇게 될 필요는 없었습니다. 다른 어떤 아키텍처가 먼저 그 일을 해냈을 수도 있었고, 일단 그것이 채택되었다면 그것이 표준이 되었을 것입니다.
어떤 아이디어가 유망할지를 평가하기 어려운 이유 중 하나는, 그것이 미래에 달려 있기 때문입니다. 어떤 아이디어가 채택되고 어떤 아이디어가 채택되지 않는지는 문화와 사회에도 달려 있습니다. 수학의 10진법은 극도로 유용합니다. 예를 들어 로마 숫자 체계보다 훨씬 낫죠. 하지만 다시 말하지만, 10 자체에 특별한 점이 있는 것은 아닙니다. 그것은 모두가 그것을 사용하기 때문에 우리에게 유용한 체계입니다. 우리는 그것을 표준화했고, 컴퓨터와 숫자 표현 체계 전반을 그 위에 세워놓았기 때문에 이제는 거기에 묶여 있는 것입니다. 가끔 어떤 사람들은 10진법 말고 다른 체계를 밀기도 하지만, 관성이 너무 큽니다.
어떤 과학적 성취를 완전히 고립된 채로 떼어 놓고, 과거나 미래의 맥락을 고려하지 않은 채 객관적인 점수를 매기는 일은 가능하지 않을 수도 있습니다. 그래서 어쩌면 이것은 훨씬 더 국소적인 문제들처럼 강화학습할 수 있는 종류의 대상이 아닐지도 모릅니다.
3) 지금 우리는 인간 지능 중심주의에서 벗어나는 ‘인지적 코페르니쿠스 혁명’을 겪고 있다
지금 우리는 인지적 버전의 코페르니쿠스 혁명을 겪고 있습니다. 예전에는 인간 지능이 우주의 중심이라고 생각했지만, 이제 우리는 매우 다른 강점과 약점을 지닌 매우 다른 종류의 지능들이 존재한다는 것을 보고 있습니다. 어떤 과제가 지능을 요구하는지, 어떤 것은 그렇지 않은지에 대한 우리의 평가도 상당히 많이 재정렬되어야 합니다.
AI를 우리의 과학 진보 이론, 그리고 무엇이 어렵고 무엇이 쉬운지에 대한 이론 안에 끼워 맞추려 해보면, 우리는 꽤 많이 고전하고 있습니다. 우리는 이전에는 정말로 물어볼 필요가 없었던 질문들을 물어야 합니다. 아니면 철학자들은 물었을지도 모르지만, 이제는 우리 모두가 그것을 다뤄야 합니다.
4) AI가 과학의 병목을 바꿨지만, 설득과 서사는 여전히 남아 있다
데이터가 있으면 도움이 됩니다. 하지만 사람들은 설득되어야 합니다. 그렇지 않으면 그들은 그 이론을 더 밀고 나가지도 않을 것이고, 그것을 배우고 진지하게 탐구하기 위한 초기 투자도 하지 않을 것입니다. 그것은 또한 과학에서 매우 중요한 부분입니다. 그것은 강화학습으로 배우게 하기가 정말 어려운 또 하나의 일입니다. 당신이 얼마나 설득력 있는지 어떻게 점수화할 수 있겠습니까? 음, 이것을 하려고 온갖 마케팅 부서들이 존재하죠. 어쩌면 AI가 아직 설득력 최적화까지는 되지 않은 것이 좋은 일인지도 모릅니다.
과학에는 사회적 측면이 있습니다. 우리는 데이터와 실험, 검증이 있는 객관적인 측면을 자랑스럽게 여깁니다. 하지만 동시에 우리는 이야기를 해야 하고 동료 과학자들을 설득해야 합니다. 이것은 부드럽고, 말랑말랑한 것입니다. 데이터와 서사를 그리는 일의 결합입니다. 그리고 그 서사는 빈틈이 있는 서사이기도 합니다.
다윈의 경우에도, 제가 말했듯이, 그의 이론에는 설명할 수 없는 조각들이 있었습니다. 그러나 그는 여전히 앞으로 사람들이 중간 형태를 발견할 것이고, 유전의 메커니즘을 찾을 것이며, 실제로 그렇게 되리라는 주장을 펼칠 수 있었습니다. 이런 것을 얼마나 정밀하게 수량화해서 강화학습을 돌릴 수 있을지 저는 모르겠습니다. 어쩌면 이것은 영원히 과학의 인간적인 측면으로 남을지도 모릅니다.
5) AI가 에르되시 문제들을 푼 것처럼 보이지만, 지금은 저지대가 거의 정리된 상태다
그렇게 보입니다. AI의 도움으로 50여 개의 문제가 풀렸고, 그것은 대단한 일입니다. 하지만 아직도 600개 정도가 남아 있습니다. 사람들은 지금도 이 중 하나둘 정도를 계속 깎아나가고 있습니다.
우리는 이제 AI가 순수하게 문제를 푸는 경우를 훨씬 덜 보고 있습니다. AI가 그냥 원샷으로 문제를 푸는 일이 있었던 한 달 정도가 있었는데, 그것은 멈췄습니다. 시도 부족 때문은 아닙니다. 저는 서로 다른 세 번의 시도를 알고 있는데, 최전선 모델 AI들을 동원해서 남아 있는 문제들을 전부 한꺼번에 공격하게 했습니다. 그들은 사소한 관찰 몇 개를 찾거나, 어떤 문제는 이미 문헌에서 해결되었다는 것을 찾아내기도 하지만, 그 이후로는 순수하게 AI만으로 해결된 사례는 아직 더 나오지 않았습니다.
지금 사람들은 AI를 많이 사용하고 있습니다. 어떤 사람은 AI를 사용해 가능한 증명 전략을 생성하고, 다른 사람은 또 다른 AI 도구를 사용해 그것을 비판하고, 다시 쓰고, 수치 데이터를 만들고, 문헌 조사를 합니다. 어떤 문제들은 많은 인간과 많은 AI 도구들 사이의 지속적인 대화에 의해 풀리기도 했습니다. 하지만 그것은 일종의 일회성 현상이었던 것처럼 보이기도 합니다.
아마 이 문제들에 대한 비유를 하자면, 당신은 어떤 산맥에 있고 그 안에는 온갖 절벽과 벽들이 있습니다. 어떤 벽은 3피트 높이이고, 어떤 것은 6피트, 어떤 것은 15피트, 또 어떤 것은 1마일짜리 절벽입니다. 당신은 가능한 한 많은 벽을 오르려고 하지만, 문제는 그게 어둠 속이라는 것입니다. 어떤 것이 높은지 낮은지 우리는 모릅니다. 그래서 촛불을 켜고 지도를 만들고, 천천히 어떤 것은 오를 수 있다는 걸 알아냅니다. 어떤 것은 벽에 부분적인 발판이 있어서 먼저 거기까지는 갈 수 있다는 것도 알게 됩니다.
이런 AI 도구들은 마치 공중으로 2미터를 뛸 수 있는 점프 기계 같습니다. 인간보다 더 높이 뛰죠. 가끔은 엉뚱한 방향으로 뛰고, 가끔은 추락하지만, 가끔은 우리가 전에는 닿지 못했던 가장 낮은 벽의 꼭대기에 도달합니다. 우리는 그들을 이 산맥 안에 풀어놓고 여기저기 뛰게 한 셈입니다. 실제로 그들이 낮은 벽들을 찾아내고 올라갈 수 있었던 흥분되는 시기가 있었습니다. 아마 다음 번에 모델에 큰 발전이 생기면, 다시 시도해서 몇 개 더 돌파할지도 모릅니다.
하지만 이것은 수학을 하는 아주 다른 방식입니다. 보통 우리는 비탈을 조금씩 올라가면서, 표시를 남기고, 부분적인 것을 식별해가려 합니다. 그런데 이 도구들은 성공하든지 실패하든지 둘 중 하나입니다. 이들은 부분적 진전을 만드는 데, 혹은 먼저 어디에 집중해야 하는지 보여주는 중간 단계를 식별하는 데는 정말 형편없었습니다. 앞서 이야기한 것과 다시 연결하자면, 우리는 원샷 성공/실패처럼 부분 진전을 평가할 방법을 갖고 있지 않습니다.
6) 인간은 깊이, AI는 폭에 강하다
저는 동의합니다. 그들은 폭에 뛰어나고, 인간은—적어도 인간 전문가들은—깊이에 뛰어납니다. 저는 둘이 매우 상보적이라고 생각합니다. 하지만 우리가 현재 수학과 과학을 하는 방식은 깊이에 맞추어져 있습니다. 인간의 전문성이 거기에 있기 때문입니다. 인간은 폭을 할 수 없기 때문이죠. 이제 우리는 우리가 새로 갖게 된 이 폭의 능력을 충분히 활용할 수 있도록 과학을 하는 방식을 다시 설계해야 합니다.
우리는 한두 개의 정말 깊고 중요한 문제보다, 훨씬 더 넓은 종류의 문제군을 만들고 거기에 노력을 쏟아야 합니다. 물론 깊고 중요한 문제는 여전히 있어야 하고, 인간은 여전히 그것들에 매달려야 합니다. 하지만 이제 우리는 과학을 하는 또 다른 방식을 갖게 되었습니다. 넓고 적당히 유능한 AIs가 먼저 전체를 매핑하고 쉬운 관찰들을 모두 해내게 함으로써, 우리는 완전히 새로운 과학 분야를 탐험할 수 있습니다. 그리고 그런 다음 인간 전문가들이 와서 작업할 수 있는 어려움의 섬들을 식별할 수 있습니다.
저는 매우 상보적인 과학의 미래를 봅니다. 결국에는 당신은 폭과 깊이를 둘 다 얻게 되고, somehow 두 세계의 장점을 다 얻기를 바라게 되겠죠. 하지만 우리는 폭의 측면에서 연습이 필요합니다. 이것은 너무 새롭습니다. 우리는 그것을 실제로 최대한 활용할 패러다임조차 아직 없습니다. 하지만 우리는 갖게 될 것이고, 그러면 과학은 그 이후로는 알아볼 수 없을 정도로 바뀔 것이라고 생각합니다.
7) 수학에서 과정은 결과보다 더 중요할 때가 많다
확실히 수학에서는 과정이 종종 문제 그 자체보다 더 중요합니다. 문제는 진보를 측정하기 위한 일종의 대리 지표 같은 것이죠. 소프트웨어에서도 서로 다른 종류의 소프트웨어 작업이 있다고 생각합니다. 단지 다른 천 개의 웹페이지와 똑같은 일을 하는 웹페이지 하나를 만드는 것이라면, 거기서 배울 기술은 없습니다. 물론 개별 프로그래머가 습득할 수 있는 기술이 조금은 있을 수 있겠지만요. 하지만 보일러플레이트 성격의 코드라면, 그것은 분명히 AI에 넘겨야 하는 것입니다.
때로는 코드를 만든 다음에도 여전히 그것을 유지보수해야 합니다. 업그레이드 문제도 있고, 다른 것들과 호환되게 해야 하는 문제도 있습니다. 프로그래머들 얘기를 들어보면, AI가 도구의 첫 번째 프로토타입을 만들 수 있다 하더라도, 그것을 다른 모든 것들과 잘 맞물리게 하고, 실제 세계와 원하는 방식으로 상호작용하게 만드는 것은 계속되는 과정이라고 합니다. 코드를 직접 쓰면서 익히는 기술이 없다면, 나중에 그것을 유지하는 능력에 영향이 있을 수 있습니다.
그래서 네, 확실히 수학자들은 문제를 직관을 기르고, 무엇이 참인지, 무엇을 기대해야 하는지, 무엇이 증명 가능한지, 무엇이 어려운지를 감각적으로 배우기 위한 장치로 사용해왔습니다. 답만 바로 받아버리는 것은 실제로 그 과정을 방해할 수 있습니다.
저는 전에 이론과 실험을 구분했죠. 대부분의 과학에서는 이론적 측면과 실험적 측면이 거의 반반입니다. 수학은 거의 전적으로 이론적인 분야라는 점에서 독특했습니다. 우리는 무엇이 왜 참인지, 왜 거짓인지에 대한 일관되고 깔끔한 이론을 갖는 데 프리미엄을 둡니다. 두 가지 다른 방식으로 문제를 풀 수 있을 때 어느 쪽이 더 효과적인지에 대해서는 실험을 거의 하지 않았습니다. 우리는 약간의 직관은 있지만, 천 개의 문제를 놓고 실제로 테스트하는 대규모 연구는 하지 않았습니다.
하지만 이제 우리는 그것을 할 수 있습니다. 저는 AI형 도구들이 수학의 실험적 측면을 실제로 혁신할 것이라고 생각합니다. 여기서는 개별 문제나 그 문제를 푸는 과정 자체는 그렇게 중요하지 않고, 어떤 것이 먹히고 어떤 것이 먹히지 않는지에 대한 대규모 데이터를 모으고 싶어합니다. 마치 소프트웨어 회사가 소프트웨어 천 개를 출시하고 싶을 때, 각각을 장인식으로 손으로 빚고 거기서 교훈을 배우고 싶어하는 것이 아니라, 확장 가능한 워크플로가 무엇인지를 찾고 싶어하는 것과 비슷합니다.
수학을 스케일 있게 한다는 아이디어는 아직 초기 단계입니다. 하지만 AI가 이 분야를 정말로 혁신할 곳은 바로 거기라고 생각합니다.
8) 기존 기법을 전부 대입하는 것만으로도 꽤 많은 것이 해결될 수 있다
이것은 정말 좋은 질문이고, 우리는 아직 그것에 완전히 답할 데이터를 갖고 있지 않습니다. 확실히 인간 수학자들이 하는 많은 일은… 새 문제를 받으면, 우리가 가장 먼저 하는 일 중 하나는 과거에 비슷한 문제들에 먹혔던 모든 표준적인 것들을 살펴보고, 그것들을 하나씩 시도해보는 것입니다. 때로는 그것만으로도 해결되고, 질문이 중요했다면 그것만으로도 여전히 출판할 가치가 있습니다.
때로는 그것들이 거의 먹히지만, 한 가지 비틀기(wrinkle)를 더 추가해야 하고, 그것도 또한 흥미롭습니다. 하지만 최상위 저널에 가는 논문들은 대개 기존 방법들이 문제의 80% 정도는 풀 수 있는데, 남은 20%가 버티고 있고, 그 빈틈을 메우기 위해 새로운 기법이 발명되어야 하는 경우입니다.
이제는 어떤 문제가 과거 문헌에 전혀 의존하지 않고 풀리는 경우는 매우 드뭅니다. 모든 아이디어가 무(無)에서 나오는 경우 말이죠. 예전에는 더 흔했지만, 지금의 수학은 너무 성숙해서, 먼저 문헌을 사용하지 않는 것은 그 자체로 엄청난 핸디캡입니다.
AI 도구들은 지금 첫 번째 부분, 즉 어떤 문제에 모든 표준 기법을 그냥 시도해보는 데 점점 더 능숙해지고 있습니다. 그런 기법들을 적용할 때 인간보다 실수를 덜 하기도 합니다. 물론 여전히 실수는 하지만요. 저는 제가 할 수 있는 작은 작업들에 대해 이 도구들을 시험해봤는데, 가끔 그들은 제가 놓친 오류를 잡고, 가끔은 제가 그들의 오류를 잡습니다. 지금은 거의 비긴 수준입니다.
하지만 아직 그 다음 단계는 못 봤습니다. 논증에 구멍이 있고, 해보는 것들이 아무것도 먹히지 않을 때, 그 다음엔 무엇을 합니까? 그들은 무작위적인 것을 제안할 수는 있지만, 저는 종종 그것들을 따라가서 먹히게 만들려다가 결국 안 된다는 것을 확인하는 데, 절약되는 시간보다 더 많은 시간을 낭비하게 됩니다.
저는 우리가 현재 어렵다고 생각하는 문제들 중 일부는 이 방식으로 무너질 것이라고 생각합니다. 특히 충분한 주목을 받지 못했던 문제들은요. 에르되시 문제들의 경우, AI로 해결된 거의 모든 50개 문제는 사실상 문헌이 거의 없는 문제들이었습니다. 에르되시가 그 문제를 한두 번 제기했을 뿐이고, 아마 어떤 사람들은 가볍게 시도했다가 못 풀었겠지만, 논문으로 써놓지도 않았습니다.
그런데 알고 보니 해결책은 있었고, 단지 별로 많은 사람이 모르는 어떤 희귀한 기법 하나를 문헌 속 다른 결과와 결합하면 되는 일이었습니다. 그것이 AI가 할 수 있는 일의 중간 수준 정도입니다. 그리고 그것은 정말 대단합니다. 그런 식으로 50개의 문제가 정리되니까요. 그래서 저는 군데군데 고립된 성공 사례들은 보게 될 것이라고 생각합니다.
하지만 우리가 발견한 것은… 어떤 사람들은 이 에르되시 문제들에 대해 대규모 스윕을 해보았습니다. 성공 사례들만, 즉 소셜 미디어에 퍼지는 것들만 보면 놀랍게 보입니다. 수십 년 동안 안 풀리던 문제들이 지금 우수수 떨어지는 것처럼 보이니까요. 하지만 우리가 체계적인 연구를 하면, 어떤 개별 문제에 대해 AI 도구의 성공률은 대략 1% 또는 2% 정도입니다. 단지 그들은 규모를 살 수 있고(scale을 동원할 수 있고), 우리는 승자들만 고르는 것입니다. 그래서 놀랍게 보이는 것입니다.
저는 수백 개의 매우 권위 있고 어려운 수학 문제들에서도 비슷한 일이 일어날 것이라고 생각합니다. 어떤 AI가 운 좋게 실제로 그것들을 풀 수도 있고, 모두가 놓친 뒷문(backdoor) 해법이 있을 수도 있습니다. 그러면 그것은 엄청난 주목을 받을 것입니다. 하지만 사람들은 다시 자기들이 좋아하는 문제에 이 화려한 도구들을 써볼 것이고, 또다시 1%에서 2% 성공률을 경험하게 될 것입니다.
이 도구들이 언제 먹히고 언제 안 먹히는지에 관해서는 신호 속에 많은 잡음이 있을 것입니다. 그래서 이런 정말 표준화된 데이터셋을 모으는 일이 점점 더 중요해질 것입니다. 지금은 AI가 풀어야 할 챌린지 문제들의 표준 세트를 만들려는 노력들이 있습니다. 그리고 AI 기업들이 자기들의 승리만 공개하고 실패는 감추는 데 의존하지 않으려는 것이기도 합니다. 그렇게 해야 우리가 실제로 어디쯤 와 있는지 좀 더 명확해질 것입니다.
9) AI 진보는 동시에 놀랍고 실망스럽다
진보는 동시에 놀랍고도 실망스럽습니다. 이 도구들이 실제로 작동하는 것을 보는 것은 매우 이상한 느낌입니다. 하지만 사람들은 또한 굉장히 빨리 익숙해집니다.
저는 20년 전 구글 웹 검색이 나왔을 때를 기억합니다. 그것은 다른 모든 검색들을 완전히 압도했죠. 첫 페이지에서 이미 관련 결과들이 나오고, 정확히 원하는 것이 나왔습니다. 정말 놀라운 일이었고, 그런데 몇 년 지나고 나면 그냥 무엇이든 구글링할 수 있다는 걸 당연하게 여기게 되었습니다.
2026년 수준의 AI는 2021년에 있었다면 충격적이었을 것입니다. 많은 것들—얼굴 인식, 자연스러운 음성, 대학 수준의 수학 문제 풀이—을 우리는 이제 그냥 당연하게 여깁니다.
10) AI는 타오의 논문을 더 풍부하게 만들었지만, 더 깊게 만들지는 않았다
생산성이라는 것은 그리 1차원적인 양이 아니라고 생각합니다. 제 수학 작업 방식과 제가 하는 일의 유형이 분명히 꽤 많이 바뀌고 있다는 것은 느낍니다. 예를 들어, 제 논문에는 이제 훨씬 더 많은 코드와 훨씬 더 많은 그림이 들어갑니다. 이제 그런 것들을 만드는 것이 너무 쉬워졌기 때문입니다. 예전 같으면 몇 시간이 걸렸을 어떤 플롯을, 이제는 몇 분 안에 만들 수 있습니다. 하지만 과거에는 애초에 그 플롯을 논문에 넣지도 않았을 것입니다. 그냥 글로 설명했겠죠. 그래서 2배가 무엇을 의미하는지 측정하기가 어렵습니다.
한편으로, 제가 오늘 쓰는 종류의 논문을 AI 도움 없이 쓴다면 분명 5배는 더 오래 걸릴 것입니다. 하지만 저는 애초에 그런 식으로 논문을 쓰지 않았을 것입니다.
이것들은 보조적인 작업들입니다. 예를 들어 훨씬 더 깊은 문헌 검색을 한다든가, 훨씬 더 많은 수치 자료를 넣는다든가 하는 일들입니다. 그것들은 논문을 풍부하게 만듭니다. 제가 하는 일의 핵심, 즉 수학 문제에서 가장 어려운 부분을 실제로 푸는 일은 크게 바뀌지 않았습니다. 그 부분은 여전히 종이와 펜을 사용합니다.
하지만 사소한 일들이 정말 많습니다. 저는 이제 AI 에이전트를 사용해서 서식을 다시 맞추기도 합니다. 예를 들어 괄호 크기가 전부 딱 맞지 않을 때, 예전에는 그것을 일일이 손으로 바꿨습니다. 이제는 AI 에이전트에게 그런 일을 뒤에서 꽤 깔끔하게 시킬 수 있습니다.
그들은 많은 2차적 작업들을 정말 많이 가속했습니다. 아직 제가 하는 핵심적인 일을 가속하지는 못했지만, 논문에 더 많은 것을 추가할 수 있게 해주었습니다. 같은 맥락에서, 만약 제가 2020년에 썼던 논문을 다시 쓴다고 해봅시다. 그리고 이 새로운 요소들을 추가하지 않고, 그냥 같은 수준의 기능만 갖춘 논문을 쓴다면, 솔직히 시간 절약은 그렇게 크지 않습니다. 논문들을 더 풍부하고 더 넓게 만들었지만, 반드시 더 깊게 만들지는 않았습니다.
11) 지금 AI는 누적적으로 이해를 쌓아가는 방식이 아니다
지능은 정의하기 어렵기로 유명합니다. 그것은 보는 순간 알 수 있는 종류의 것이죠. 하지만 제가 누군가와 이야기하며 함께 수학 문제를 풀려고 할 때, 이런 대화가 있습니다. 처음에는 둘 다 문제를 푸는 방법을 모릅니다. 그중 한 명이 어떤 아이디어를 내고, 그것이 유망해 보입니다. 그러면 일종의 원형 전략을 갖게 되죠. 그것을 시험해보고, 안 되면 수정합니다. 시간이 지나면서 아이디어를 적응시키고 계속 개선하는 과정이 있습니다. 결국 우리는 무엇이 안 되고 무엇이 되는지를 체계적으로 지도화하고, 앞으로 나아갈 길을 볼 수 있게 되는데, 그것은 우리의 토론과 함께 진화합니다.
이것은 AI가 하는 일과는 조금 다릅니다. AI는 이것을 약간 흉내 낼 수는 있습니다. 이 점프 로봇 비유로 돌아가자면, 그들은 점프하고 실패하고, 다시 점프하고 실패할 수 있습니다. 하지만 그들이 할 수 없는 것은 조금 점프해서 손잡이를 붙잡고, 거기에 머물러서 다른 사람들을 끌어올리고, 그다음 거기서부터 다시 점프하는 것입니다. 상호작용적으로 구축되는 누적적 과정이 아직은 존재하지 않습니다. 그것은 훨씬 더 시행착오와 반복, 즉 brute force처럼 보입니다. 그것은 규모를 통해 작동하고, 특정 맥락에서는 놀랍도록 잘 먹힐 수 있습니다. 하지만 부분 진전으로부터 누적적으로 구축해나가는 이 아이디어가 아직은 완전히 거기에 와 있지 않습니다.
12) 새 세션에서는 AI가 방금 한 수학을 거의 잊어버린다
아니요.
새 세션을 실행하면 그것은 자기가 방금 무엇을 했는지 잊어버립니다. 관련 문제들 위에 쌓아 올릴 새로운 기술도 갖지 못합니다. 아마 당신이 방금 한 일은 다음 세대 훈련 데이터의 0.001% 정도가 될 수 있겠죠. 그래서 언젠가는 그 일부가 흡수될 수는 있습니다.
13) 인간+AI 협업이 리만가설 같은 문제를 푸는 더 현실적인 경로일 수 있다
우리는 모릅니다. 어떤 문제들은 기본적으로 순수한 brute force로 해결되어 왔습니다. 4색정리가 유명한 예입니다. 우리는 아직도 이 정리에 대해 개념적으로 우아한 증명을 찾지 못했고, 어쩌면 영원히 못 찾을 수도 있습니다. 어떤 문제들은 단지 엄청난 수의 경우로 쪼개고, 각 경우를 통찰 없는 컴퓨터 분석으로 처리해야만 풀릴 수도 있습니다.
우리가 리만가설 같은 문제를 중시하는 이유 중 하나는, 그 문제를 풀기 위해서는 새로운 유형의 수학이 창조되어야 하거나, 이전에는 연결되지 않았던 두 수학 분야 사이의 새로운 연결이 발견되어야 한다고 꽤 강하게 믿고 있기 때문입니다. 우리는 해법의 모양이 어떤 것인지조차 모릅니다. 하지만 이것은 경우를 다 뒤져서 해결되는 종류의 문제처럼 느껴지지는 않습니다.
아니면 실제로 거짓일 수도 있습니다. 가설이 거짓이고, 선 밖의 영점을 계산으로 찾아내고, 거대한 컴퓨터 계산이 그것을 검증하는 시나리오는 가능하긴 합니다. 하지만 그것은 매우 실망스러운 일일 것입니다. 저는 완전히 자율적인 원샷 접근이 이런 문제들에 맞는 방식은 아니라고 느낍니다. 이런 문제들에서는 인간과 이 도구들 사이의 상호작용을 통해 훨씬 더 많은 성과를 얻게 될 것입니다.
저는 이런 문제들 중 하나가 매우 강력한 AI 도구들의 도움을 받는 똑똑한 인간들에 의해 해결되는 모습을 상상할 수 있습니다. 하지만 그 정확한 동학은 지금 우리가 상상하는 것과는 매우 다를 수 있습니다. 그것은 아직 존재하지 않는 종류의 협업일 수 있습니다.
예를 들어 리만 제타 함수의 백만 가지 변형을 생성하고, AI 보조 데이터 분석을 통해 우리가 전에 몰랐던 어떤 패턴을 발견하는 방식이 있을 수 있습니다. 그러면 그 덕분에 문제를 수학의 다른 영역으로 옮길 수 있을지도 모릅니다. 여러 가지 시나리오가 있을 수 있습니다.
14) 이해할 수 없는 AI 증명이 나오더라도, 사후 해석 생태계가 생길 것이다
Lean 같은 것에 증명을 형식화하는 것의 아름다움은, 그 증명의 어떤 조각이든 떼어내서 원자적으로 연구할 수 있다는 점입니다. 제가 어떤 어려운 문제를 푼 논문을 읽으면, 거기에는 종종 큰 레마들과 정리들의 연쇄가 있습니다. 이상적으로는 저자가 무엇이 중요한 단계이고 무엇이 아닌지를 말로 풀어줍니다. 하지만 때로는 어떤 단계가 핵심이고 어떤 것이 단지 상투적인 표준 단계였는지를 드러내지 않습니다.
그런데 각 레마를 고립시켜 연구할 수 있습니다. 그중 일부는 꽤 표준적으로 보이고 제가 익숙한 것과 닮아 있어서, 거기에는 흥미로운 것이 없다고 판단할 수 있습니다. 하지만 어떤 다른 레마는 제가 전에 본 적이 없는 것이고, 이것이 왜 핵심 결과를 증명하는 데 정말 도움이 되는지를 볼 수 있습니다. 어떤 단계가 논증에서 정말 핵심인지 아닌지를 평가할 수 있고, Lean은 그것을 정말 잘 가능하게 해줍니다. 개별 단계들이 아주 정밀하게 식별되어 있으니까요.
저는 미래에는 거대한 Lean 생성 증명을 받아서 일종의 ablation을 하는 수학자라는 직업군이 생길 것이라고 생각합니다. 그들은 부분들을 제거해보고, 더 우아한 방식을 찾으려고 할 것입니다. 다른 AI들을 사용해서 증명을 더 우아하게 만들도록 강화학습을 시킬 수도 있고, 또 다른 AI들이 이 증명이 더 좋아 보이는지를 채점할 수도 있습니다.
가까운 미래에 꽤 많이 바뀔 것 중 하나는 우리가 논문을 쓰는 방식입니다. 최근까지는 논문을 쓰는 것이 이 직업에서 가장 시간도 많이 들고 비용도 큰 부분이었습니다. 그래서 아주 드물게만 글을 썼습니다. 다른 모든 부분이 다 점검되고 난 뒤에야 결과를 써 올렸습니다. 왜냐하면 다시 쓰고 리팩토링하는 것이 정말 큰 고통이었기 때문입니다. 그런데 현대 AI 도구들 덕분에 그것이 훨씬 쉬워졌습니다. 더 이상 논문의 버전이 하나만 있을 필요가 없습니다. 하나가 있으면, 사람들은 수백 개의 다른 버전을 생성할 수 있습니다.
거대한 지저분한 Lean 증명 하나가 그 자체로는 별로 의미 있거나 이해 가능하지 않을 수 있습니다. 하지만 다른 사람들이 그것을 리팩토링하고 온갖 일을 할 수 있습니다. 우리는 에르되시 문제 웹사이트에서 이것을 이미 보았습니다. AI가 증명을 생성하면, 여기 그 증명을 검증하는 3,000줄짜리 코드가 있습니다. 그러면 다른 AI들이 그 증명을 요약하게 하고, 사람들은 자기만의 증명을 씁니다.
실제로 사후처리가 일어납니다. 일단 증명 하나가 있으면, 우리는 이제 그것을 해체하고 해석할 수 있는 많은 도구를 갖고 있습니다. 이것은 매우 초기 단계의 수학이지만, 저는 그렇게까지 걱정하지는 않습니다. 어떤 사람들은 리만가설이 완전히 이해 불가능한 증명으로 증명되면 어떻게 하냐고 우려합니다. 하지만 저는 일단 증명이라는 산물이 생기면, 우리는 그것에 대해 많은 분석을 할 수 있다고 생각합니다.
15) 과학자들이 실제로 하는 대화를 닮은 준형식 언어가 필요하다
우리는 정말로 잘 모릅니다. 수학에서는 우리가 논리와 수학의 법칙들을 정리해냈다는 점에서 매우 운이 좋았습니다. 하지만 이것은 비교적 최근의 성취입니다. 그것은 2천 년 전 유클리드에게서 시작되었지만, 20세기 초에 이르러서야 우리는 마침내 수학의 공리들, 즉 ZFC라고 부르는 표준 공리들, 1차 논리의 공리들, 그리고 무엇이 증명인지를 나열하게 되었습니다. 이것은 우리가 자동화할 수 있고 형식 언어를 가질 수 있는 부분입니다.
어떤 식으로 plausibility를 평가하는 방법이 있을 수도 있습니다. 어떤 추측이 참이라고 가정하고, 몇 개의 예를 테스트했더니 잘 맞습니다. 이것이 당신의 확신을 얼마나 높여야 할까요? 우리는 이것을 모델링하는 수학적 방법을 몇 가지 갖고 있습니다. 예를 들어 베이지안 확률 같은 것입니다. 하지만 거기에도 어떤 기저 가정을 설정해야 하고, 이런 작업들에는 여전히 많은 주관성이 들어갑니다.
이것은 계획이라기보다는 바람에 가깝습니다. 그러나 Lean 같은 형식 프레임워크가 마련되었기 때문에 연역적 증명을 자동화하고 AI를 훈련시키는 일이 얼마나 쉬워졌는지를 보면서 느끼는 것입니다. 전략을 만들고 추측을 세우기 위해 AI를 사용하는 데서의 병목은, 어떤 것이 plausibility가 있는지 아닌지를 검증하기 위해 여전히 인간 전문가들과 시간의 시험에 의존해야 한다는 점입니다.
이것이 쉽게 해킹되지 않는, 일종의 준형식 프레임워크가 있었으면 합니다. 이것은 정말 중요합니다. 이런 형식 증명 보조기들에서는 강화학습이 그런 뒷문을 너무 잘 찾아내기 때문에, 실제로 증명하지 않고도 somehow 인증된 증명을 받아내는 식의 backdoor나 exploit가 절대 있어서는 안 됩니다.
만약 데이터와 논증을 사용하면서도, 동시에 이야기를 구성하는 식으로 과학자들이 서로 대화하는 방식을 어느 정도 닮은 프레임워크가 있다면… 과학에는 주관적인 측면이 있는데, 우리는 그것을 어떻게 포착해야 AI를 유용하게 그 안에 삽입할 수 있을지 모릅니다. 이것은 미래의 문제입니다. 자동 추측을 만들려는 연구 노력들이 있고, 어쩌면 이것들을 벤치마크하고 시뮬레이션하는 방법도 있을지 모르지만, 전부 매우 새로운 과학입니다.
16) AI와 함께라면 수학의 진입장벽 자체가 달라질 수 있다
우리는 변화의 시대에 살고 있습니다. 제가 말했듯이, 우리는 특히 예측 불가능한 시대에 살고 있습니다. 수 세기 동안 당연하게 여겨졌던 것들이 더 이상 유지되지 않을 수 있습니다. 우리가 모든 것을 하는 방식, 그리고 수학만이 아니라 모든 것이 바뀔 것입니다. 여러 면에서 저는 10년 전, 20년 전과 크게 다르지 않은 훨씬 더 지루하고 조용한 시대를 선호했을 것입니다. 하지만 이제는 많은 변화가 있을 것이라는 사실을 그냥 받아들여야 한다고 생각합니다. 당신이 공부하는 것들 중 일부는 쓸모없어지거나 혁명적으로 바뀔 수 있지만, 어떤 것들은 남을 것입니다.
당신은 늘 예전에는 할 수 없었던 일들의 기회에 눈을 두고 있어야 합니다. 수학에서는 예전 같으면 수학 박사가 되기 전까지, 오랜 세월 교육을 거치기 전까지는 수학 연구의 최전선에 기여할 수 없었습니다. 하지만 이제는 고등학생 수준에서도, 혹은 그 비슷한 단계에서도, 이런 AI 도구들과 Lean, 그리고 다른 것들 덕분에 수학 프로젝트에 참여해서 실제 기여를 할 수 있을 가능성이 꽤 있습니다.
배우는 비전통적인 기회들이 많이 생길 것이기 때문에, 아주 적응적인 마인드셋이 필요합니다. 호기심 때문에, 그리고 이것저것 장난처럼 시도해보는 것들을 추구할 공간도 있을 것입니다. 여전히 자격은 갖춰야 합니다. 한동안은 전통적인 교육을 밟고, 예전 방식대로 수학과 과학을 배우는 것이 여전히 중요할 것입니다. 하지만 동시에 아주 다른 방식의 과학에도 열려 있어야 합니다. 그중 일부는 아직 존재하지도 않습니다. 무서운 시대이지만, 동시에 아주 흥미진진한 시대이기도 합니다.
17) 당분간은 인간-AI 하이브리드가 수학을 지배할 가능성이 크다
어떤 면에서는, 그들은 이미 인간이 할 수 없는 최전선 수학을 하고 있습니다. 다만 그것은 우리가 익숙한 종류의 최전선과는 다른 최전선입니다. 계산기가 인간이 할 수 없는 최전선 수학을 하고 있었다고 주장할 수도 있습니다. 하지만 그것은 숫자 계산이었죠.
음, 당신은 저를 뭐에 쓰고 싶은 겁니까?
그것은 어쩌면 올바른 질문이 아닐지도 모릅니다. 저는 10년 안에 오늘날의 수학 학생들이 현재 시간을 가장 많이 쓰는 일들, 그리고 오늘날 우리가 논문에 넣는 많은 것들이 AI로 수행될 수 있다고 생각합니다. 하지만 그러고 나면 우리는 그것들이 사실 우리가 하는 일 중 가장 중요한 부분은 아니었다는 것을 알게 될 것입니다.
100년 전에는 많은 수학자들이 그저 미분방정식을 풀고 있었습니다. 물리학자들은 어떤 시스템의 정확한 해를 필요로 했고, 그래서 수학자를 고용해 유체 방정식이든 뭐든, 미적분을 손으로 힘들게 밀어붙여 해를 구하게 했습니다. 19세기 수학자가 하던 많은 일은 오늘날 Mathematica, Wolfram Alpha, 컴퓨터 대수 패키지, 혹은 최근에는 AI에 요청하면 몇 분 안에 해결됩니다. 하지만 그렇다고 수학이 죽은 것은 아닙니다. 우리는 그 이후 다른 종류의 문제들로 옮겨갔습니다.
컴퓨터가 등장한 뒤에도 마찬가지였습니다. 컴퓨터는 예전엔 사람이었습니다. 사람들은 힘들게 로그표를 만들고, 가우스처럼 소수를 계산했습니다. 그런데 그 일은 전부 컴퓨터에게 넘어갔습니다. 하지만 우리는 그 이후로 다른 일을 했습니다.
유전학에서도, 생물 하나의 게놈을 시퀀싱하는 것은 한 유전학자의 박사학위 전체를 차지하는 작업이었습니다. 염색체를 조심스럽게 분리하고, 어쩌고저쩌고. 지금은 1,000달러를 쓰고 시퀀서에 보내면 끝납니다. 하지만 유전학이 죽은 건 아닙니다. 스케일이 바뀌는 것입니다. 개인이 아니라 전체 생태계를 연구하게 되는 식이죠.
제 생각엔 인간과 AI의 하이브리드가 훨씬 더 오랫동안 수학을 지배할 것이라고 믿습니다. 그것은 우리가 이미 가진 것 이상으로 추가적인 돌파를 요구할 것이기 때문에, 꽤 확률적인 문제가 될 것입니다. 저는 현재 AI가 어떤 것들은 매우 잘하지만, 다른 어떤 것들은 정말 형편없다고 생각합니다. 그 위에 점점 더 많은 프레임워크를 올려서 오류율을 낮추고, 서로 조금 더 잘 협업하게 만들 수는 있겠지만, 모든 지적 작업을 정말 만족스럽게 대체하기 위한 모든 재료를 우리가 이미 갖고 있다고는 느껴지지 않습니다.
현재 그것은 대체가 아니라 상보성입니다. 현재 수준의 AI는 이미 수많은 방식으로 과학을 가속할 것이기 때문에, 새로운 발견과 돌파가 더 빨라질 가능성이 있습니다. 동시에 serendipity를 파괴함으로써 어떤 종류의 진보를 오히려 막을 가능성도 있습니다. 지금 시점에서는 정말 뭐든 가능합니다. 세상은 지금 정말, 정말 예측 불가능합니다.
전체 0