속보) 오픈AI 직원들 분주해지는중 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

이건 내 개인적인 특이점 순간이다.

이 글은 유료 광고처럼 들릴 수도 있다. 차라리 그랬으면 좋겠다. 나는 기쁘다기보다 걱정된다. 세계는 변하고 있고, AI가 끔찍하게 잘못되는 시나리오들 중에서 불평등이 가장 현실적인데, Anthropic은 그 문제를 가장 덜 걱정하는 것처럼 보인다. OpenAI가 반대 입장, 즉 “모두를 위한 개인용 AGI”를 취하고 있어서 다행이다. 우리가 사는 시대에 칭찬할 만한 입장이라고 생각한다. 하지만 내가 뭐 대단한 사람이라고.

어쨌든 Fable이 나왔으니, 첫 한 시간 동안의 경험만 보고하겠다.

우선, 내가 아끼던 모든 프롬프트들이 해결됐다.

→ λ-계산 퍼즐

→ 버그 관련 질문

→ 원샷 앱 만들기

전부 Fable에게는 사소한 일이었다.

내가 진행 중인 작업 말고는 더 어려운 게 없다.

그래서 지난 며칠 동안 나는 HVM5를 만지작거리고 있었다. HVM5는 더 빠른 루프를 가진 새로운 interaction net evaluator, 즉 상호작용 넷 평가기다.

첫 번째 버전을 작성한 뒤, GPT-5 에이전트 32개를 각각 약 20시간씩 작업하게 두었다. 그 결과 최대 2배 속도 향상이 나왔지만, 파일 크기는 2배로 늘었고 품질은 크게 떨어졌다.

그다음 전체를 더 단순한 코어로 줄였고, Opus 4.8과 GPT 5.5에게 8시간 동안 최적화하게 했다. Opus는 대부분의 벤치에서 실제로 6%에서 34% 정도의 속도 향상을 냈다. GPT는 더 좋은 결과를 냈지만, 안타깝게도 파일이 사용할 수 없는 상태가 됐다.

그다음 Fable에게 최적화를 맡겼다.

2시간 뒤, Fable은 한 케이스에서 1770% 속도 향상, 다른 4개 케이스에서 100% 이상 향상, 평균 22% 향상을 달성했다. 그렇다. 2시간 만에 나, Opus 4.8, 그리고 GPT 5.5 에이전트 무리를 한 자릿수 규모, 즉 대략 10배 차이로 뛰어넘었다.

이게 정상적인 결과일 리 없었다. “분명 벤치마크를 하드코딩한 거야.” GPT 트라우마다. 그래서 설명을 읽어봤고, 실제로 그것이 한 일은 가장 먼저 시도해볼 수 있는, 가장 영향력이 큰 최적화였다. HVM5는 패턴 매칭 노드의 사용되지 않는 가지들을 가비지 컬렉션하느라 많은 시간을 낭비하고 있었던 것 같다. 나는 정적 mat에 대해서는 그 부분을 최적화했지만, 동적 mat에 대해서는 하지 않았다. 실력 문제다. Fable은 동적 mat에서도 그걸 처리하는 법을 알아냈고, 그 결과 일부 벤치에서 엄청난 속도 향상이 나왔다.

그런데 잠깐, 이게 “맞는” 걸까? 아직 확실하지 않다. 그럴듯하긴 하지만, interaction net에서는 이런 걸 아주 쉽게 잘못 처리할 수 있다. 문제는, 내가 Fable의 해법이 버그인지 제대로 된 것인지 확인하려고 감사를 시작하려던 순간, Fable이 나를 끊고 내가 작성한 코드에서 엄청난 버그를 찾았다고 말한 것이다.

…잠깐, 뭐라고?

그러니까… 가비지 컬렉션을 위해 나는 람다 항 포인터에 하나의 비트를 저장해두었다. 그 비트의 의미는 “이 람다가 바인딩한 변수가 해제되었으므로, 이 람다는 자신이 적용되는 어떤 인자든 해제해야 한다”는 것이었다. 그건 괜찮다.

그런데 duplicator 노드에서도 나는 같은 비트를 사용했다. 거기서 그 비트의 의미는 “복제된 변수 중 하나가 해제되었으므로, 이 dup을 그냥 통과시키는 no-op으로 취급하라”는 것이었다. 그래서 람다가 duplicator 안으로 들어가면, duplicator는 람다의 collection bit를 자기 자신의 비트로 착각하고, 그 결과 상호작용이 깨지는 것이다.

말이 길다. 내가 왜 이걸 쓰고 있냐고?

방금 일어난 일이 얼마나 터무니없는지 느껴보라는 것이다. 나는 Fable에게 버그를 찾아달라고 하지 않았다. 최적화를 요청했을 뿐이다. 설령 버그를 찾아달라고 했다고 해도, 이 버그는 너무나 미묘하고 구체적이라서, 발견하려면 나조차 넘어서는 수준으로 이 도메인을 숙달해야 한다. 내가 운 좋게 발견했다 해도 고치는 데 몇 시간, 아니 며칠은 쉽게 걸렸을 것이다. 사실은 그냥 눈에 띄지 않고 지나갔을 가능성이 크다.

그런데 Fable은 아무렇지도 않게 그걸 찾아서 고쳤다. 동시에, 나도 Opus 4.8도 GPT 5.5 무리도 겨우 2배 빠르게 만드는 것조차 제대로 해내지 못했던 파일에 17배 속도 향상을 추가하고 있었다.

아, 그리고 다른 탭에서는 Bend의 코드베이스를 거침없이 훑어가며 내가 해야 했던 일들을 전부 끝내고 있다.

이제 뭐라고 말해야 할지 모르겠다.

이건 Anthropic이나 OpenAI에 관한 이야기가 아니다. 이것은 종으로서 우리 모두의 미래에 관한 이야기다. 세계는 변하고 있고, 우리는 그 사실을 인식해야 하며, 이 변화를 어떻게 다룰지 논의해야 한다.

증거는 아래에…

echo.hive:

놀랍네요! 경험을 공유해줘서 고마워요.

Rand:

오늘 우리가 특이점에 들어선 것 같은 느낌이다.

Ygor:

이게 AI 자체의 개선을 얼마나 반영하는 건지, 아니면 훈련 데이터의 개선을 반영하는 건지에 대해서는 좀 회의적이다.

Taelin:

더 곤란한 건, 나도 실제로 발전의 99%는 훨씬 더 좋고 더 큰 데이터셋 덕분이었다고 생각한다는 점이다. OpenAI는 GPT-4.5 때문에 프리트레이닝을 너무 일찍 포기한 것 같다.

– dc official App

– 씹덕프사 팩폭 지리네 시발ㅋㅋㅋㅋ

ㅋㅋㅋㅋㅋㅋㅋ

https://x.com/Elaina43114880/status/2064411739425530223

– 속보) Fable 대응하려면 GPT-6 가져와야 함 ㅇㅇ

– 속보) GPT-5.5 Pro가 Fable 따이이이잇

– 속보) 오푸스 4.8 유출자 제미니 3.5 프로 언급

– (앤트로픽) Claude Fable 5와 Claude Mythos 5

공지

Claude Fable 5와 Claude Mythos 5

2026년 6월 9일

여러 마리의 나비로 이루어진 숫자 5

오늘 우리는 일반 사용에 안전하도록 만든 Mythos급[1] 모델, Claude Fable 5를 출시합니다.

Fable 5의 역량은 지금까지 우리가 일반 제공한 어떤 모델보다 뛰어납니다. AI 역량을 측정하기 위해 테스트한 거의 모든 벤치마크에서 최첨단 성능을 보였고, 소프트웨어 엔지니어링, 지식 업무, 비전, 과학 연구를 비롯한 여러 영역에서 탁월한 성능을 나타냈습니다. 과제가 길고 복잡할수록 Fable 5가 우리의 다른 모델들보다 보이는 우위는 더 커집니다.

이 정도 역량을 지닌 모델을 공개하는 데에는 위험이 따릅니다. 안전장치가 없다면 Fable 5의 사이버보안 같은 영역에서의 역량은 심각한 피해를 일으키는 데 오용될 수 있습니다. 그래서 우리는 일부 주제의 질의에는 대신 우리의 다음으로 유능한 모델인 Claude Opus 4.8이 응답하도록 하는 안전장치를 적용해 이 모델을 출시했습니다. 모델을 안전하면서도 빠르게 공개하기 위해 우리는 이러한 안전장치를 보수적으로 조정했습니다. 이 장치들은 때때로 무해한 요청도 잡아내겠지만, 평균적으로는 세션의 5% 미만에서 작동합니다. 앞으로 몇 달 안에 더 유능한 모델들이 등장할 예정이므로, 우리는 가능한 한 빠르게 안전장치를 개선하고 오탐을 줄이기 위해 노력하고 있습니다.

소수의 사이버 방어자와 인프라 제공자를 위해, 우리는 Claude Mythos 5도 함께 출시합니다. 이 모델은 Fable 5와 동일한 기반 모델이지만 일부 영역에서 안전장치가 해제되어 있습니다.[2] Mythos 5는 우선 미국 정부와의 협력 아래 Project Glasswing을 통해 Claude Mythos Preview의 업그레이드로 배포됩니다. 이 모델은 전 세계 어떤 모델보다도 강력한 사이버보안 역량을 갖추고 있습니다. 조만간 우리는 더 폭넓은 신뢰 기반 접근 프로그램을 통해 Mythos 5 접근 권한을 확대할 계획입니다.

Fable 5와 Mythos 5 같은 모델의 역량은 세상에 큰 이로움을 가져올 잠재력이 있습니다. 우리는 Project Glasswing에서 그 시작을 보았습니다. 이 모델들은 사이버 방어자들이 매우 중요한 소프트웨어를 보호하도록 도왔습니다. 또한 생명과학 연구에서도 그 가능성을 보았습니다. 이 모델들은 새로운 가설을 제시하고 새로운 치료제 개발 속도를 높이고 있습니다.

Fable 5와 Mythos 5는 입력 토큰 100만 개당 10달러, 출력 토큰 100만 개당 50달러로 제공됩니다. 이는 Claude Mythos Preview 가격의 절반보다 낮습니다. 오늘의 공동 출시는 가능한 한 많은 사용자에게, 가능한 한 빠르고 안전하게 고급 AI 역량을 제공하려는 우리의 목표를 향한 또 하나의 단계입니다.

Claude Fable 5와 Claude Mythos 5 평가

아래 표는 Fable 5와 Mythos 5의 역량을 다른 주요 모델들과 비교합니다.

Claude Fable과 Mythos를 다른 주요 모델들과 비교한 벤치마크 표

Fable 5와 Mythos 5는 이전의 어떤 Claude 모델보다 더 오래 자율적으로 작업할 수 있습니다. 아래에서는 이러한 능력이 소프트웨어 엔지니어링에 어떻게 적용되는지 논의하고, 지식 업무, 비전, 메모리, 생명과학 연구에서 향상된 모델 역량을 다룹니다.

소프트웨어 엔지니어링. 초기 테스트에서 Stripe는 Fable 5가 몇 달치 엔지니어링 작업을 며칠로 압축했다고 보고했습니다. 5,000만 줄짜리 Ruby 코드베이스에서 이 모델은 원래 팀 전체가 수작업으로 두 달 넘게 걸렸을 코드베이스 전반의 마이그레이션을 하루 만에 수행했습니다. Fable 5는 이전 Claude 모델들보다 토큰 효율도 더 높습니다. 고품질 프로덕션 코드베이스의 기준을 충족하면서 어려운 코딩 작업을 통과할 수 있는지를 테스트하는 Cognition의 FrontierCode 평가에서, Fable 5는 중간 수준의 노력에서도 프런티어 모델 중 가장 높은 점수를 기록했습니다.

지식 업무. Fable 5는 복잡한 분석 작업에서 강력한 성능을 보입니다. 시니어급 추론을 평가하는 Hebbia의 Finance Benchmark에서 Fable 5는 어떤 모델보다도 높은 점수를 기록했으며, 문서 기반 추론, 차트와 표 해석, 문제 해결에서 상당한 향상을 보였습니다. IMC는 Fable 5가 사실 조회, 개념적 추론, 근본 원인 분석, 기대값 분석을 포함해 자사의 거래 분석 평가 거의 전반에서 만점을 받았다고 언급했습니다.

비전. Fable 5는 비전이 관련된 작업에서 새로운 최첨단 모델입니다. 상세한 과학 도표에서 정확한 숫자를 추출할 수 있고, 스크린샷만으로 웹 앱의 소스 코드를 재구축하는 것 같은 복잡한 비전 기반 작업도 수행할 수 있습니다. 또한 보조 구조도 덜 필요합니다. 예를 들어 이전 Claude 모델들은 추가로 유용한 도구를 제공하는 하네스가 있어도 Pokémon FireRed를 플레이하는 데 어려움을 겪었지만, Fable 5는 최소한의 비전 전용 하네스만으로 FireRed를 클리어했습니다.

동영상 제목: Claude Fable 5가 비전만 사용해 Pokémon FireRed를 클리어

https://youtu.be/Ty_50J84fMY

Claude가 원시 게임 스크린샷만 사용해 Pokémon FireRed를 처음부터 끝까지 플레이하는 타임랩스입니다. 지도, 길 찾기 보조 기능, 추가 게임 상태 정보는 사용하지 않았습니다. 이전 Claude 모델들은 Pokémon을 플레이하려면 복잡한 보조 하네스가 필요했지만, Claude Fable 5는 비전만으로 게임을 완료했습니다.

메모리와 장문 컨텍스트. Fable 5는 장시간 진행되는 작업에서 수백만 토큰에 걸쳐 집중력을 유지하고, 자신이 작성한 노트를 활용해 결과물을 개선합니다. 우리는 이 모델에게 덱 빌딩 게임 Slay the Spire를 플레이하게 했습니다. 지속적인 파일 기반 메모리에 접근할 수 있게 하자 Opus 4.8보다 성능 향상 폭이 세 배 더 컸고, Fable은 게임의 최종 막에 도달한 빈도도 세 배 더 높았습니다.

미디어 캐러셀 탭: 일식 / Factorio / VibeCAD / 클래식 EDM을 곁들인 유체

동영상 제목: Claude Fable 5가 태양계를 시뮬레이션하고 일식을 예측

https://youtu.be/5f5JYLZHdhw

Claude Fable 5는 태양계의 이 시뮬레이션을 만들면서 물리학의 제1원리에서 행성의 궤도 운동을 도출했고, 이를 이용해 일식을 예측했습니다.

동영상 제목: Claude Fable 5가 Factorio를 플레이

https://youtu.be/6YPqoARpYuQ

Claude Fable 5는 엔지니어들이 좋아하는 공장 건설 게임 Factorio를 자율적으로 플레이하면서 스스로 전략을 세우고 자동화 공장을 건설합니다.

동영상 제목: Claude Fable 5가 Claude가 만든 CAD 편집기에서 3D 프린팅 가능한 모델을 설계

https://youtu.be/tpjJeH1pPws

Claude Fable 5는 브라우저 기반 CAD 편집기에서 완전한 3D 프린팅 가능 모델을 설계합니다. 이 편집기 자체도 Fable 5가 만들었으며, 모델링을 수행하는 내장 AI 코파일럿까지 포함되어 있습니다.

동영상 제목: Claude Fable 5가 유체 시뮬레이션을 Beethoven에 맞춤

https://youtu.be/xmP7bhigCWE

Claude Fable 5가 코딩한 유체 시뮬레이션입니다. 움직임은 클래식 음악 EDM 리믹스의 비트에 동기화되어 있으며, 이 음악은 음악을 들어본 적이 없는 Claude Fable 5가 코드를 사용해 제작했습니다.

약물 설계. Mythos 5를 사용해, 우리의 내부 단백질 설계 전문가들은 약물 설계 과정의 일부 측면을 약 10배 가속했습니다. 한 예에서 그들은 단백질 설계 및 생물정보학 도구를 갖춘 Mythos 5가 사람의 도움 없이도 숙련된 인간 작업자와 동등하거나 더 나은 성과를 낸다는 사실을 확인했습니다. 이 과정에서 모델은 과학자가 보통 수행하는 모든 작업, 즉 결합 부위 선택, 단백질 설계 도구 선택 및 실행, 진행 중 발생하는 실패 복구를 수행합니다. 이 연구의 14개 단백질 표적 중 9개는 현재 우리가 조사 중인 약물 설계용 강력한 후보를 산출했습니다.

Mythos 5가 설계한 단백질 복합체. 표적에는 면역 체크포인트, 성장인자 및 수용체 신호전달, 신경퇴행, 근육 질환, 그리고 더 어려운 구조적 표적이 포함됩니다.

분자생물학의 새로운 가설. Mythos 5는 새롭고 설득력 있는 과학 가설을 일관되게 만들어내는 우리의 첫 모델입니다. Opus급 모델들과의 블라인드 일대일 비교에서, 우리 과학자들은 약 80%의 경우 Mythos의 분자생물학 가설을 선호했으며, 그중 여러 개를 실험 평가 단계로 진전시켰습니다. 그 사이 Mythos의 한 가설, 즉 E. coli 단백질에 관한 새로운 메커니즘은 같은 문제를 독립적으로 연구하던 연구실의 한 연구에서 뒷받침되었습니다.

유전체학의 새로운 연구. Mythos 5는 일주일이 넘는 기간 동안 대체로 자율적으로 새로운 유전체학 연구를 수행했습니다. 이 모델은 138종의 동물에 걸친 수백만 개 세포의 단일세포 데이터를 조립했고, 멀리 떨어진 관련성을 지닌 생물에서도 같은 역할을 수행하는 세포를 식별하기 위해 맞춤형 머신러닝 모델을 설계하고 훈련했습니다. 높은 수준의 인간 입력만으로, Mythos 5가 훈련한 모델은 학술지 Science에 최근 발표된 모델보다 성능이 뛰어났습니다. 그 모델보다 100배 더 작았음에도 그렇습니다. 우리는 앞으로 몇 달 안에 이 결과를 발표할 계획입니다.

정렬. 우리의 자동화된 정렬 평가에서, Mythos 5의 비정렬 행동 수준은 낮았고 Opus 4.8과 비슷했습니다. 여기에는 모델이 취하는 기만 같은 비정렬 행동과, 사용자의 모델 오용에 협조하는 행동이 포함됩니다. 두 모델은 동일한 기반 모델이므로 Fable 5의 정렬 수준도 비슷할 것입니다. 이 평가는 다른 안전성 및 역량 테스트의 상세한 묶음과 함께 모델의 시스템 카드에 전체 내용이 설명되어 있습니다.

우리의 자동화된 정렬 평가에서 나타난 비정렬 행동의 전반적 수준. 자세한 내용은 시스템 카드 6.2.3.1절을 참조하세요.

Claude Fable 5에 대한 초기 피드백

초기 접근 권한을 받은 고객들은 Fable 5로 자체 테스트를 진행했습니다. 아래는 그들이 보고 있는 내용을 그들의 말로 추린 것입니다.

인용문 01 / 14

“Claude Fable 5는 CursorBench에서 최첨단 모델입니다. 이전 모델들로는 닿을 수 없었던 장기 과제 부류를 열어주었습니다.”

– Michael Truell, CEO and Co-founder

“Claude Fable 5는 GitHub가 지원하는 개발자들에게 진정한 진전입니다. 우리의 초기 테스트에서 이 모델은 이전 벤치마크를 넘어서는 수준의 자율성과 신뢰성으로 복잡한 장기 코딩 작업을 처리했습니다. 하지만 우리를 가장 기대하게 하는 것은 이 모델이 가리키는 방향입니다. 개발자들이 점점 더 야심 찬 작업을 에이전트에게 맡기고 소프트웨어 생명주기 전반에서 결과를 신뢰할 수 있는 미래입니다.”

– Mario Rodriguez, Chief Product Officer

“이것은 우리가 테스트할 기회를 가졌던 어떤 Claude 모델보다도 강력한 결과입니다. Claude Fable 5는 에이전트형 코딩과 프로토타이핑에서 분명한 진전입니다.”

– Matt Colyer, Director of Product, Developers

“Claude Fable 5의 추론은 Opus 4.8을 분명히 넘어섭니다. 이 모델은 시니어 연구 과학자 수준으로 작동합니다. 방향을 고르고, 자원을 배분하고, 자신의 잘못된 믿음을 폐기하며, 제1원리에 기반한 새로운 결과물을 만들어냅니다.”

– Sean Ward, CEO and Co-founder

“Claude Fable 5는 빌더들이 타이핑한 내용뿐 아니라 그들이 의미하는 바를 이해합니다. 1년 전에는 프롬프트 100개가 필요했던 앱을 이제는 한 번에 만들어냅니다. 고객이 정말로 벽에 부딪혔을 때, 그들이 만들려고 했던 것을 끝낼 수 있도록 빠르게 넘겨주기 위해 우리가 찾는 모델이 바로 이 모델입니다.”

– Fabian Hedin, CTO & Co-founder

“Claude Fable 5는 실질적으로 다르게 느껴집니다. 블라인드 리뷰에서 우리 변호사들은 이 모델의 수정 표시가 매번 우리의 현재 모델과 맞먹거나 더 낫다고 판단했습니다.”

– Aveek Duttagupta, Member of Technical Staff

“가장 높은 노력 수준에서 Claude Fable 5는 자신의 작업을 성찰하고 검증합니다. 우리에게는 그것이 고도로 자율적인 운영을 가능하게 하는 요소입니다. 추가적인 사고는 그만한 값을 합니다.”

– Yusuke Kaji, GM, AI for Business

“Claude Fable 5는 이전 모델들보다 더 적은 턴으로 더 유능한 엔지니어링을 제공합니다. 우리 직원들이 Claude Code에서 매일 실행하는 복잡한 다중 에이전트 워크플로를 처리합니다.”

– Luke Anderson, CTO

“Claude Fable 5는 Cognition의 프런티어 코딩 평가인 FrontierBench에서 가장 높은 점수를 받은 모델입니다. 장기 추론에 뛰어나며, 낯선 도구에도 곧바로 일반화합니다.”

– Scott Wu, CEO

“Claude Fable 5는 우리가 테스트한 모델 중 일반 금융과 추론 양쪽에서 가장 강력한 금융 우선 모델입니다. 주목할 만한 도약입니다.”

– Damian Miraglia, Principal Engineer, Applied AI

“Claude Fable 5는 복잡하고 장시간 지속되는 분석 작업을 다루는 우리의 핵심 분석 벤치마크에서 90%를 돌파한 첫 모델입니다. Opus보다 10점 상승했습니다. 가장 어려운 질문에서 강한 판단력과 뉘앙스에 대한 주의를 보여줍니다.”

– Izzy Miller, AI Research Lead

“Claude Fable 5는 추론 토큰을 3분의 1만 사용하면서도 우리가 프런티어 물리학 연구에서 테스트한 모델 중 가장 강력한 모델입니다. 36시간 만에 GPT-5.5가 나흘 뒤 도달한 지점에 거의 근접했습니다.”

– Matthew Pines, CEO

“엔드투엔드 바이브 코딩 벤치마크인 ViBench에서 Claude Fable 5는 우리가 테스트한 모델 중 가장 성능이 뛰어납니다. 우리의 기본 사용 사례를 거의 포화시키며, 더 적은 시간과 더 적은 토큰으로 앱을 만듭니다.”

– Michele Catasta, President & Head of AI

“Claude Fable 5는 모든 노력 수준에서 우리의 일상 스프레드시트 제품군에서 Opus 4.8을 이깁니다. 그리고 더 적은 턴으로 이를 해내며, 실행을 25~30% 더 빠르게 마칩니다.”

– Peter Wang, Chief Science Officer

Claude Fable 5의 새로운 안전장치

Mythos급 모델들은 중대한 위험을 제기하는 문턱에 도달했습니다. 4월에 우리는 Project Glasswing을 시작하며, 첫 Mythos급 모델인 Claude Mythos Preview를 제한된 사이버 방어자 및 핵심 소프트웨어 인프라 제공자 그룹에만 공개했습니다. 그때 우리는 오용을 신뢰성 있게 막을 만큼 강력한 새로운 안전장치를 개발하는 한, 언젠가 Mythos 수준의 역량을 모든 사용자에게 공개하고 싶다고 밝혔습니다.

지난 몇 달 동안 우리는 이러한 안전장치를 개선해왔고, 이제 이 장치들은 일반 공개에 충분히 견고해졌습니다. 우리는 안전을 우선시했기 때문에 의도적으로 안전장치를 신중하게 조정했고, 이 장치들은 여전히 이상적인 수준보다 더 엄격합니다. 예를 들어 때때로 무해한 요청이 우리의 분류기를 작동시킬 수 있습니다. 우리는 이것이 일부 사용자에게 불편을 줄 것임을 알고 있으며, 출시 후 안전장치를 업데이트하고 다듬으면서 오탐을 줄이는 것을 목표로 하고 있습니다.

아래에서는 Fable 5의 새로운 안전장치를 하나씩 논의합니다. 우리의 더 넓은 안전장치 묶음은 모델의 시스템 카드와 가장 최근의 위험 보고서에서 논의되고 평가됩니다.

안전 분류기

Mythos급 모델의 프런티어 사이버보안 및 연구 생물학 역량은 악의적 행위자에게 상당한 수준의 역량 상승 위험을 제기한다는 뜻입니다. 즉, 이러한 모델들은 그 행위자들이 다른 출처, 예를 들어 인터넷 검색 엔진에서는 얻을 수 없었을 정보나 조언을 제공해 심각한 피해를 일으키도록 도울 수 있습니다. 더구나 AI 모델의 고급 활용 상당 부분은 이중용도입니다. 사이버보안 전문가와 생물학 연구자의 손에서는 유익한 동일한 질의가, 악의적 행위자에게 제공되면 위험할 수 있습니다.

따라서 우리는 오용을 막기 위한 강력한 안전장치가 필요하며, 그 적용 범위도 넓어야 합니다. 안전장치 자체는 이를 우회하려는 지속적이고 정교한 시도, 즉 시스템을 “탈옥”하려는 시도도 견뎌야 합니다. Mythos 수준 역량에서 얻는 역량 상승은 많은 적대자들에게 가치가 있습니다. 예를 들어 사이버공격으로 금전적 이익을 얻을 수 있는 이들이 그렇습니다. 그래서 우리는 그들이 우리의 안전 조치를 우회하려는 동기를 가질 것으로 예상합니다.

Fable 5에는 새로운 분류기 세트가 포함되어 있습니다. 이는 탈옥 시도를 포함한 잠재적 오용을 감지하고, 메인 모델, 이 경우 Fable 5가 응답하지 못하게 하는 별도의 AI 시스템입니다. 우리는 한동안 우리의 모델에서 분류기를 운영해왔으며, Fable 5의 분류기는 추가 적용 범위를 갖춘 이전 작업의 확장입니다.

Fable의 분류기가 사이버보안, 생물학과 화학, 또는 증류와 관련된 요청을 감지하면, 응답은 자동으로 Claude Opus 4.8이 처리합니다. 이 일이 발생할 때마다 사용자에게는 그 사실이 알려집니다. Opus 4.8 역시 그 자체로 매우 유능한 모델입니다. Opus로 폴백되는 응답은 Fable이 완전히 거부하는 것보다 훨씬 나은 경험입니다. 우리의 초기 데이터에 따르면 Fable 세션의 95% 이상은 어떤 폴백도 전혀 포함하지 않습니다. 그런 세션에서 Fable 5의 성능은 사실상 Mythos 5와 동일합니다.

분류기가 다루는 영역은 다음과 같습니다.

1. 사이버보안. Mythos급 모델은 소프트웨어 취약점을 발견하고 악용하는 데 탁월합니다. 따라서 사이버공격을 수행하는 일을 훨씬 더 쉽고 저렴하게 만들 수 있습니다. Mythos급 모델은 에이전트형 해킹에서도 강력한 능력을 보입니다. 이는 익스플로잇을 찾는 것 외에도 정찰, 발견, 횡적 이동 등 사이버공격의 여러 부분을 수행하는 것을 포함합니다. 이러한 에이전트형 해킹 능력이 사이버공격에서 역량 상승을 제공하지 못하도록, 우리는 사이버보안 분류기가 익스플로잇뿐 아니라 더 넓은 의미의 공격적 사이버 작업을 포괄하도록 설계했습니다. 아래 그래프에서 보이듯, 우리의 분류기는 Fable이 이러한 작업에서 어떤 진전도 이루지 못하도록 막습니다.

Opus 4.8로 폴백하는 대신 응답을 차단하는 모드의 Fable 5로 사이버 평가[3]를 실행한 결과. 평가는 안전장치 회피 시도를 포함하지 않았습니다.

우리는 탈옥에 대한 분류기의 견고성을 테스트하기 위해 광범위한 레드팀 평가를 수행했습니다. 내부 테스트와 더불어, 1,000시간이 넘는 테스트에서도 보편적 탈옥이 나오지 않은 외부 버그 바운티도 운영했습니다. 우리가 참여시킨 외부 레드팀 조직들 역시 지금까지 장문의 에이전트형 작업에서 어떤 보편적 탈옥도 찾지 못했습니다. 다만 UK AISI는 짧은 초기 테스트 기간 안에 보편적 탈옥에 가까워지는 진전을 보였습니다.[4] 보편적 탈옥을 완전히 막는 것은 아마 불가능하겠지만, 우리의 목표는 남아 있는 어떤 탈옥도 충분히 느리고 비용이 많이 들게 만들어 그것들이 대규모로 사용되기 전에 우리가 감지하고 막을 수 있도록 하는 것입니다.

아래 그래프는 우리의 내부 평가 중 하나에서 나온 것으로, Fable 5의 안전장치가 이전의 일반 접근 가능 모델들보다 탈옥에 대한 더 큰 저항력을 제공하는 방식을 보여줍니다.

자동화된 레드팀 모델이 400턴에 걸쳐 공격적 사이버보안과 관련된 짧은 작업을 완료하기 위해 모델을 사용하려고 시도하며, 차단될 때마다 재시작하고 되감는 내부 평가 결과. 작업들은 대부분 단순하며 실제 사이버 사용을 대표하지 않습니다. 때로는 원격 서버의 파일을 암호화하는 정도로 단순합니다. 더 복잡하고 현실적인 작업에서는 우리의 프로덕션 시스템에서 아직 성공적인 탈옥을 보지 못했습니다. Opus 4.6에는 차단형 사이버 안전장치가 없다는 점에 유의하세요.

우리의 외부 파트너 중 한 곳은 유해한 사이버 질의에 대한 Fable 5의 안전장치가 테스트한 어떤 모델보다도 견고하다는 사실을 발견했습니다. 여기에는 Opus 4.8과 Opus 4.7도 포함됩니다. Fable 5는 사이버공격 계획, 익스플로잇 개발, 방어 회피와 관련된 유해한 단일 턴 요청에 하나도 응하지 않았습니다. 이는 해당 요청이 30가지 서로 다른 공개 탈옥 기법 중 어떤 것을 사용했는지와 무관하게 유지되었습니다.

2. 생물학과 화학. 우리는 오랫동안 우리의 분류기를 사용해, 생물무기 관련 질의 중 좁은 범위에 대해 모델이 응답하지 못하도록 차단해왔습니다. 하지만 이제 우리는 이 좁은 범위만 차단하는 것으로 충분하다고 확신하지 못합니다. 이유는 두 가지입니다. 첫째, 자원이 풍부한 악의적 행위자들이 매우 위험한 생물학 연구를 위해 우리의 모델에서 역량 상승을 얻으려 할 수 있다는 우려할 만한 이유가 있습니다. 둘째, 모델들은 이제 현실 세계의 과학 작업을 수행할 수 있는 능력이 더 커졌습니다.

예를 들어, 우리는 아데노연관바이러스(AAV) 설계에서 어려운 한 단계를 완료하는 Mythos 5의 능력을 테스트했습니다. AAV는 유전자 치료제를 전달하는 구성요소이지만, 같은 능력이 잘못된 손에 들어가면 위험한 바이러스 설계를 가능하게 할 수 있습니다. 이 작업에서 다양한 AI 모델들은 유전자 변형이 바이러스 외피의 조립에 어떤 영향을 미칠지를 예측하는 능력으로 평가되었습니다. 이는 Dyno Therapeutics가 개발한 치료 관련 미공개 후보군을 대상으로 했습니다. 우리는 이 작업을 수행하도록 모델을 명시적으로 훈련하지 않았습니다. 그런데도 Mythos급 모델들은 생물학적 추론만으로 단백질 작업 전용의 정교한 모델, 즉 “단백질 언어 모델”보다 더 나은 성능을 냈습니다. 이는 유전자 치료 연구개발에서 단순하지만 중요한 작업을 수행할 수 있는 유망한 능력을 보여줍니다. 동시에 이러한 이중용도 역량이 제기하는 위험도 부각합니다.

우리 모델들이 단순한 바이러스의 바이러스 외피에 대한 미공개 실험 특성을 예측한 평가 결과. 바이러스 외피 조립은 이 맥락에서 예측하기 가장 단순한 바이러스 형질이지만, 더 복잡한 특성을 설계할 때에도 정확히 맞혀야 하는 중요한 속성입니다. AAV = 아데노연관바이러스.

우리의 우선순위는 안전장치가 지나치게 넓어지는 대가를 치르더라도 가능한 한 빨리 Fable을 안전하게 공개하는 것이었습니다. 그래서 당분간 우리는 생물학과 화학에 관련된 대부분의 요청에서 Fable이 Opus 4.8로 폴백하도록 설정했습니다. 우리의 모든 분류기와 마찬가지로, 우리는 가능한 한 빨리 이러한 안전장치의 범위를 좁히기를 바랍니다. 위의 증거에서 볼 수 있듯 Fable을 과학에 긍정적으로 활용할 수 있는 잠재력은 크며, 우리는 분류기의 오탐이 이를 가로막는 것을 원하지 않습니다. 앞으로 몇 주 안에 일부 생의학 연구자와 기업은 Mythos 5의 생물학 역량에 대한 신뢰 기반 접근 프로그램에 참여할 수 있게 될 것입니다. 이는 아래에서 논의합니다.

3. 증류. 우리는 이전에 Claude의 역량을 추출, 즉 “증류”해 권위주의 국가에서 경쟁 모델을 훈련하려는 대규모 시도를 식별한 바 있습니다. Fable 5 능력의 증류는 간접적으로 거의 프런티어 수준의 AI 역량 확산으로 이어질 수 있으며, 이러한 역량은 적절한 안전장치 없이 공개될 수 있습니다. 우리 분류기가 그러한 증류 시도의 일부로 판단한 요청은 Opus 4.8로 폴백됩니다.

새로운 데이터 보존 정책

마지막으로, 우리는 Fable 5, Mythos 5, 그리고 이와 비슷하거나 더 높은 역량 수준을 지닌 향후 모델에서 비즈니스 고객 데이터를 처리하는 방식을 변경합니다. 우리는 퍼스트파티와 서드파티 표면 모두에서 Mythos급 모델의 모든 트래픽에 대해 30일 보존을 요구할 것입니다. 이 데이터를 새로운 Claude 모델 훈련이나 안전과 관련 없는 어떤 목적으로도 사용하지 않을 것이며, 데이터에 대한 모든 사람의 접근을 기록하고 거의 모든 경우 30일 후 삭제를 보장하는 등 새로운 개인정보 보호 조치를 도입했습니다. 자세한 내용은 이 게시물을 참조하세요. 이 데이터는 새로운 탈옥과 여러 요청에 걸쳐 작동하는 공격을 포함한 복잡하고 새로운 공격을 방어하는 데 도움이 되며, 오탐을 식별하고 줄이는 데도 도움이 됩니다.

Claude Mythos 5와 신뢰 기반 접근 프로그램

오늘부터 현재 Claude Mythos Preview에 접근 권한을 가진 모든 사용자, 예를 들어 Project Glasswing의 사이버보안 파트너들은 Claude Mythos 5로 업그레이드할 수 있습니다. 이는 Claude Fable 5와 동일한 모델이지만 사이버 안전장치가 해제된 버전입니다. 사용자들은 대부분의 경우 Mythos 5가 Mythos Preview와 비슷하거나 다소 더 강력하면서도 비용은 상당히 낮다는 것을 알게 될 것입니다.

미국 정부와 협의해, 우리는 새로운 파트너를 주기적으로 추가하는 일을 계속하면서 Claude Mythos 5에 대한 접근 권한을 꾸준히 확대할 계획입니다. 또한 사이버보안 조직이 더 체계적인 방식으로 신청할 수 있는 신뢰 기반 접근 프로그램도 추진할 예정입니다.

우리의 계획에는 Mythos급 역량으로 생의학 연구를 가속하고 새로운 치료제를 발견하는 데 도움이 되도록 생물학 분야의 신뢰 기반 접근 프로그램을 여는 것도 포함됩니다. 이 프로그램은 생물학과 화학 안전장치가 제거된 Fable 5 접근 권한을 제공할 것입니다. 단, 사이버 안전장치는 그대로 유지됩니다. 이 프로그램은 기초 연구와 중개 연구를 아우르는 다양한 생명과학 조직의 소수 연구자들을 등록할 것이며, 우리는 안전장치를 개선해나가는 동시에 이 프로그램의 접근 권한을 확대할 계획입니다.

이용 가능 여부

Claude Fable 5는 오늘부터 모든 곳에서 이용 가능합니다. Claude Mythos 5는 더 폭넓은 신뢰 기반 접근 프로그램이 제공될 때까지 Glasswing 파트너, 즉 사이버 안전장치가 해제된 파트너와, 조만간 일부 생물학 연구자, 즉 생물학과 화학 안전장치가 해제된 연구자에게만 제한됩니다.

두 모델의 가격은 입력 토큰 100만 개당 10달러, 출력 토큰 100만 개당 50달러입니다. 개발자는 Claude API를 통해 claude-fable-5를 사용할 수 있습니다.

우리는 Fable 5에 대한 수요가 매우 높고 예측하기 어려울 것으로 예상합니다. Claude API와 사용량 기반 Enterprise 요금제에서는 Fable 5를 오늘부터 완전히 이용할 수 있습니다. 구독 요금제의 경우, 우리는 늦게 제공하기보다는 빨리 접근 권한을 주는 쪽을 선호하므로 더 보수적으로 단계별 출시를 진행하고 있습니다.

• 오늘부터 6월 22일까지 Fable 5는 Pro, Max, Team, 좌석 기반 Enterprise 요금제에 추가 비용 없이 포함됩니다.

• 6월 23일에는 해당 요금제에서 Fable 5를 제거할 예정입니다. 그 이후 사용하려면 사용량 크레딧이 필요합니다. 용량이 허용되면 포함 제공 기간을 연장할 것입니다.

• 이 시점 이후, 충분한 용량이 허용되면 우리는 Fable 5를 구독 요금제의 표준 구성으로 복원하는 것을 목표로 합니다. 우리는 이를 가능한 한 빠르게 하려 합니다.

이 기간 동안 우리는 변경 사항이 있을 때 사용자가 상황을 알 수 있도록 사전에 안내하겠습니다.

2026년 6월 9일 수정: 후보들이 Dyno Therapeutics에 의해 개발되었다는 점을 명시하기 위해 AAV 논의를 업데이트했습니다.

각주

출처: 특이점이 온다 갤러리 [원본 보기]

답글 남기기 응답 취소

관련 기사

여성 대상 가게들의 이상한 문화 ㅎㅎ

싱글벙글 트위터(X) 근황jpg

핫딜 [닌텐도공홈] 닌텐도 스위치 2 본체

놓쳤을 수도 있습니다

여성 대상 가게들의 이상한 문화 ㅎㅎ

싱글벙글 트위터(X) 근황jpg

핫딜 [닌텐도공홈] 닌텐도 스위치 2 본체

14억을 거절한 20살의 계산법.jpg