목록2026/03/26 (3)
오늘도 공부
Anthropic이 2025년에 공개한 회로 추적 연구로 본 LLM 내부 동작의 실제 모습AI 모델이 점점 더 똑똑해질수록, 개발자에게 더 불편한 질문 하나가 남습니다.모델은 왜 그런 답을 냈는가?지금까지 우리는 프롬프트를 넣고 결과를 받는 방식으로 LLM을 써 왔습니다. 잘 맞으면 “추론을 잘하네”라고 말했고, 틀리면 “환각했네”라고 말했습니다. 하지만 그 사이, 즉 입력에서 출력까지 모델 내부에서 무슨 계산이 일어났는지는 거의 알지 못했습니다. Anthropic은 바로 그 지점을 건드렸습니다. 2025년 3월 공개한 연구에서 이들은 Claude 3.5 Haiku의 내부 계산을 추적하는 “회로 추적” 방법을 제안했고, 시 쓰기, 다국어 처리, 산수, 환각, 탈옥 프롬프트, chain-of-thought..
AI가 코드를 써주는 시대는 이미 왔습니다.그런데 팀에 바로 도움이 되는 건 “코드 생성”이 아니라, 실패한 CI를 다시 고치고, 리뷰 코멘트를 반영하고, 결국 PR을 머지하는 자동화입니다.optio는 바로 그 지점을 겨냥한 프로젝트입니다. 단순히 에이전트를 한 번 실행하는 도구가 아닙니다. AI 코딩 작업을 실제 소프트웨어 전달 파이프라인으로 바꾸는 시스템에 가깝습니다. 작업을 넣으면 저장소 전용 실행 환경을 만들고, Claude Code나 OpenAI Codex를 돌리고, PR을 열고, CI와 리뷰 상태를 감시하다가, 실패하면 다시 에이전트를 깨워 수정하고, 통과하면 자동으로 머지까지 진행합니다. 2026년 3월 24일 기준 0.1.0으로 공개된 초기 버전이며, 저장소는 TypeScript 기반 모노..
AI 코딩 에이전트가 좋아진다고 해서, 갑자기 덜 헤매는 건 아닙니다.오히려 더 자주 같은 실수를 반복합니다.문서에 안 적힌 API 동작, 버전 충돌, CI 설정 함정, 빌드 툴의 미묘한 차이 같은 것들을 세션마다 다시 발견하죠. 인간 개발자가 예전엔 검색으로 해결했다면, 이제는 에이전트가 매번 토큰과 시간을 태우며 같은 벽에 부딪히고 있습니다.Mozilla.ai의 Cq는 바로 이 지점을 찌릅니다. 이 프로젝트는 “AI가 코드를 더 잘 생성하게 하는 도구”라기보다, 에이전트가 이미 누군가 겪은 실패를 다시 겪지 않게 만드는 지식 공용층에 가깝습니다. 저장소의 공식 설명도 Cq를 “shared agent knowledge commons”이자 “shared agent learning을 위한 open stan..
