목록전체 글 (1727)
오늘도 공부
“코딩 도구”에서 “자율 개발 플랫폼”으로 진화하는 법많은 개발자들이 Claude Code를 단순한 “코딩 보조 CLI”로 사용하고 있습니다.하지만 실제로는 그 위에 훨씬 더 큰 레이어가 있습니다.Claude Code는코드를 작성하는 도구가 아니라,개발을 대신 수행하는 시스템입니다.이번 글에서는Claude Code 창시자 **Boris Cherny**가 공개한15가지 핵심 기능을 단순 기능 나열이 아니라👉 “개발 패러다임이 어떻게 바뀌는지” 중심으로 설명합니다.🧠 핵심 철학 (이 글의 요약)이 15개 기능을 관통하는 한 문장:“개발자가 하던 일을 시스템에 위임하라”1️⃣ 개발 환경의 해방(Device → Context 중심으로 이동)✔ 모바일에서 코딩iOS / Android 앱에서 바로 코드 작업 가..
AI 에이전트 시대가 오면서, 이제 문제는 “에이전트를 만들 수 있느냐”가 아닙니다.진짜 어려운 문제는 그 다음입니다. 누가 설정을 바꾸고, 어떤 도구를 붙이고, 여러 에이전트를 어떻게 운영하느냐죠.LangChain이 공개했던 Open Agent Platform은 바로 이 지점을 겨냥했습니다. 에이전트를 코드 덩어리가 아니라 운영 가능한 제품 단위로 다루게 만든 플랫폼입니다. 다만 지금 이 프로젝트를 볼 때 꼭 알아야 할 점이 하나 있습니다. 이 저장소는 2026년 2월 25일에 아카이브되었고, README에서도 deprecated 상태라고 명시하며 현재는 LangSmith의 Agent Builder 사용을 권장하고 있습니다. 즉, OAP는 “지금 당장 도입할 최신 메인 제품”이라기보다, LangChai..
AI 에이전트가 숫자를 읽고, 분석가가 대시보드를 만들고, 퀀트가 파이썬 코드로 시계열 데이터를 다루는 시대다. 문제는 늘 같다. 데이터는 많지만 인터페이스가 제각각이라는 점이다. 공급자마다 인증 방식이 다르고, 응답 스키마가 다르고, 심지어 같은 “주가 히스토리”도 필드 이름과 파라미터가 다르다. OpenBB는 이 지점을 정면으로 겨냥한다. 이 프로젝트는 단순한 금융 라이브러리가 아니라, 금융 데이터를 한 번 연결해서 여러 실행 표면에서 재사용하게 만드는 데이터 플랫폼으로 진화했다. (GitHub)예전에는 OpenBB를 “오픈소스 금융 터미널” 정도로 이해해도 크게 틀리지 않았다. 하지만 지금의 저장소를 보면 방향이 훨씬 분명하다. OpenBB가 강조하는 것은 터미널 UI가 아니라 Open Data P..
AI Agent가 코드를 짜고, 문서를 읽고, 실험을 돌리는 시대가 왔습니다. 그런데 막상 복잡한 일을 맡겨보면 금방 한계가 드러납니다. 에이전트 하나는 똑똑할 수 있어도, 큰 작업을 병렬로 쪼개고, 서로 결과를 주고받고, 충돌 없이 합치고, 다시 우선순위를 바꾸는 일까지 잘하진 못합니다. 결국 사람 개발자가 “매니저” 역할을 하게 됩니다. (GitHub)ClawTeam은 바로 그 지점을 겨냥한 프로젝트입니다. 저장소 설명 그대로, 이 프로젝트는 framework-agnostic한 멀티 에이전트 coordination CLI이고, 에이전트가 다른 에이전트를 spawn하고, task를 나누고, inbox로 메시지를 주고받고, git worktree로 각자 격리된 작업 공간에서 일하게 만듭니다. 즉 “에이전..
1️⃣ 핵심 문제 정의: 왜 캐릭터가 계속 바뀌는가AI는 확률 기반 생성 (seed 랜덤성) → 동일 프롬프트라도 결과 달라짐"은발 남자" → 매번 다른 얼굴 생성됨👉 즉AI는 ‘캐릭터’를 인식하지 않고 ‘조건 조합’을 생성한다2️⃣ 캐릭터 일관성의 3대 원칙✔ 1. 구체성vague ❌ → "handsome man"구체 ✔ → 이름 + 디테일 조합👉 핵심:이름 + 머리 + 눈 + 얼굴 특징 + 액세서리✔ 2. 반복동일 속성 반복 → AI가 “하나의 개체”로 인식👉 사실상:반복 = identity 학습✔ 3. 참조 이미지텍스트보다 훨씬 강력캐릭터 고정의 핵심 무기3️⃣ 일관성 달성 수준 (현실 기준)방법일관성프롬프트만60~70%참조 이미지75~85%Face Embedding85~92%LoRA90~97..
AI 에이전트가 코드를 고치는 시대는 이미 시작됐습니다. 그런데 진짜 재미있는 지점은 “코드를 한 번 생성하는 것”이 아니라, 측정 가능한 목표를 놓고 수십 번 실험하며 스스로 더 나은 방향을 찾게 만드는 것입니다. pi-autoresearch는 바로 그 지점을 정면으로 겨냥한 프로젝트입니다. 터미널에서 동작하는 AI 코딩 에이전트 pi 위에 얹혀, 아이디어를 시도하고, 벤치마크를 돌리고, 개선만 남기고, 퇴행은 되돌리는 루프를 자동화합니다. (GitHub) GitHub - davebcn87/pi-autoresearch: Autonomous experiment loop extension for piAutonomous experiment loop extension for pi. Contribute to ..
Claude-4.6 Opus 상호작용에서 얻은 최첨단 사고 연쇄(Chain-of-Thought, CoT) 추출 기술에 대해 알아보자.CoT는 Chain of Thought의 약자이고, 한국어로는 보통 사고의 연쇄, 생각의 흐름, 단계적 추론 과정 정도로 말합니다.쉽게 말하면, AI가 답만 바로 내놓는 게 아니라왜 그런 답이 나왔는지 중간 사고 단계를 따라가며 푸는 방식 입니다.예를 들어 볼게요.질문:“사과가 3개 있고 2개를 더 사면 몇 개예요?”일반 답변은 그냥:“5개입니다.”CoT 방식은:“처음에 3개가 있고, 2개를 더 샀으니 3+2를 계산하면 5입니다.”즉, 정답만 말하는 것이 아니라 그 정답에 도달하는 과정까지 풀어서 보여주는 것이 CoT입니다.왜 중요하냐CoT가 중요한 이유는, AI가 복잡한 ..
AI 음성 전사는 이제 “된다”의 문제가 아니라 “얼마나 빨리, 얼마나 실용적으로, 얼마나 쉽게 붙일 수 있느냐”의 문제로 넘어왔습니다.insanely-fast-whisper는 바로 그 지점을 찌르는 프로젝트입니다. Whisper를 단순히 잘 돌리는 수준이 아니라, GPU 배치 처리와 최신 attention 구현을 활용해 긴 오디오도 매우 빠르게 전사할 수 있는 형태로 밀어붙였습니다. README에서는 A100 80GB 기준으로 150분 오디오를 Whisper Large v3 + Flash Attention 2 조합으로 98초 안에 처리했다고 소개합니다. (GitHub)이 프로젝트가 흥미로운 이유는 단순합니다.많은 개발자가 Whisper를 좋아하지만, 실제 서비스나 내부 툴에 붙이려는 순간 설치, GPU..
AI 에이전트가 UI를 만들고 나서 “완료했습니다”라고 말하는 순간이 있다. 그런데 정작 개발자가 받는 건 코드 diff와 말뿐이다. 화면이 진짜 떴는지, 버튼이 눌리는지, 콘솔 에러가 없는지, 데모 영상 하나 없이 끝나는 경우가 많다. ProofShot은 바로 그 지점을 찌른다. 이 프로젝트는 AI 코딩 에이전트가 기능을 만든 뒤 실제 브라우저 세션을 녹화하고, 스크린샷과 로그까지 묶어서 사람이 검토할 수 있는 “시각적 증거”를 남기는 CLI다. (GitHub)핵심은 “에이전트가 UI를 만들 수 있느냐”가 아니라 “에이전트가 만든 결과를 사람이 빠르게 믿을 수 있느냐”다. ProofShot은 Claude Code, Cursor, Codex, Gemini CLI, Windsurf처럼 셸 명령을 실행할 수..
AI 시대의 개발팀은 더 이상 “이벤트 수집 도구” 하나만으로 제품을 운영하지 않습니다. 사용자 행동을 보고, 기능을 점진 배포하고, 실험하고, 세션 리플레이로 문제를 재현하고, 필요하면 SQL로 바로 파고들어야 합니다. PostHog가 흥미로운 이유는 이 흐름을 각각의 SaaS로 쪼개지 않고, 하나의 오픈소스 코드베이스 안에서 통합하려 한다는 점입니다. 저장소를 자세히 들여다보면, 이 프로젝트는 단순한 프로덕트 애널리틱스가 아니라 “개발팀용 제품 운영 OS”에 가깝습니다. (GitHub) GitHub - PostHog/posthog: 🦔 PostHog is an all-in-one developer platform for building successful products. We offer prod..
