목록2026/06 (14)
오늘도 공부
Computer Use, Chrome, Browser는 언제 어떻게 써야 할까?AI 에이전트가 코드를 짜는 시대는 이미 익숙해졌다.그런데 이제 중요한 질문은 조금 달라졌다.“AI가 코드를 쓰는 것을 넘어, 실제 컴퓨터 화면을 보고 조작할 수 있다면 무엇이 달라질까?”OpenAI Codex에는 컴퓨터를 다루는 방식이 여러 가지 있다.겉으로 보면 비슷해 보인다. 모두 웹사이트를 열 수 있고, 화면을 볼 수 있고, 사용자를 대신해 작업할 수 있다.하지만 실제로는 목적이 다르다.Codex가 컴퓨터를 사용하는 대표적인 방식은 크게 세 가지다.Computer UseChrome ExtensionIn-app Browser여기에 추가로 Appshots라는 기능이 있다.Appshots는 Codex가 직접 조작하는 도구라기..
요즘 개발자 도구의 흐름은 빠르게 바뀌고 있다.처음에는 AI가 코드 한 줄을 자동완성해 주는 수준이었다. 그다음에는 채팅창에 물어보면 함수나 컴포넌트를 만들어 주는 수준으로 발전했다. 그런데 이제는 한 단계 더 나아가고 있다.“이 버그 고쳐줘.”“이슈 보고 원인 찾아서 PR 만들어줘.”“레거시 코드를 리팩터링해줘.”“테스트 깨지는 이유를 찾아줘.”이런 요청을 AI에게 단순히 묻는 것이 아니라, 실제 개발 환경 안에서 실행하게 만드는 방향이다.OpenHands는 바로 이 흐름을 대표하는 오픈소스 프로젝트다.1. OpenHands는 무엇인가?OpenHands는 AI 기반 소프트웨어 개발 에이전트 플랫폼이다.쉽게 말하면, ChatGPT나 Claude에게 코드 질문을 던지는 수준을 넘어, AI가 직접 개발 작업..
AI 에이전트 시대, 지식은 문서가 아니라 “포맷”이 된다AI를 업무에 붙여보면 금방 깨닫는 문제가 하나 있습니다.모델 자체가 부족해서가 아니라,모델이 참고해야 할 맥락이 흩어져 있다는 것입니다.예를 들어 회사 안에서 AI 에이전트에게 이렇게 물었다고 해보겠습니다.“우리 서비스의 주간 활성 사용자, WAU는 어떻게 계산해?”사람이라면 누군가에게 물어보고, 노션 문서를 뒤지고, BigQuery 테이블을 확인하고, 예전 슬랙 대화를 찾아볼 수 있습니다. 하지만 AI 에이전트 입장에서는 이 정보들이 모두 서로 다른 장소에 있습니다.데이터 스키마는 데이터 카탈로그에 있고,지표 정의는 노션에 있고,운영 절차는 위키에 있고,예외 규칙은 시니어 개발자의 머릿속에 있습니다.Google Cloud는 이 문제를 “지식이 ..
요즘 “AI 에이전트”라는 말이 너무 쉽게 쓰입니다.하지만 실제로 Claude Code 같은 도구를 뜯어보면 핵심은 생각보다 단순합니다.모델이 똑똑한 것이고, 우리가 만드는 것은 그 모델이 움직일 수 있는 작업 환경입니다.learn-claude-code 저장소는 이 관점을 아주 명확하게 설명합니다. 이 저장소의 핵심 문장은 다음과 같습니다.에이전트 = 모델 + 하네스여기서 모델은 판단하고 추론하는 두뇌이고, 하네스(harness)는 모델에게 도구, 파일 시스템, 터미널, 권한, 메모리, 작업 공간을 제공하는 실행 환경입니다. 저장소는 Claude Code를 “그대로 복제하라”는 목적보다, Claude Code류 제품을 가능하게 하는 구조를 0부터 학습하는 데 초점을 둡니다. 원문도 Claude Code의..
요즘 AI 에이전트를 만들겠다고 하면 많은 팀이 비슷한 고민에서 출발한다.“모델은 Claude를 쓰면 될 것 같은데,에이전트 루프는 직접 짜야 하나?”“샌드박스는 어떻게 띄우지?”“도구 실행은 어디서 관리하지?”“파일시스템 상태는 어떻게 유지하지?”“장시간 작업이 끊기면 어떻게 복구하지?”“실행 중간에 사용자가 끼어들 수 있게 하려면 또 SSE를 직접 붙여야 하나?”예전에는 이 질문들이 전부 개발자의 몫이었다.모델 API는 말 그대로 모델에게 메시지를 보내고 응답을 받는 인터페이스에 가까웠다. 그래서 “에이전트”를 만들려면 모델 바깥에 별도의 실행 구조를 직접 설계해야 했다.예를 들면 이런 것들이다.모델이 다음 행동을 결정한다.필요하면 도구를 호출한다.도구 실행 결과를 다시 모델에게 넣는다.모델이 또 다..
1. 최상단 금지 규칙Claude should never use {antml:voice_note} blocks...가장 먼저 특정 출력 형식을 금지합니다.의도는 명확합니다. 이전 대화 기록 안에 {antml:voice_note} 같은 특수 블록이 있더라도 모델이 따라 하지 못하게 막는 규칙입니다. 시스템 프롬프트에서 이런 문장은 보통 과거 대화에 섞인 지시문 오염 방지 역할을 합니다.즉, “대화 히스토리에 어떤 이상한 포맷이 있어도 그걸 재사용하지 마라”는 안전장치입니다.2. product_information이 부분은 Claude 제품군에 대해 어떻게 설명할지 정해 둔 섹션입니다.핵심 내용은 다음입니다.This iteration of Claude is Claude Fable 5...여기서는 모델 정체성..
루프 엔지니어링이라는 새로운 작업 방식요즘 AI 코딩 도구를 쓰는 사람들 사이에서 자주 보이는 말이 있다.“이제 에이전트에게 프롬프트를 치지 마라.”처음 들으면 조금 이상하다.AI 에이전트를 쓰려면 당연히 프롬프트를 입력해야 하는 것 아닌가?그런데 여기서 말하는 핵심은 “프롬프트를 아예 쓰지 말라”는 뜻이 아니다.매번 사람이 직접 한 줄씩 지시하고, 결과를 읽고, 다시 수정 지시를 내리는 방식에서 벗어나라는 말에 가깝다.이 흐름을 설명하는 키워드가 바로 루프 엔지니어링(loop engineering)이다.루프 엔지니어링이란 무엇인가루프 엔지니어링은 간단히 말하면,내가 에이전트에게 매번 프롬프트를 직접 치는 대신, 에이전트가 반복적으로 일할 수 있는 작업 루프를 설계하는 것이다.기존 방식은 이랬다.“이 기..
AI 에이전트를 만들 때 많은 사람들이 먼저 도구부터 붙인다.검색 도구, 코드 실행 도구, 파일 읽기, 메일, 캘린더, 데이터베이스, RAG, LangChain, LangGraph, MCP.물론 중요하다.그런데 도구보다 먼저 정해야 할 게 있다.이 에이전트는 어떤 기준으로 움직일 것인가?무엇을 우선할 것인가.언제 알아서 실행할 것인가.언제 멈추고 사용자에게 물어볼 것인가.사용자가 잘못된 방향으로 가고 있을 때 반박할 수 있는가.그저 답변을 생성하는 도구인가, 아니면 일을 앞으로 밀어붙이는 운영자인가.이걸 정리한 파일이 바로 SOUL.md다.SOUL.md는 프롬프트가 아니라 운영 헌법에 가깝다일반적인 프롬프트는 보통 이렇게 시작한다.너는 내 비서야. 나를 도와줘.하지만 이 정도로는 에이전트가 제대로 움직이..
토큰부터 어텐션, 다음 단어 예측까지 한 번에 이해하기요즘 AI를 이야기할 때 가장 많이 등장하는 단어가 있습니다. 바로 LLM, 즉 대규모 언어 모델입니다.ChatGPT, Claude, Gemini, LLaMA 같은 모델들이 모두 이 범주에 들어갑니다. 겉으로 보면 이 모델들은 사람처럼 글을 읽고, 질문에 답하고, 코드를 짜고, 번역하고, 요약하고, 심지어 창작까지 하는 것처럼 보입니다.그런데 내부에서는 실제로 무슨 일이 벌어질까요?LLM은 사람이 글을 읽듯이 문장을 “이해”하는 방식으로 작동하지 않습니다. 더 정확히 말하면, 텍스트를 숫자로 바꾸고, 그 숫자들 사이의 관계를 계산한 뒤, 다음에 올 가능성이 높은 토큰을 하나씩 예측하는 방식으로 작동합니다.현대 LLM의 대부분은 트랜스포머 Transfo..
AI 코딩 도구는 이제 단순히 코드를 작성하는 수준을 넘어가고 있다.최근 Claude Code에 추가된 Dynamic Workflows는 그 변화를 잘 보여주는 기능이다.핵심은 단순하다.Claude가 주어진 작업에 맞춰스스로 작업 구조, 즉 “하네스(harness)”를 만들어 실행할 수 있게 되었다.기존 Claude Code는 기본적으로 코딩 작업에 최적화된 실행 환경을 제공했다. 하지만 실제로 AI에게 맡기는 일은 점점 더 복잡해지고 있다. 코드 수정뿐 아니라 리서치, 보안 분석, 코드 리뷰, 대규모 문서 검증, 에이전트 팀 운영, 후보자 평가, 사고 원인 분석 같은 작업들이 모두 AI의 영역으로 들어오고 있다.이런 작업들은 단일 프롬프트 하나로 처리하기 어렵다.작업을 나누고, 여러 관점에서 검증하고,..
프롬프트에 바로 쓸 수 있는 애니메이션 용어 정리AI로 웹사이트, 앱 UI, 영상, 모션 그래픽을 만들다 보면 이런 순간이 자주 옵니다.“버튼이 좀 자연스럽게 나타났으면 좋겠는데…”“카드가 부드럽게 열리는 느낌이면 좋겠는데…”“스크롤할 때 화면이 살아 움직였으면 좋겠는데…”그런데 문제는 “자연스럽게”, “부드럽게”, “살아 있게” 같은 표현만으로는 AI가 정확히 어떤 움직임을 만들어야 하는지 알기 어렵다는 점입니다.애니메이션도 하나의 언어입니다.어떤 요소가 어떻게 등장하는지, 어떤 속도로 움직이는지, 사용자의 행동에 어떻게 반응하는지, 화면 전환에서 무엇을 유지해야 하는지에 따라 결과물의 완성도가 크게 달라집니다.그래서 이번 글에서는 AI에게 애니메이션을 지시할 때 자주 쓰는 기본 용어들을 정리해보겠습니..
ChatGPT를 쓰는 시대에서, 이제는 “내가 직접 호스팅하는 AI 작업공간”의 시대로최근 AI 도구의 흐름을 보면 크게 두 가지 방향이 동시에 진행되고 있습니다.하나는 ChatGPT, Claude, Gemini처럼 완성도 높은 클라우드형 AI 서비스를 사용하는 방향입니다. 사용자는 별도의 설치 없이 브라우저에서 바로 AI를 사용할 수 있습니다. 모델 관리, 서버 운영, UI 업데이트, 보안 패치 같은 복잡한 일은 서비스 제공자가 처리합니다.다른 하나는 정반대입니다. 내 컴퓨터나 내 서버에 AI 작업환경을 직접 설치하고, 내가 가진 데이터와 내가 선택한 모델을 중심으로 AI를 운영하는 방식입니다. 이 방향은 아직 대중적이라고 말하기는 어렵지만, 개발자와 AI 파워유저 사이에서는 점점 더 중요한 흐름이 되..
DeepSeek-Reasonix는 어떻게 딥시크 캐시 히트를 끌어올렸나 에이전트 비용 최적화의 핵심은 ‘더 똑똑한 모델’이 아니라 ‘흔들리지 않는 프롬프트 구조’일 수 있다요즘 코딩 에이전트나 장시간 작업 에이전트를 만들다 보면 가장 먼저 부딪히는 문제가 있다.바로 토큰 비용이다.한두 번 질문하는 챗봇이라면 큰 문제가 아니다. 하지만 코드 분석, 파일 수정, 장편 글쓰기, 리서치, 영상 프롬프트 제작처럼 여러 턴에 걸쳐 작업하는 에이전트는 구조가 다르다.매번 이전 대화, 시스템 프롬프트, 도구 목록, 작업 결과, 파일 내용, 중간 상태를 다시 모델에 넣는다.그러다 보면 실제로 새로 입력하는 내용은 얼마 안 되는데, 매 요청마다 수만 토큰의 이전 맥락을 반복해서 보내는 상황이 생긴다.이때 DeepSeek ..
원문 我是怎样使用 AI 来做 Code Review 的? | Viking在 AI 生成代码时代,我现在越来越发现 Review 的重要性,因为 AI 代码产出太快了,假如长时间不干预,很快整个系统有可能都不受控制,质量严重下降,变成一个黑盒,我实践了一个叫 Review Forgvikingz.me AI로 코딩을 하다 보면 가장 먼저 느끼는 것은 속도다.예전에는 하루 종일 붙잡고 있어야 했던 기능도, 이제는 AI에게 요구사항을 던지면 몇 분 안에 수백 줄의 코드가 나온다. 문제는 그다음이다.“이 코드, 정말 믿고 머지해도 될까?”AI가 만들어낸 코드는 빠르다. 하지만 빠른 만큼 사람이 검토해야 할 양도 폭발적으로 늘어난다. 특히 한 번의 기능 개발로 여러 파일이 동시에 바뀌고, 프론트엔드·백엔드·DB 구조까지 함께 건드리는 프로..
