목록IT (1724)
오늘도 공부
AI 코딩 에이전트를 쓰다 보면 이상한 순간을 자주 만난다.분명히 간단한 기능을 부탁했는데, 에이전트는 갑자기 새로운 컴포넌트를 만들고, 유틸 파일을 추가하고, 추상화 계층을 만들고, 아직 필요하지도 않은 설정값까지 준비한다.사람 개발자라면 한 줄로 끝냈을 일을 AI는 “미래 확장성”이라는 이름으로 100줄짜리 구조로 만든다.이 문제를 정면으로 겨냥한 프로젝트가 Ponytail이다.Ponytail의 저장소 설명은 노골적이다.“AI 에이전트가 방 안에서 가장 게으른 시니어 개발자처럼 생각하게 만든다.”여기서 게으르다는 말은 대충 만든다는 뜻이 아니다. 안 만들어도 되는 코드는 만들지 않는 개발자에 가깝다. GitHub README에서도 Ponytail은 “가장 좋은 코드는 작성하지 않은 코드”라는 철학을 ..
Computer Use, Chrome, Browser는 언제 어떻게 써야 할까?AI 에이전트가 코드를 짜는 시대는 이미 익숙해졌다.그런데 이제 중요한 질문은 조금 달라졌다.“AI가 코드를 쓰는 것을 넘어, 실제 컴퓨터 화면을 보고 조작할 수 있다면 무엇이 달라질까?”OpenAI Codex에는 컴퓨터를 다루는 방식이 여러 가지 있다.겉으로 보면 비슷해 보인다. 모두 웹사이트를 열 수 있고, 화면을 볼 수 있고, 사용자를 대신해 작업할 수 있다.하지만 실제로는 목적이 다르다.Codex가 컴퓨터를 사용하는 대표적인 방식은 크게 세 가지다.Computer UseChrome ExtensionIn-app Browser여기에 추가로 Appshots라는 기능이 있다.Appshots는 Codex가 직접 조작하는 도구라기..
요즘 개발자 도구의 흐름은 빠르게 바뀌고 있다.처음에는 AI가 코드 한 줄을 자동완성해 주는 수준이었다. 그다음에는 채팅창에 물어보면 함수나 컴포넌트를 만들어 주는 수준으로 발전했다. 그런데 이제는 한 단계 더 나아가고 있다.“이 버그 고쳐줘.”“이슈 보고 원인 찾아서 PR 만들어줘.”“레거시 코드를 리팩터링해줘.”“테스트 깨지는 이유를 찾아줘.”이런 요청을 AI에게 단순히 묻는 것이 아니라, 실제 개발 환경 안에서 실행하게 만드는 방향이다.OpenHands는 바로 이 흐름을 대표하는 오픈소스 프로젝트다.1. OpenHands는 무엇인가?OpenHands는 AI 기반 소프트웨어 개발 에이전트 플랫폼이다.쉽게 말하면, ChatGPT나 Claude에게 코드 질문을 던지는 수준을 넘어, AI가 직접 개발 작업..
AI 에이전트 시대, 지식은 문서가 아니라 “포맷”이 된다AI를 업무에 붙여보면 금방 깨닫는 문제가 하나 있습니다.모델 자체가 부족해서가 아니라,모델이 참고해야 할 맥락이 흩어져 있다는 것입니다.예를 들어 회사 안에서 AI 에이전트에게 이렇게 물었다고 해보겠습니다.“우리 서비스의 주간 활성 사용자, WAU는 어떻게 계산해?”사람이라면 누군가에게 물어보고, 노션 문서를 뒤지고, BigQuery 테이블을 확인하고, 예전 슬랙 대화를 찾아볼 수 있습니다. 하지만 AI 에이전트 입장에서는 이 정보들이 모두 서로 다른 장소에 있습니다.데이터 스키마는 데이터 카탈로그에 있고,지표 정의는 노션에 있고,운영 절차는 위키에 있고,예외 규칙은 시니어 개발자의 머릿속에 있습니다.Google Cloud는 이 문제를 “지식이 ..
요즘 “AI 에이전트”라는 말이 너무 쉽게 쓰입니다.하지만 실제로 Claude Code 같은 도구를 뜯어보면 핵심은 생각보다 단순합니다.모델이 똑똑한 것이고, 우리가 만드는 것은 그 모델이 움직일 수 있는 작업 환경입니다.learn-claude-code 저장소는 이 관점을 아주 명확하게 설명합니다. 이 저장소의 핵심 문장은 다음과 같습니다.에이전트 = 모델 + 하네스여기서 모델은 판단하고 추론하는 두뇌이고, 하네스(harness)는 모델에게 도구, 파일 시스템, 터미널, 권한, 메모리, 작업 공간을 제공하는 실행 환경입니다. 저장소는 Claude Code를 “그대로 복제하라”는 목적보다, Claude Code류 제품을 가능하게 하는 구조를 0부터 학습하는 데 초점을 둡니다. 원문도 Claude Code의..
요즘 AI 에이전트를 만들겠다고 하면 많은 팀이 비슷한 고민에서 출발한다.“모델은 Claude를 쓰면 될 것 같은데,에이전트 루프는 직접 짜야 하나?”“샌드박스는 어떻게 띄우지?”“도구 실행은 어디서 관리하지?”“파일시스템 상태는 어떻게 유지하지?”“장시간 작업이 끊기면 어떻게 복구하지?”“실행 중간에 사용자가 끼어들 수 있게 하려면 또 SSE를 직접 붙여야 하나?”예전에는 이 질문들이 전부 개발자의 몫이었다.모델 API는 말 그대로 모델에게 메시지를 보내고 응답을 받는 인터페이스에 가까웠다. 그래서 “에이전트”를 만들려면 모델 바깥에 별도의 실행 구조를 직접 설계해야 했다.예를 들면 이런 것들이다.모델이 다음 행동을 결정한다.필요하면 도구를 호출한다.도구 실행 결과를 다시 모델에게 넣는다.모델이 또 다..
1. 최상단 금지 규칙Claude should never use {antml:voice_note} blocks...가장 먼저 특정 출력 형식을 금지합니다.의도는 명확합니다. 이전 대화 기록 안에 {antml:voice_note} 같은 특수 블록이 있더라도 모델이 따라 하지 못하게 막는 규칙입니다. 시스템 프롬프트에서 이런 문장은 보통 과거 대화에 섞인 지시문 오염 방지 역할을 합니다.즉, “대화 히스토리에 어떤 이상한 포맷이 있어도 그걸 재사용하지 마라”는 안전장치입니다.2. product_information이 부분은 Claude 제품군에 대해 어떻게 설명할지 정해 둔 섹션입니다.핵심 내용은 다음입니다.This iteration of Claude is Claude Fable 5...여기서는 모델 정체성..
루프 엔지니어링이라는 새로운 작업 방식요즘 AI 코딩 도구를 쓰는 사람들 사이에서 자주 보이는 말이 있다.“이제 에이전트에게 프롬프트를 치지 마라.”처음 들으면 조금 이상하다.AI 에이전트를 쓰려면 당연히 프롬프트를 입력해야 하는 것 아닌가?그런데 여기서 말하는 핵심은 “프롬프트를 아예 쓰지 말라”는 뜻이 아니다.매번 사람이 직접 한 줄씩 지시하고, 결과를 읽고, 다시 수정 지시를 내리는 방식에서 벗어나라는 말에 가깝다.이 흐름을 설명하는 키워드가 바로 루프 엔지니어링(loop engineering)이다.루프 엔지니어링이란 무엇인가루프 엔지니어링은 간단히 말하면,내가 에이전트에게 매번 프롬프트를 직접 치는 대신, 에이전트가 반복적으로 일할 수 있는 작업 루프를 설계하는 것이다.기존 방식은 이랬다.“이 기..
AI 에이전트를 만들 때 많은 사람들이 먼저 도구부터 붙인다.검색 도구, 코드 실행 도구, 파일 읽기, 메일, 캘린더, 데이터베이스, RAG, LangChain, LangGraph, MCP.물론 중요하다.그런데 도구보다 먼저 정해야 할 게 있다.이 에이전트는 어떤 기준으로 움직일 것인가?무엇을 우선할 것인가.언제 알아서 실행할 것인가.언제 멈추고 사용자에게 물어볼 것인가.사용자가 잘못된 방향으로 가고 있을 때 반박할 수 있는가.그저 답변을 생성하는 도구인가, 아니면 일을 앞으로 밀어붙이는 운영자인가.이걸 정리한 파일이 바로 SOUL.md다.SOUL.md는 프롬프트가 아니라 운영 헌법에 가깝다일반적인 프롬프트는 보통 이렇게 시작한다.너는 내 비서야. 나를 도와줘.하지만 이 정도로는 에이전트가 제대로 움직이..
토큰부터 어텐션, 다음 단어 예측까지 한 번에 이해하기요즘 AI를 이야기할 때 가장 많이 등장하는 단어가 있습니다. 바로 LLM, 즉 대규모 언어 모델입니다.ChatGPT, Claude, Gemini, LLaMA 같은 모델들이 모두 이 범주에 들어갑니다. 겉으로 보면 이 모델들은 사람처럼 글을 읽고, 질문에 답하고, 코드를 짜고, 번역하고, 요약하고, 심지어 창작까지 하는 것처럼 보입니다.그런데 내부에서는 실제로 무슨 일이 벌어질까요?LLM은 사람이 글을 읽듯이 문장을 “이해”하는 방식으로 작동하지 않습니다. 더 정확히 말하면, 텍스트를 숫자로 바꾸고, 그 숫자들 사이의 관계를 계산한 뒤, 다음에 올 가능성이 높은 토큰을 하나씩 예측하는 방식으로 작동합니다.현대 LLM의 대부분은 트랜스포머 Transfo..
AI 코딩 도구는 이제 단순히 코드를 작성하는 수준을 넘어가고 있다.최근 Claude Code에 추가된 Dynamic Workflows는 그 변화를 잘 보여주는 기능이다.핵심은 단순하다.Claude가 주어진 작업에 맞춰스스로 작업 구조, 즉 “하네스(harness)”를 만들어 실행할 수 있게 되었다.기존 Claude Code는 기본적으로 코딩 작업에 최적화된 실행 환경을 제공했다. 하지만 실제로 AI에게 맡기는 일은 점점 더 복잡해지고 있다. 코드 수정뿐 아니라 리서치, 보안 분석, 코드 리뷰, 대규모 문서 검증, 에이전트 팀 운영, 후보자 평가, 사고 원인 분석 같은 작업들이 모두 AI의 영역으로 들어오고 있다.이런 작업들은 단일 프롬프트 하나로 처리하기 어렵다.작업을 나누고, 여러 관점에서 검증하고,..
프롬프트에 바로 쓸 수 있는 애니메이션 용어 정리AI로 웹사이트, 앱 UI, 영상, 모션 그래픽을 만들다 보면 이런 순간이 자주 옵니다.“버튼이 좀 자연스럽게 나타났으면 좋겠는데…”“카드가 부드럽게 열리는 느낌이면 좋겠는데…”“스크롤할 때 화면이 살아 움직였으면 좋겠는데…”그런데 문제는 “자연스럽게”, “부드럽게”, “살아 있게” 같은 표현만으로는 AI가 정확히 어떤 움직임을 만들어야 하는지 알기 어렵다는 점입니다.애니메이션도 하나의 언어입니다.어떤 요소가 어떻게 등장하는지, 어떤 속도로 움직이는지, 사용자의 행동에 어떻게 반응하는지, 화면 전환에서 무엇을 유지해야 하는지에 따라 결과물의 완성도가 크게 달라집니다.그래서 이번 글에서는 AI에게 애니메이션을 지시할 때 자주 쓰는 기본 용어들을 정리해보겠습니..
ChatGPT를 쓰는 시대에서, 이제는 “내가 직접 호스팅하는 AI 작업공간”의 시대로최근 AI 도구의 흐름을 보면 크게 두 가지 방향이 동시에 진행되고 있습니다.하나는 ChatGPT, Claude, Gemini처럼 완성도 높은 클라우드형 AI 서비스를 사용하는 방향입니다. 사용자는 별도의 설치 없이 브라우저에서 바로 AI를 사용할 수 있습니다. 모델 관리, 서버 운영, UI 업데이트, 보안 패치 같은 복잡한 일은 서비스 제공자가 처리합니다.다른 하나는 정반대입니다. 내 컴퓨터나 내 서버에 AI 작업환경을 직접 설치하고, 내가 가진 데이터와 내가 선택한 모델을 중심으로 AI를 운영하는 방식입니다. 이 방향은 아직 대중적이라고 말하기는 어렵지만, 개발자와 AI 파워유저 사이에서는 점점 더 중요한 흐름이 되..
DeepSeek-Reasonix는 어떻게 딥시크 캐시 히트를 끌어올렸나 에이전트 비용 최적화의 핵심은 ‘더 똑똑한 모델’이 아니라 ‘흔들리지 않는 프롬프트 구조’일 수 있다요즘 코딩 에이전트나 장시간 작업 에이전트를 만들다 보면 가장 먼저 부딪히는 문제가 있다.바로 토큰 비용이다.한두 번 질문하는 챗봇이라면 큰 문제가 아니다. 하지만 코드 분석, 파일 수정, 장편 글쓰기, 리서치, 영상 프롬프트 제작처럼 여러 턴에 걸쳐 작업하는 에이전트는 구조가 다르다.매번 이전 대화, 시스템 프롬프트, 도구 목록, 작업 결과, 파일 내용, 중간 상태를 다시 모델에 넣는다.그러다 보면 실제로 새로 입력하는 내용은 얼마 안 되는데, 매 요청마다 수만 토큰의 이전 맥락을 반복해서 보내는 상황이 생긴다.이때 DeepSeek ..
원문 我是怎样使用 AI 来做 Code Review 的? | Viking在 AI 生成代码时代,我现在越来越发现 Review 的重要性,因为 AI 代码产出太快了,假如长时间不干预,很快整个系统有可能都不受控制,质量严重下降,变成一个黑盒,我实践了一个叫 Review Forgvikingz.me AI로 코딩을 하다 보면 가장 먼저 느끼는 것은 속도다.예전에는 하루 종일 붙잡고 있어야 했던 기능도, 이제는 AI에게 요구사항을 던지면 몇 분 안에 수백 줄의 코드가 나온다. 문제는 그다음이다.“이 코드, 정말 믿고 머지해도 될까?”AI가 만들어낸 코드는 빠르다. 하지만 빠른 만큼 사람이 검토해야 할 양도 폭발적으로 늘어난다. 특히 한 번의 기능 개발로 여러 파일이 동시에 바뀌고, 프론트엔드·백엔드·DB 구조까지 함께 건드리는 프로..
AI 에이전트를 쓰다 보면 어느 순간 이런 생각이 듭니다.“이 에이전트가 같은 실수를 반복하지 않게 만들 수는 없을까?”개발 에이전트는 테스트를 돌리지 않고 작업을 끝냈다고 말할 때가 있습니다.문서 작성 에이전트는 중요한 제약 조건을 빠뜨릴 때가 있습니다.영상 프롬프트 작성 에이전트는 캐릭터 일관성, 카메라 동선, 시간 분할 같은 핵심 요소를 놓칠 때가 있습니다.이럴 때 우리는 보통 지침을 추가합니다.테스트를 실행하기 전에는 완료했다고 말하지 마라.모르는 API는 추측하지 말고 확인하라.함수 이름을 바꿀 때는 관련 참조를 모두 검색하라.그런데 이런 지침을 계속 추가하다 보면 문제가 생깁니다.문서는 점점 길어집니다.중복되는 내용이 생깁니다.규칙끼리 충돌하기도 합니다.무엇보다 정말 성능이 좋아졌는지 확인하기..
블록체인은 디지털 지갑의 주인이 누구인지 확인하기 위해 암호 기술을 사용합니다.쉽게 말하면, 블록체인 지갑에는 두 가지 열쇠가 있습니다.개인키는 나만 아는 비밀 열쇠입니다.공개키는 다른 사람들이 확인할 수 있는 공개된 열쇠입니다.내가 코인을 보내려면 개인키로 “이 거래는 내가 허락한 것입니다”라는 서명을 만듭니다.네트워크는 공개키로 그 서명이 진짜인지 확인합니다.지금까지는 이 방식이 매우 안전하다고 여겨졌습니다.하지만 미래에 강력한 양자컴퓨터가 등장하면 문제가 생길 수 있습니다.양자컴퓨터가 왜 문제일까?현재 많은 블록체인은 ECDSA라는 서명 방식을 사용합니다.이 방식은 일반 컴퓨터로는 개인키를 찾아내기 거의 불가능하다는 전제 위에 만들어졌습니다.그런데 충분히 강력한 양자컴퓨터는 쇼어 알고리즘이라는 방법..
1. 역할 개요Seedance 2.0은 텍스트, 이미지, 영상, 오디오를 함께 활용해 짧은 AI 영상을 생성하는 멀티모달 영상 생성 모델이다.프롬프트 작성의 핵심은 단순히 “멋진 영상 만들어줘”가 아니라, 다음 요소를 명확하게 지시하는 것이다.무엇을 보여줄지어떤 참고 자료를 사용할지카메라는 어떻게 움직일지몇 초에 어떤 일이 일어날지어떤 분위기와 사운드를 넣을지무엇을 피해야 하는지2. 입력 제한Seedance 2.0에서 사용할 수 있는 입력 자료 제한은 다음과 같다.입력 유형제한형식최대 크기이미지최대 9장jpeg, png, webp, bmp, tiff, gif각 30MB영상최대 3개mp4, mov각 50MB, 길이 2–15초오디오최대 3개mp3, wav총 길이 15초 이하텍스트자연어 프롬프트제한 없음-총 ..
AI 영상 제작에서 좋은 결과를 얻기 위해 가장 중요한 것은 “무엇을 만들 것인가”보다 “무엇을 어떻게 참고하게 할 것인가”입니다.Seedance 2.0은 텍스트만으로 영상을 만드는 도구가 아닙니다. 이미지, 영상, 오디오를 함께 활용해 더 구체적인 결과물을 만들 수 있는 멀티모달 영상 생성 도구입니다.이때 핵심이 되는 기능이 바로 @ 레퍼런스 시스템입니다.1. @ 레퍼런스 시스템이란?Seedance 2.0에서는 업로드한 자료를 프롬프트 안에서 다음과 같이 부를 수 있습니다.@Image1@Image2@Video1@Audio1예를 들어 이미지를 2장 올렸다면 첫 번째 이미지는 @Image1, 두 번째 이미지는 @Image2로 지칭할 수 있습니다.영상을 올렸다면 @Video1, 오디오를 올렸다면 @Audio..
예쁜 문장보다 중요한 것은 ‘영상 콘티처럼 쓰는 것’AI 영상 제작 도구를 처음 사용할 때 가장 많이 하는 실수가 있습니다.바로 프롬프트를 소설처럼 길고 감성적으로 쓰는 것입니다.예를 들어 이런 식입니다.한 소녀가 슬픈 마음으로 비 오는 거리를 걸어간다. 세상은 차갑고, 그녀의 마음은 무너져 내린다. 카메라는 그녀의 외로움을 아름답게 담아낸다.문장 자체는 나쁘지 않습니다.하지만 AI 영상 모델 입장에서는 애매한 부분이 많습니다.소녀가 어디에 있는지, 어떻게 걷는지, 카메라는 어디서 찍는지, 몇 초 동안 어떤 동작이 이어지는지 명확하지 않습니다.Seedance 2.0 같은 영상 생성 모델을 사용할 때는 감성적인 문장보다 감독 지시문에 가까운 프롬프트가 훨씬 안정적입니다.즉, 이렇게 생각해야 합니다.“내가 ..
— NolanX AI Skills를 기준으로 보는 “영화형 생성 프롬프트” 설계법요즘 AI 이미지·영상 생성에서 중요한 것은 단순히 “멋지게 만들어줘”라고 말하는 것이 아니다.결과물의 품질을 결정하는 핵심은 무엇을 고정하고, 무엇을 움직이고, 어떤 방식으로 촬영되게 할 것인가를 구체적으로 지시하는 데 있다.NolanX AI의 skills 폴더에 들어 있는 20개의 스킬은 바로 이 지점을 다룬다.각 스킬은 영화 연출, 스토리보드, 액션 설계, 조명, 샷 구성, 캐릭터 연속성, 레퍼런스 기반 영상 생성, 숏폼 드라마 후킹 등 AI 영상 제작에서 자주 무너지는 문제를 해결하기 위한 작은 제작 규칙집에 가깝다.이 글에서는 20개 스킬을 하나씩 살펴보며 다음 세 가지를 정리한다.이 스킬이 무엇인지언제 사용하면 좋..
GPT 이미지 프롬프트 개선기를 만들며 정리한 것들요즘은 누구나 AI로 이미지를 만들 수 있습니다.하지만 막상 원하는 이미지를 만들려고 하면 생각보다 결과가 잘 나오지 않습니다.“예쁘게 만들어줘.”“고급스럽게 만들어줘.”“감성적인 썸네일 만들어줘.”이렇게 입력했는데 결과물이 어딘가 어색하거나, 내가 생각한 방향과 전혀 다르게 나오는 경우가 많습니다.이유는 간단합니다.AI에게는 “예쁘게”라는 말보다 무엇을 어떻게 보여줄지가 훨씬 중요하기 때문입니다.이미지 생성 프롬프트는 주문서라기보다 디자인 디렉션에 가깝습니다.그래서 좋은 이미지를 만들기 위해서는 막연한 감상어보다 구체적인 시각 정보를 알려줘야 합니다.좋은 프롬프트는 “예쁘게”가 아니라 “어떻게”를 말한다많은 사람이 처음에는 이렇게 요청합니다.예쁜 화장품..
AI · Design Workflow Codex를 UI/UX 마법사처럼만드는 디자인 루프 비전 기능과 이미지 생성을 결합해초안을 프로덕션 수준으로 끌어올리는 전체 가이드 2026.05.06 · Codex Desktop Guide대부분의 사람들은 Codex를 단순한 커맨드라인 도구처럼 사용합니다. 그래서 결과물도 대개 초안 수준의 UI 디자인에 머무릅니다.하지만 Codex Desktop 앱은 이 흐름을 바꿉니다. 시각적 피드백 루프를 통합해 앱을 빌드하고 실행하며, 스크린샷을 캡처하고, 비전 기능으로 레이아웃을 검사하고, 사용자 상호작용을 시뮬레이션하며, imagegen으로 에셋을 생성하고, 실제 시각 결과를 바탕으로 코드를 반복 수정합니다.이 접근 방식은 디자인을 한 번의 프롬프트 결과가 아니라 효..
https://github.com/nexu-io/open-design 이 문서는 **Open Design(OD)**에서 선택한 **디자인 시스템(DESIGN.md)**과 시각 시안을 기준으로, Flutter로 TODO 앱을 만들 때의 실무 워크플로우를 예시로 정리합니다.1. 이 가이드가 가정하는 것항목가정OD저장소 루트에서 npm install 후 npm run dev:all로 데몬·웹 UI 기동에이전트Claude Code / Cursor Agent 등 로컬 CLI(또는 Anthropic API BYOK)Flutter안정 채널, Dart 3.x, Material 3(useMaterial3: true) 기본제품iOS/Android(또는 단일 플랫폼) TODO: 추가·완료 토글·삭제·필터, 1차 저장은 메모..
AI Writing 당신은 하나의텍스트 파일입니다 AI가 당신 목소리로 말하게 만드는단 두 시간의 작업 2025.05.03 · Ruben Hassid 당신이 쓴 모든 글, 당신이 한 모든 말 — 그 모든 것이 결국 하나의 파일로 압축될 수 있다면? 그리고 그 파일이 AI에게 당신의 목소리를 완벽하게 복제할 수 있다면? 이건 SF가 아닙니다. 지금 당장 할 수 있는 일입니다. 이름하여 about-me.md. 당신은 하나의 텍스트 파일입니다. 진짜입니다. 당신이 쓰는 모든 것 — 이메일, 트윗, 블로그 글 — 이 하나의 파일로 요약될 수 있습니다. 그리고 그 파일이 AI를 당신처럼 글 쓰게 만듭니다. 왜 about-me.md인가 대부분의 사람들은 AI에게 “나처럼 써줘”라고 말합니다..
AI Coding Agent Skills 에이전트가 무작정 코드를 짜지않게 만드는 방법 mattpocock/skills 분석 — 요구사항 정렬부터 TDD, 아키텍처 개선까지AI 코딩을 실무 프로세스에 맞춘 12개 스킬 2026.05.03 · AI Engineering Workflow이 저장소가 풀려는 문제AI 코딩 에이전트가 빠르게 코드를 만들면서 아키텍처를 망가뜨리는 일은 이제 흔합니다. 에이전트가 사용자의 의도를 잘못 이해하고, 프로젝트 용어를 못 맞추고, 만든 코드가 동작하지 않는 문제도 반복됩니다.mattpocock/skills는 이 문제를 슬래시 커맨드 형태의 작업 지시서로 해결합니다. 에이전트가 무작정 코드를 고치지 않고, 정해진 흐름을 따르게 만듭니다. 요구사항 정렬 → 도메인 언어 ..
Game Dev Pipeline AI로 만드는 2D 스프라이트 시트실전 파이프라인 가이드 이미지 모델 + 비디오 모델 + 파이썬 자동화세 가지를 조합해 게임용 애니메이션을 완성하는 방법 2026.05.02 · AI Game Art Workflow왜 이미지 모델만으로는 안 되는가게임용 스프라이트 시트는 단순히 예쁜 그림이 아닙니다. 프레임이 수학적으로 정확한 격자에 맞아야 하고, 캐릭터가 매 프레임 중앙에 있어야 하며, 배경은 완벽히 투명해야 합니다.이미지 생성 모델은 이런 규칙을 자주 어깁니다. 특히 걷기나 달리기처럼 다리 움직임이 핵심인 애니메이션에서 오류가 많습니다. 프레임마다 위치가 흔들리고, 배경이 섞이고, 캐릭터 비율이 변합니다.그래서 이미지 모델 + 비디오 모델 + 로컬 파이썬 스크립트 ..
Open Source · Design Tool 당신의 에이전트가디자인 엔진이 된다면 Open Design — 로컬에서 실행되고, 에이전트를 선택하고,스킬을 조합하는 오픈소스 디자인 생성 도구 2026.04.29 · Open Design Team왜 이 프로젝트가 필요한가2026년 4월, Anthropic이 Claude Design을 공개했다. LLM이 글을 쓰는 대신 실제 디자인 산출물을 배송하는 첫 번째 순간이었다. 반응은 폭발적이었다. 그리고 그대로 폐쇄형, 유료, 클라우드 전용, Anthropic 모델 락인이었다.직접 호스팅할 수 없다. Vercel에 배포할 수 없다. 다른 에이전트를 끼워 넣을 수 없다. 스킬을 수정하거나 새로 만들 수 없다. Open Design은 같은 루프, 같은 산출물 ..
Open Source Analysis 로컬에서 돌아가는AI 보이스 스튜디오 ElevenLabs 대체재이자 WisprFlow 대체재.음성 복제, TTS, STT, 딕테이션, 에이전트 음성 출력까지모든 걸 내 컴퓨터에서. 2026.04.28 · jamiepine/voicebox 분석 어떤 프로젝트인가 Voicebox는 로컬 우선(local-first) 오픈소스 AI 보이스 스튜디오입니다. 클라우드 의존 없이 음성 복제, 텍스트 음성 변환(TTS), 음성 인식(STT), 글로벌 받아쓰기, AI 에이전트 음성 출력까지 한 데 묶은 데스크톱 애플리케이션입니다. ElevenLabs와 WisprFlow를 합친 무료 대안. 모든 처리가 로컬에서 이루어지며, API 키나 구독이 필요 없습니다. ..
Open Source Tool AI와 채팅하면영상이 편집됩니다 원본 영상을 폴더에 넣고 Claude Code와 대화하면,편집이 끝난 final.mp4를 돌려받습니다.video-use가 하는 일을 정리했습니다. 2026.04.28 · video-use 가이드 어떤 일을 하나요 영상을 터미널에 드래그하고, 자연어로 원하는 편집을 말하면 됩니다. AI가 전사하고, 분석하고, 편집 전략을 제안한 뒤 렌더까지 수행합니다. ✎ 필러 워드 제거 "음", "어", "그러니까" 같은 불필요한 말을 감지해 깔끔하게 잘라냅니다 ☀ 컬러 그레이딩 클립별로 데이터 기반 색보정을 자동 적용합니다 ♪ 오디오 ..
