목록AI (285)
오늘도 공부
AI 에이전트 시대, 지식은 문서가 아니라 “포맷”이 된다AI를 업무에 붙여보면 금방 깨닫는 문제가 하나 있습니다.모델 자체가 부족해서가 아니라,모델이 참고해야 할 맥락이 흩어져 있다는 것입니다.예를 들어 회사 안에서 AI 에이전트에게 이렇게 물었다고 해보겠습니다.“우리 서비스의 주간 활성 사용자, WAU는 어떻게 계산해?”사람이라면 누군가에게 물어보고, 노션 문서를 뒤지고, BigQuery 테이블을 확인하고, 예전 슬랙 대화를 찾아볼 수 있습니다. 하지만 AI 에이전트 입장에서는 이 정보들이 모두 서로 다른 장소에 있습니다.데이터 스키마는 데이터 카탈로그에 있고,지표 정의는 노션에 있고,운영 절차는 위키에 있고,예외 규칙은 시니어 개발자의 머릿속에 있습니다.Google Cloud는 이 문제를 “지식이 ..
요즘 “AI 에이전트”라는 말이 너무 쉽게 쓰입니다.하지만 실제로 Claude Code 같은 도구를 뜯어보면 핵심은 생각보다 단순합니다.모델이 똑똑한 것이고, 우리가 만드는 것은 그 모델이 움직일 수 있는 작업 환경입니다.learn-claude-code 저장소는 이 관점을 아주 명확하게 설명합니다. 이 저장소의 핵심 문장은 다음과 같습니다.에이전트 = 모델 + 하네스여기서 모델은 판단하고 추론하는 두뇌이고, 하네스(harness)는 모델에게 도구, 파일 시스템, 터미널, 권한, 메모리, 작업 공간을 제공하는 실행 환경입니다. 저장소는 Claude Code를 “그대로 복제하라”는 목적보다, Claude Code류 제품을 가능하게 하는 구조를 0부터 학습하는 데 초점을 둡니다. 원문도 Claude Code의..
요즘 AI 에이전트를 만들겠다고 하면 많은 팀이 비슷한 고민에서 출발한다.“모델은 Claude를 쓰면 될 것 같은데,에이전트 루프는 직접 짜야 하나?”“샌드박스는 어떻게 띄우지?”“도구 실행은 어디서 관리하지?”“파일시스템 상태는 어떻게 유지하지?”“장시간 작업이 끊기면 어떻게 복구하지?”“실행 중간에 사용자가 끼어들 수 있게 하려면 또 SSE를 직접 붙여야 하나?”예전에는 이 질문들이 전부 개발자의 몫이었다.모델 API는 말 그대로 모델에게 메시지를 보내고 응답을 받는 인터페이스에 가까웠다. 그래서 “에이전트”를 만들려면 모델 바깥에 별도의 실행 구조를 직접 설계해야 했다.예를 들면 이런 것들이다.모델이 다음 행동을 결정한다.필요하면 도구를 호출한다.도구 실행 결과를 다시 모델에게 넣는다.모델이 또 다..
루프 엔지니어링이라는 새로운 작업 방식요즘 AI 코딩 도구를 쓰는 사람들 사이에서 자주 보이는 말이 있다.“이제 에이전트에게 프롬프트를 치지 마라.”처음 들으면 조금 이상하다.AI 에이전트를 쓰려면 당연히 프롬프트를 입력해야 하는 것 아닌가?그런데 여기서 말하는 핵심은 “프롬프트를 아예 쓰지 말라”는 뜻이 아니다.매번 사람이 직접 한 줄씩 지시하고, 결과를 읽고, 다시 수정 지시를 내리는 방식에서 벗어나라는 말에 가깝다.이 흐름을 설명하는 키워드가 바로 루프 엔지니어링(loop engineering)이다.루프 엔지니어링이란 무엇인가루프 엔지니어링은 간단히 말하면,내가 에이전트에게 매번 프롬프트를 직접 치는 대신, 에이전트가 반복적으로 일할 수 있는 작업 루프를 설계하는 것이다.기존 방식은 이랬다.“이 기..
AI 에이전트를 만들 때 많은 사람들이 먼저 도구부터 붙인다.검색 도구, 코드 실행 도구, 파일 읽기, 메일, 캘린더, 데이터베이스, RAG, LangChain, LangGraph, MCP.물론 중요하다.그런데 도구보다 먼저 정해야 할 게 있다.이 에이전트는 어떤 기준으로 움직일 것인가?무엇을 우선할 것인가.언제 알아서 실행할 것인가.언제 멈추고 사용자에게 물어볼 것인가.사용자가 잘못된 방향으로 가고 있을 때 반박할 수 있는가.그저 답변을 생성하는 도구인가, 아니면 일을 앞으로 밀어붙이는 운영자인가.이걸 정리한 파일이 바로 SOUL.md다.SOUL.md는 프롬프트가 아니라 운영 헌법에 가깝다일반적인 프롬프트는 보통 이렇게 시작한다.너는 내 비서야. 나를 도와줘.하지만 이 정도로는 에이전트가 제대로 움직이..
토큰부터 어텐션, 다음 단어 예측까지 한 번에 이해하기요즘 AI를 이야기할 때 가장 많이 등장하는 단어가 있습니다. 바로 LLM, 즉 대규모 언어 모델입니다.ChatGPT, Claude, Gemini, LLaMA 같은 모델들이 모두 이 범주에 들어갑니다. 겉으로 보면 이 모델들은 사람처럼 글을 읽고, 질문에 답하고, 코드를 짜고, 번역하고, 요약하고, 심지어 창작까지 하는 것처럼 보입니다.그런데 내부에서는 실제로 무슨 일이 벌어질까요?LLM은 사람이 글을 읽듯이 문장을 “이해”하는 방식으로 작동하지 않습니다. 더 정확히 말하면, 텍스트를 숫자로 바꾸고, 그 숫자들 사이의 관계를 계산한 뒤, 다음에 올 가능성이 높은 토큰을 하나씩 예측하는 방식으로 작동합니다.현대 LLM의 대부분은 트랜스포머 Transfo..
AI 코딩 도구는 이제 단순히 코드를 작성하는 수준을 넘어가고 있다.최근 Claude Code에 추가된 Dynamic Workflows는 그 변화를 잘 보여주는 기능이다.핵심은 단순하다.Claude가 주어진 작업에 맞춰스스로 작업 구조, 즉 “하네스(harness)”를 만들어 실행할 수 있게 되었다.기존 Claude Code는 기본적으로 코딩 작업에 최적화된 실행 환경을 제공했다. 하지만 실제로 AI에게 맡기는 일은 점점 더 복잡해지고 있다. 코드 수정뿐 아니라 리서치, 보안 분석, 코드 리뷰, 대규모 문서 검증, 에이전트 팀 운영, 후보자 평가, 사고 원인 분석 같은 작업들이 모두 AI의 영역으로 들어오고 있다.이런 작업들은 단일 프롬프트 하나로 처리하기 어렵다.작업을 나누고, 여러 관점에서 검증하고,..
프롬프트에 바로 쓸 수 있는 애니메이션 용어 정리AI로 웹사이트, 앱 UI, 영상, 모션 그래픽을 만들다 보면 이런 순간이 자주 옵니다.“버튼이 좀 자연스럽게 나타났으면 좋겠는데…”“카드가 부드럽게 열리는 느낌이면 좋겠는데…”“스크롤할 때 화면이 살아 움직였으면 좋겠는데…”그런데 문제는 “자연스럽게”, “부드럽게”, “살아 있게” 같은 표현만으로는 AI가 정확히 어떤 움직임을 만들어야 하는지 알기 어렵다는 점입니다.애니메이션도 하나의 언어입니다.어떤 요소가 어떻게 등장하는지, 어떤 속도로 움직이는지, 사용자의 행동에 어떻게 반응하는지, 화면 전환에서 무엇을 유지해야 하는지에 따라 결과물의 완성도가 크게 달라집니다.그래서 이번 글에서는 AI에게 애니메이션을 지시할 때 자주 쓰는 기본 용어들을 정리해보겠습니..
ChatGPT를 쓰는 시대에서, 이제는 “내가 직접 호스팅하는 AI 작업공간”의 시대로최근 AI 도구의 흐름을 보면 크게 두 가지 방향이 동시에 진행되고 있습니다.하나는 ChatGPT, Claude, Gemini처럼 완성도 높은 클라우드형 AI 서비스를 사용하는 방향입니다. 사용자는 별도의 설치 없이 브라우저에서 바로 AI를 사용할 수 있습니다. 모델 관리, 서버 운영, UI 업데이트, 보안 패치 같은 복잡한 일은 서비스 제공자가 처리합니다.다른 하나는 정반대입니다. 내 컴퓨터나 내 서버에 AI 작업환경을 직접 설치하고, 내가 가진 데이터와 내가 선택한 모델을 중심으로 AI를 운영하는 방식입니다. 이 방향은 아직 대중적이라고 말하기는 어렵지만, 개발자와 AI 파워유저 사이에서는 점점 더 중요한 흐름이 되..
DeepSeek-Reasonix는 어떻게 딥시크 캐시 히트를 끌어올렸나 에이전트 비용 최적화의 핵심은 ‘더 똑똑한 모델’이 아니라 ‘흔들리지 않는 프롬프트 구조’일 수 있다요즘 코딩 에이전트나 장시간 작업 에이전트를 만들다 보면 가장 먼저 부딪히는 문제가 있다.바로 토큰 비용이다.한두 번 질문하는 챗봇이라면 큰 문제가 아니다. 하지만 코드 분석, 파일 수정, 장편 글쓰기, 리서치, 영상 프롬프트 제작처럼 여러 턴에 걸쳐 작업하는 에이전트는 구조가 다르다.매번 이전 대화, 시스템 프롬프트, 도구 목록, 작업 결과, 파일 내용, 중간 상태를 다시 모델에 넣는다.그러다 보면 실제로 새로 입력하는 내용은 얼마 안 되는데, 매 요청마다 수만 토큰의 이전 맥락을 반복해서 보내는 상황이 생긴다.이때 DeepSeek ..
원문 我是怎样使用 AI 来做 Code Review 的? | Viking在 AI 生成代码时代,我现在越来越发现 Review 的重要性,因为 AI 代码产出太快了,假如长时间不干预,很快整个系统有可能都不受控制,质量严重下降,变成一个黑盒,我实践了一个叫 Review Forgvikingz.me AI로 코딩을 하다 보면 가장 먼저 느끼는 것은 속도다.예전에는 하루 종일 붙잡고 있어야 했던 기능도, 이제는 AI에게 요구사항을 던지면 몇 분 안에 수백 줄의 코드가 나온다. 문제는 그다음이다.“이 코드, 정말 믿고 머지해도 될까?”AI가 만들어낸 코드는 빠르다. 하지만 빠른 만큼 사람이 검토해야 할 양도 폭발적으로 늘어난다. 특히 한 번의 기능 개발로 여러 파일이 동시에 바뀌고, 프론트엔드·백엔드·DB 구조까지 함께 건드리는 프로..
AI 에이전트를 쓰다 보면 어느 순간 이런 생각이 듭니다.“이 에이전트가 같은 실수를 반복하지 않게 만들 수는 없을까?”개발 에이전트는 테스트를 돌리지 않고 작업을 끝냈다고 말할 때가 있습니다.문서 작성 에이전트는 중요한 제약 조건을 빠뜨릴 때가 있습니다.영상 프롬프트 작성 에이전트는 캐릭터 일관성, 카메라 동선, 시간 분할 같은 핵심 요소를 놓칠 때가 있습니다.이럴 때 우리는 보통 지침을 추가합니다.테스트를 실행하기 전에는 완료했다고 말하지 마라.모르는 API는 추측하지 말고 확인하라.함수 이름을 바꿀 때는 관련 참조를 모두 검색하라.그런데 이런 지침을 계속 추가하다 보면 문제가 생깁니다.문서는 점점 길어집니다.중복되는 내용이 생깁니다.규칙끼리 충돌하기도 합니다.무엇보다 정말 성능이 좋아졌는지 확인하기..
GPT 이미지 프롬프트 개선기를 만들며 정리한 것들요즘은 누구나 AI로 이미지를 만들 수 있습니다.하지만 막상 원하는 이미지를 만들려고 하면 생각보다 결과가 잘 나오지 않습니다.“예쁘게 만들어줘.”“고급스럽게 만들어줘.”“감성적인 썸네일 만들어줘.”이렇게 입력했는데 결과물이 어딘가 어색하거나, 내가 생각한 방향과 전혀 다르게 나오는 경우가 많습니다.이유는 간단합니다.AI에게는 “예쁘게”라는 말보다 무엇을 어떻게 보여줄지가 훨씬 중요하기 때문입니다.이미지 생성 프롬프트는 주문서라기보다 디자인 디렉션에 가깝습니다.그래서 좋은 이미지를 만들기 위해서는 막연한 감상어보다 구체적인 시각 정보를 알려줘야 합니다.좋은 프롬프트는 “예쁘게”가 아니라 “어떻게”를 말한다많은 사람이 처음에는 이렇게 요청합니다.예쁜 화장품..
AI · Design Workflow Codex를 UI/UX 마법사처럼만드는 디자인 루프 비전 기능과 이미지 생성을 결합해초안을 프로덕션 수준으로 끌어올리는 전체 가이드 2026.05.06 · Codex Desktop Guide대부분의 사람들은 Codex를 단순한 커맨드라인 도구처럼 사용합니다. 그래서 결과물도 대개 초안 수준의 UI 디자인에 머무릅니다.하지만 Codex Desktop 앱은 이 흐름을 바꿉니다. 시각적 피드백 루프를 통합해 앱을 빌드하고 실행하며, 스크린샷을 캡처하고, 비전 기능으로 레이아웃을 검사하고, 사용자 상호작용을 시뮬레이션하며, imagegen으로 에셋을 생성하고, 실제 시각 결과를 바탕으로 코드를 반복 수정합니다.이 접근 방식은 디자인을 한 번의 프롬프트 결과가 아니라 효..
https://github.com/nexu-io/open-design 이 문서는 **Open Design(OD)**에서 선택한 **디자인 시스템(DESIGN.md)**과 시각 시안을 기준으로, Flutter로 TODO 앱을 만들 때의 실무 워크플로우를 예시로 정리합니다.1. 이 가이드가 가정하는 것항목가정OD저장소 루트에서 npm install 후 npm run dev:all로 데몬·웹 UI 기동에이전트Claude Code / Cursor Agent 등 로컬 CLI(또는 Anthropic API BYOK)Flutter안정 채널, Dart 3.x, Material 3(useMaterial3: true) 기본제품iOS/Android(또는 단일 플랫폼) TODO: 추가·완료 토글·삭제·필터, 1차 저장은 메모..
AI Writing 당신은 하나의텍스트 파일입니다 AI가 당신 목소리로 말하게 만드는단 두 시간의 작업 2025.05.03 · Ruben Hassid 당신이 쓴 모든 글, 당신이 한 모든 말 — 그 모든 것이 결국 하나의 파일로 압축될 수 있다면? 그리고 그 파일이 AI에게 당신의 목소리를 완벽하게 복제할 수 있다면? 이건 SF가 아닙니다. 지금 당장 할 수 있는 일입니다. 이름하여 about-me.md. 당신은 하나의 텍스트 파일입니다. 진짜입니다. 당신이 쓰는 모든 것 — 이메일, 트윗, 블로그 글 — 이 하나의 파일로 요약될 수 있습니다. 그리고 그 파일이 AI를 당신처럼 글 쓰게 만듭니다. 왜 about-me.md인가 대부분의 사람들은 AI에게 “나처럼 써줘”라고 말합니다..
AI Coding Agent Skills 에이전트가 무작정 코드를 짜지않게 만드는 방법 mattpocock/skills 분석 — 요구사항 정렬부터 TDD, 아키텍처 개선까지AI 코딩을 실무 프로세스에 맞춘 12개 스킬 2026.05.03 · AI Engineering Workflow이 저장소가 풀려는 문제AI 코딩 에이전트가 빠르게 코드를 만들면서 아키텍처를 망가뜨리는 일은 이제 흔합니다. 에이전트가 사용자의 의도를 잘못 이해하고, 프로젝트 용어를 못 맞추고, 만든 코드가 동작하지 않는 문제도 반복됩니다.mattpocock/skills는 이 문제를 슬래시 커맨드 형태의 작업 지시서로 해결합니다. 에이전트가 무작정 코드를 고치지 않고, 정해진 흐름을 따르게 만듭니다. 요구사항 정렬 → 도메인 언어 ..
Game Dev Pipeline AI로 만드는 2D 스프라이트 시트실전 파이프라인 가이드 이미지 모델 + 비디오 모델 + 파이썬 자동화세 가지를 조합해 게임용 애니메이션을 완성하는 방법 2026.05.02 · AI Game Art Workflow왜 이미지 모델만으로는 안 되는가게임용 스프라이트 시트는 단순히 예쁜 그림이 아닙니다. 프레임이 수학적으로 정확한 격자에 맞아야 하고, 캐릭터가 매 프레임 중앙에 있어야 하며, 배경은 완벽히 투명해야 합니다.이미지 생성 모델은 이런 규칙을 자주 어깁니다. 특히 걷기나 달리기처럼 다리 움직임이 핵심인 애니메이션에서 오류가 많습니다. 프레임마다 위치가 흔들리고, 배경이 섞이고, 캐릭터 비율이 변합니다.그래서 이미지 모델 + 비디오 모델 + 로컬 파이썬 스크립트 ..
Open Source · Design Tool 당신의 에이전트가디자인 엔진이 된다면 Open Design — 로컬에서 실행되고, 에이전트를 선택하고,스킬을 조합하는 오픈소스 디자인 생성 도구 2026.04.29 · Open Design Team왜 이 프로젝트가 필요한가2026년 4월, Anthropic이 Claude Design을 공개했다. LLM이 글을 쓰는 대신 실제 디자인 산출물을 배송하는 첫 번째 순간이었다. 반응은 폭발적이었다. 그리고 그대로 폐쇄형, 유료, 클라우드 전용, Anthropic 모델 락인이었다.직접 호스팅할 수 없다. Vercel에 배포할 수 없다. 다른 에이전트를 끼워 넣을 수 없다. 스킬을 수정하거나 새로 만들 수 없다. Open Design은 같은 루프, 같은 산출물 ..
Open Source Analysis 로컬에서 돌아가는AI 보이스 스튜디오 ElevenLabs 대체재이자 WisprFlow 대체재.음성 복제, TTS, STT, 딕테이션, 에이전트 음성 출력까지모든 걸 내 컴퓨터에서. 2026.04.28 · jamiepine/voicebox 분석 어떤 프로젝트인가 Voicebox는 로컬 우선(local-first) 오픈소스 AI 보이스 스튜디오입니다. 클라우드 의존 없이 음성 복제, 텍스트 음성 변환(TTS), 음성 인식(STT), 글로벌 받아쓰기, AI 에이전트 음성 출력까지 한 데 묶은 데스크톱 애플리케이션입니다. ElevenLabs와 WisprFlow를 합친 무료 대안. 모든 처리가 로컬에서 이루어지며, API 키나 구독이 필요 없습니다. ..
Open Source Tool AI와 채팅하면영상이 편집됩니다 원본 영상을 폴더에 넣고 Claude Code와 대화하면,편집이 끝난 final.mp4를 돌려받습니다.video-use가 하는 일을 정리했습니다. 2026.04.28 · video-use 가이드 어떤 일을 하나요 영상을 터미널에 드래그하고, 자연어로 원하는 편집을 말하면 됩니다. AI가 전사하고, 분석하고, 편집 전략을 제안한 뒤 렌더까지 수행합니다. ✎ 필러 워드 제거 "음", "어", "그러니까" 같은 불필요한 말을 감지해 깔끔하게 잘라냅니다 ☀ 컬러 그레이딩 클립별로 데이터 기반 색보정을 자동 적용합니다 ♪ 오디오 ..
이 저장소는 완성형 프레임워크를 바로 쓰게 하는 대신, 가장 단순한 채팅 루프에서 출발해 도구 호출, 스킬, 세션 저장, 컨텍스트 압축, 이벤트 버스, 멀티 에이전트, 장기 메모리까지 직접 조립해 보게 만드는 튜토리얼형 프로젝트입니다. (GitHub)요즘 AI 에이전트를 다룰 때 가장 답답한 지점은 “잘 돌아가는 데 왜 그렇게 설계됐는지”가 보이지 않는다는 점입니다. 프레임워크는 빠르게 결과를 내주지만, 구조를 이해하지 못하면 비용이 왜 늘었는지, 컨텍스트가 왜 깨졌는지, 왜 특정 상황에서만 불안정한지 판단하기 어렵습니다. 이 저장소는 그 불투명한 중간층을 단계별 코드로 드러냅니다. (GitHub)이 글을 끝까지 읽으면 세 가지가 명확해집니다.첫째, 에이전트가 단순한 LLM 호출이 아니라 세션, 이벤트,..
이 글은 GEOFlow를 이해하기 위해 작성되었습니다.단순히 AI로 글을 생성하는 도구로 보면 이 프로젝트의 핵심을 놓치기 쉽습니다. GEOFlow는 글 생성 자체보다, 콘텐츠 운영의 전체 흐름을 하나의 시스템으로 묶는 것에 더 가깝습니다. 모델 설정, 소재 관리, 작업 실행, 검토, 게시까지를 끊기지 않게 연결하려는 시도입니다. (GitHub)기존의 AI 콘텐츠 운영은 보통 여러 도구에 흩어져 있습니다. 프롬프트는 문서에 따로 저장하고, 제목은 스프레드시트로 관리하고, 생성은 별도 스크립트로 돌리고, 결과는 CMS에 다시 붙여 넣습니다. 이런 구조는 처음에는 빨라 보여도, 작업량이 늘어나면 관리 비용이 급격히 커집니다. GEOFlow는 바로 그 지점을 겨냥합니다. (GitHub)이 글을 끝까지 읽으면 ..
최근 AI 코딩 에이전트는 빠르게 늘어났지만, 실무에서 써보면 금방 한계가 드러납니다. 로컬에서 터미널을 켜 두고 지켜봐야 하고, 중간에 끊기면 다시 상태를 맞춰야 하며, 긴 작업은 요청-응답 수명 안에 가두기 어렵기 때문입니다. (GitHub)Open Agents는 이 문제를 “에이전트를 오래 실행되게 만드는 방법”의 관점에서 다시 설계한 프로젝트입니다. 웹 UI, 워크플로우 기반의 에이전트 실행, 샌드박스 VM, 그리고 GitHub 연동을 한 구조로 묶어, 프롬프트에서 코드 변경과 푸시, PR 생성까지 이어지는 흐름을 만들었습니다. (GitHub)이 글을 끝까지 읽으면 세 가지가 분명해집니다. 왜 기존 AI 코딩 에이전트가 실무에서 피로했는지, Open Agents가 그 문제를 어떤 아키텍처로 풀었는..
이 글은 ralph-orchestrator가 왜 등장했고, 자율 AI 에이전트 워크플로우를 어떻게 더 안정적으로 만들려는지 이해하기 위해 작성되었습니다. 단순히 “에이전트를 계속 돌리는 도구”로 보면 이 프로젝트의 핵심을 놓치게 됩니다. 이 도구가 겨냥하는 문제는 기능 부족이 아니라, 에이전트가 똑똑할수록 오히려 전체 흐름은 더 불안정해질 수 있다는 점입니다. (GitHub)기존 자율 에이전트 방식은 보통 하나의 강한 프롬프트에 많은 책임을 몰아넣습니다. 계획도 세우고, 코드도 짜고, 테스트도 돌리고, 실패 원인도 스스로 해석하게 만듭니다. 처음엔 단순해 보이지만, 작업이 길어질수록 컨텍스트가 비대해지고, 실패 원인이 흐려지고, “됐다고 했는데 실제로는 안 된 상태”가 자주 생깁니다. ralph-orch..
정적인 PSD나 PNG를 가져와서, 복잡한 리깅 작업 없이 빠르게 2D 캐릭터 애니메이션으로 바꾸는 흐름을 설명합니다. 특히 이 도구가 단순한 편집기가 아니라, 레이어 분해된 캐릭터를 실제 애니메이션 파이프라인으로 연결하는 데 초점을 둔 이유를 다룹니다. (GitHub)기존 2D 캐릭터 애니메이션 도구는 크게 두 가지 불편이 있었습니다. 하나는 본 세팅과 파라미터 설계가 무겁다는 점이고, 다른 하나는 AI가 분해해 준 레이어를 실제 애니메이션 가능한 구조로 옮기는 과정이 생각보다 수작업 중심이라는 점입니다. Stretchy Studio는 이 사이를 메우기 위해, 타임라인 중심 편집과 메쉬 변형을 결합하는 방향으로 설계되었습니다. (GitHub)이 글을 끝까지 읽으면 세 가지가 잡힙니다. 왜 이 도구가 기..
“원래는 안 될 것 같은데, 요즘은 됩니다”의 진짜 이유처음 들으면 이상합니다.“27B, 70B, 100B, 심지어 200B가 넘는 모델을고작 16GB VRAM GPU로 돌릴 수 있다.”상식적으로는 말이 안 되는 이야기처럼 보입니다.보통 대형 모델은 모델 전체가 GPU 메모리(VRAM)에 올라가야 실행된다고 알려져 있기 때문입니다.그래서 많은 분들이 이렇게 생각합니다.“아니, 100GB가 넘는 모델이면당연히 VRAM도 그 정도는 있어야 하는 거 아닌가?”네, 최고 속도로 돌리려면 그 말이 맞습니다.하지만 요즘은 꼭 그렇게만 돌리지 않습니다.최근 추론 엔진과 양자화 기술이 발전하면서, 이제는 GPU 메모리만으로 버티는 시대에서 GPU + RAM을 함께 활용하는 시대로 넘어오고 있습니다.쉽게 말하면,예전에는..
대부분의 사람들은 AI를 콘텐츠 제작에 이렇게 쓴다.Claude를 연다“생산성에 대한 링크드인 포스트 써줘”라고 입력한다회사 인턴이 쓴 것 같은 평범한 포스트를 받는다로봇처럼 안 들리게 20분 동안 손본다그리고 플랫폼마다 그걸 또 처음부터 반복한다이건 시스템이 아니다.그냥 단계만 더 많은 잡일이다.문제는 AI가 아니다.문제는 네가 AI에게 브랜드, 독자, 말투, 플랫폼 전략, 그리고 이 모든 요소가 어떻게 연결되는지에 대한 맥락을 전혀 주지 않고 있다는 것이다.매번 새 채팅을 시작할 때마다 기억상실에 걸린 천재를 새로 고용하는 셈이다.해결책: 스킬 그래프가 이 문제를 해결한다.신입 직원을 고용한다고 생각해보자.첫날부터 아무 온보딩도 없이, 문서도 없이, 회사가 어떻게 돌아가는지에 대한 맥락도 없이 바로 ..
RAG vs Agentic RAG 정리1. 한 줄 차이RAG사용자의 질문이 들어오면검색 시스템이 관련 문서를 찾아오고그 결과를 LLM에 붙여서 답하게 하는 방식Agentic RAG단순 검색만 하지 않고에이전트가 계획을 세우고, 필요한 도구를 선택하고, 여러 소스를 순차적으로 탐색한 뒤더 능동적으로 답을 만드는 방식2. 기본 RAG 구조이미지 상단의 흐름은 거의 이렇게 보면 됩니다.동작 흐름사용자가 질문 입력서버가 질문을 검색 시스템에 전달Search가 지식 소스에서 관련 정보 가져옴PDFDatabaseDocumentsCodeWeb SearchAPI검색 결과를 서버가 받음서버가 원래 질문 + 검색된 문맥을 합쳐서 LLM에 전달LLM이 최종 답변 생성특징구조가 단순함빠르고 구현이 쉬움질문 1개 → 검색 1번..
AI 코딩 도구를 쓰다 보면, 가장 먼저 부딪히는 문제는 코드 생성 자체가 아닙니다.오히려 “무엇을 어디까지 만들 것인가”를 구조화하지 못한 상태에서 너무 큰 요구사항을 한 번에 던지는 일이 더 큰 문제입니다.예를 들어 “SaaS 플랫폼 하나 만들어줘” 같은 요청은 그럴듯해 보이지만, 실제 구현 단계로 내려가면 인증, 결제, 대시보드, 외부 연동처럼 서로 다른 성격의 하위 문제들이 섞여 있습니다. (GitHub)deep-project는 바로 이 지점을 다룹니다.이 도구는 모호하고 큰 프로젝트 요구사항을 바로 구현하려 하지 않고, 먼저 인터뷰와 분해 과정을 거쳐 “계획 가능한 단위”로 나누는 데 집중합니다. GitHub - piercelamb/deep-project: Claude Code plugin th..
