목록2026/06/03 (2)
오늘도 공부
ChatGPT를 쓰는 시대에서, 이제는 “내가 직접 호스팅하는 AI 작업공간”의 시대로최근 AI 도구의 흐름을 보면 크게 두 가지 방향이 동시에 진행되고 있습니다.하나는 ChatGPT, Claude, Gemini처럼 완성도 높은 클라우드형 AI 서비스를 사용하는 방향입니다. 사용자는 별도의 설치 없이 브라우저에서 바로 AI를 사용할 수 있습니다. 모델 관리, 서버 운영, UI 업데이트, 보안 패치 같은 복잡한 일은 서비스 제공자가 처리합니다.다른 하나는 정반대입니다. 내 컴퓨터나 내 서버에 AI 작업환경을 직접 설치하고, 내가 가진 데이터와 내가 선택한 모델을 중심으로 AI를 운영하는 방식입니다. 이 방향은 아직 대중적이라고 말하기는 어렵지만, 개발자와 AI 파워유저 사이에서는 점점 더 중요한 흐름이 되..
DeepSeek-Reasonix는 어떻게 딥시크 캐시 히트를 끌어올렸나 에이전트 비용 최적화의 핵심은 ‘더 똑똑한 모델’이 아니라 ‘흔들리지 않는 프롬프트 구조’일 수 있다요즘 코딩 에이전트나 장시간 작업 에이전트를 만들다 보면 가장 먼저 부딪히는 문제가 있다.바로 토큰 비용이다.한두 번 질문하는 챗봇이라면 큰 문제가 아니다. 하지만 코드 분석, 파일 수정, 장편 글쓰기, 리서치, 영상 프롬프트 제작처럼 여러 턴에 걸쳐 작업하는 에이전트는 구조가 다르다.매번 이전 대화, 시스템 프롬프트, 도구 목록, 작업 결과, 파일 내용, 중간 상태를 다시 모델에 넣는다.그러다 보면 실제로 새로 입력하는 내용은 얼마 안 되는데, 매 요청마다 수만 토큰의 이전 맥락을 반복해서 보내는 상황이 생긴다.이때 DeepSeek ..
