목록전체 글 (1705)
오늘도 공부
AI 코딩 도구를 쓰다 보면, 가장 먼저 부딪히는 문제는 코드 생성 자체가 아닙니다.오히려 “무엇을 어디까지 만들 것인가”를 구조화하지 못한 상태에서 너무 큰 요구사항을 한 번에 던지는 일이 더 큰 문제입니다.예를 들어 “SaaS 플랫폼 하나 만들어줘” 같은 요청은 그럴듯해 보이지만, 실제 구현 단계로 내려가면 인증, 결제, 대시보드, 외부 연동처럼 서로 다른 성격의 하위 문제들이 섞여 있습니다. (GitHub)deep-project는 바로 이 지점을 다룹니다.이 도구는 모호하고 큰 프로젝트 요구사항을 바로 구현하려 하지 않고, 먼저 인터뷰와 분해 과정을 거쳐 “계획 가능한 단위”로 나누는 데 집중합니다. GitHub - piercelamb/deep-project: Claude Code plugin th..
요즘 음성 합성은 더 이상 실험용 기능이 아닙니다. 팟캐스트, 오디오북, 게임 대사, 숏폼 더빙, AI 캐릭터 음성까지 이미 제작 파이프라인의 한 부분이 되었습니다. 문제는 많은 팀이 여전히 클라우드 TTS에 의존하고 있다는 점입니다. 비용은 계속 누적되고, 샘플 음성과 생성 결과가 외부로 오가며, 서비스 제약도 함께 따라옵니다. (GitHub)Voicebox는 이 문제를 다른 방향에서 풀려는 도구입니다. 핵심은 “좋은 음성 합성을 클라우드 API가 아니라 내 장비에서 직접 처리하자”는 접근입니다. 이 글을 끝까지 읽으면 Voicebox가 왜 등장했는지, 기존 방식과 무엇이 다른지, 실제로 어떤 구조로 돌아가며, 어떤 팀에게 유리하고 어디까지는 아직 조심해서 봐야 하는지까지 한 번에 잡을 수 있습니다. ..
터미널 하나를 “작업 공간”으로 바꾸는 가장 실용적인 방법맥으로 개발하다 보면 어느 순간 이런 장면이 반복됩니다.한쪽에서는 서버를 띄우고, 다른 창에서는 로그를 보고, 또 다른 탭에서는 데이터베이스에 붙고, SSH로 원격 서버도 들어가야 합니다. 그런데 맥북을 덮거나 터미널 창을 잘못 닫는 순간 흐름이 끊깁니다.이때 많은 개발자가 결국 정착하는 도구가 tmux입니다. tmux는 하나의 터미널 안에서 여러 프로그램을 실행하고, 작업을 분리했다가 다시 붙을 수 있게 해주는 터미널 멀티플렉서입니다. 공식 위키도 tmux를 “하나의 터미널 안에서 여러 프로그램을 다루고, 분리(detach) 후 다시 재연결(reattach)할 수 있게 해주는 도구”로 설명합니다. (GitHub)이 글에서는 맥 기준으로 tmux가..
최근 TTS(Text-to-Speech)는 많이 발전했지만, 실무에서는 여전히 몇 가지 문제가 남아 있습니다. 음성은 자연스러워야 하고, 화자 특성은 유지해야 하고, 여러 언어를 지원해야 하며, 가능하면 실시간에 가깝게 동작해야 합니다. VoxCPM2는 이 요구를 하나의 오픈소스 모델 계열 안에서 풀어보려는 시도입니다. GitHub README와 공식 문서에 따르면, 이 모델은 tokenizer-free TTS, 30개 언어 지원, 보이스 디자인, 제어 가능한 음성 클로닝, 48kHz 출력을 핵심으로 내세웁니다. (GitHub) GitHub - OpenBMB/VoxCPM: VoxCPM2: Tokenizer-Free TTS for Multilingual Speech Generation, Creative V..
AI 코딩 도구를 써 본 개발자라면 금방 느낍니다.같은 요청을 해도 결과가 매번 다릅니다. 어떤 날은 계획을 잘 세우고, 어떤 날은 테스트를 건너뛰고, 어떤 날은 PR 설명조차 엉성합니다. Archon은 바로 이 불안정함을 줄이기 위해 나온 도구입니다. (GitHub)핵심은 간단합니다.“AI에게 일을 맡긴다”에서 끝내지 않고, “어떤 순서와 규칙으로 일을 하게 할지”를 워크플로로 고정하는 것입니다. 이 글을 끝까지 읽으면 Archon이 왜 필요한지, 기존 AI 코딩 방식과 무엇이 다른지, 어떤 팀에 잘 맞고 어디까지 기대해야 하는지까지 한 번에 감을 잡을 수 있습니다. (GitHub) GitHub - coleam00/Archon: The first open-source harness builder for..
최근 AI 도구는 많아졌지만, 실제로 메모 앱 안에서 일하는 방식은 크게 바뀌지 않았습니다. 채팅창에 질문을 던지고, 답을 복사해서 노트에 붙여넣고, 다시 수정 지시를 내리는 흐름이 대부분이었습니다. 이 과정은 보기보다 자주 끊깁니다. 문맥이 잘리고, 수정 이력이 흩어지고, 작업 대상이 많아질수록 대화와 파일이 따로 노는 문제가 생깁니다. (GitHub)Claudian은 이 불편을 정면으로 건드립니다. 핵심은 “AI를 노트 앱에 붙인다”가 아니라, Obsidian 볼트 자체를 에이전트의 작업 디렉터리로 바꾸는 데 있습니다. 즉, AI가 단순히 답변만 생성하는 것이 아니라 볼트 안의 파일을 읽고, 쓰고, 검색하고, 필요하면 여러 단계를 거쳐 작업을 수행하는 구조입니다. (GitHub)이 글을 끝까지 읽으면..
이 글은 앤트로픽이 공개한 Claude Managed Agents와, 거의 동시에 등장한 오픈소스 프로젝트 Multica가 무엇을 해결하려는지 정리한 글입니다. 핵심은 단순히 “비슷한 제품이 나왔다”가 아닙니다. 이제는 에이전트를 잘 만드는 것보다, 에이전트를 안정적으로 실행하고 팀 워크플로우에 붙이는 인프라가 더 중요한 단계로 넘어가고 있다는 점입니다. (Claude Platform)특히 Claude Managed Agents는 앤트로픽이 직접 제공하는 관리형 에이전트 실행 환경이고, Multica는 그 문제를 오픈소스·셀프호스팅·벤더 중립 방식으로 풀려는 프로젝트입니다. 둘 다 “모델 호출”을 넘어, 에이전트가 장시간 작업하고, 도구를 쓰고, 상태를 유지하고, 팀 안에서 일하게 만드는 데 초점을 둡니..
이 글은 Google Cloud AI 디렉터 Addy Osmani가 만든 agent-skills의 6단계 프로세스 중, 첫 단계인 DEFINE을 정리한 글입니다. 특히 DEFINE 단계에서 사용하는 /spec 명령이 왜 중요한지, 그리고 이 명령이 단순히 “앱을 만들어주는 기능”이 아니라 요구사항을 명확하게 만드는 도구라는 점을 중심으로 설명합니다. (GitHub)처음 AI 코딩 에이전트를 쓰면 보통 이렇게 요청하게 됩니다.“할 일 앱을 만들어줘.”문제는 이 한 문장만으로는 화면 범위, 저장 방식, 로그인 필요 여부, 우선순위 기능, 테스트 기준이 전혀 정해지지 않는다는 점입니다. agent-skills의 /spec은 바로 이 모호함을 줄이기 위해 존재합니다. 코드를 먼저 쓰는 대신, 무엇을 만들지 문서..
보통 지오코딩이라고 하면 Google Maps API나 별도 geocoding 서버를 떠올립니다. 그런데 이 프로젝트는 DuckDB-WASM으로 브라우저 안에 SQL 엔진을 올리고, Overture Maps 주소 데이터를 Parquet 파일로 직접 조회해서 정방향/역방향 지오코딩을 처리합니다. README 기준으로 4억 6,900만 건 이상 주소, 39개국 지원, 지도 클릭 기반 reverse geocoding, H3 타일 기반 조회 최적화까지 포함합니다. (GitHub)이런 도구는 특히 다음 독자에게 도움이 됩니다. 지도 서비스나 위치 검색 UI를 만드는 프론트엔드 개발자, 지오스페이셜 데이터 처리 흐름을 이해하고 싶은 개발자, 서버 비용 없이 데모나 프로토타입을 만들고 싶은 팀입니다. 공개된 저장소 ..
협업 도구는 이미 많습니다. 그런데 대부분은 결국 “채팅창 + 문서 + 보드” 조합으로 흘러갑니다. DeskRPG는 여기서 한 걸음 더 나가, 브라우저 안의 2D 픽셀 아트 오피스를 협업 인터페이스로 삼고, 그 안에 AI NPC, 태스크 진행, 회의, 맵 편집까지 붙입니다. 단순한 장식이 아니라, 협업 경험 자체를 공간 기반으로 재구성하려는 시도라고 볼 수 있습니다. (GitHub) GitHub - dandacompany/deskrpg: 2D pixel art multiplayer virtual office game — create characters, join channels, chat with AI N2D pixel art multiplayer virtual office game — create ch..
