목록전체 글 (1727)
오늘도 공부
보통 지오코딩이라고 하면 Google Maps API나 별도 geocoding 서버를 떠올립니다. 그런데 이 프로젝트는 DuckDB-WASM으로 브라우저 안에 SQL 엔진을 올리고, Overture Maps 주소 데이터를 Parquet 파일로 직접 조회해서 정방향/역방향 지오코딩을 처리합니다. README 기준으로 4억 6,900만 건 이상 주소, 39개국 지원, 지도 클릭 기반 reverse geocoding, H3 타일 기반 조회 최적화까지 포함합니다. (GitHub)이런 도구는 특히 다음 독자에게 도움이 됩니다. 지도 서비스나 위치 검색 UI를 만드는 프론트엔드 개발자, 지오스페이셜 데이터 처리 흐름을 이해하고 싶은 개발자, 서버 비용 없이 데모나 프로토타입을 만들고 싶은 팀입니다. 공개된 저장소 ..
협업 도구는 이미 많습니다. 그런데 대부분은 결국 “채팅창 + 문서 + 보드” 조합으로 흘러갑니다. DeskRPG는 여기서 한 걸음 더 나가, 브라우저 안의 2D 픽셀 아트 오피스를 협업 인터페이스로 삼고, 그 안에 AI NPC, 태스크 진행, 회의, 맵 편집까지 붙입니다. 단순한 장식이 아니라, 협업 경험 자체를 공간 기반으로 재구성하려는 시도라고 볼 수 있습니다. (GitHub) GitHub - dandacompany/deskrpg: 2D pixel art multiplayer virtual office game — create characters, join channels, chat with AI N2D pixel art multiplayer virtual office game — create ch..
이 글은 Claude Code를 처음 프로젝트에 붙일 때 많은 팀이 비슷하게 겪는 문제를 어떻게 줄일 수 있는지 정리한 글입니다. 특히 “두 번째 세션부터 컨텍스트가 사라진다”, “에이전트에게 많이 맡겼더니 결과가 서로 충돌한다”, “하드 룰은 개발하다가 뒤늦게 떠오른다” 같은 문제를, 시작 단계에서 구조화하는 방법에 초점을 맞춥니다.공개된 저장소 기준으로, AlexZio00/claude-code-skills는 Claude Code용 실전형 스킬 모음이며 현재 README에서 확인되는 핵심 스킬은 /project-init입니다. 이 스킬은 코드를 쓰기 전에 인터뷰를 통해 CLAUDE.md와 DEVELOPMENT_ROADMAP.md를 생성하는 방식으로 프로젝트의 기본 원칙을 먼저 고정하자는 접근을 취합니다..
이 글은 GitHub 레포지토리 graphify를 기준으로, 이 도구가 왜 필요한지부터 핵심 개념, 동작 방식, 설치 방법, 실무 활용 포인트까지 한 번에 정리한 글입니다. 공개된 README와 아키텍처 문서상 확인되는 범위에서 설명합니다. (GitHub)요즘 AI 코딩 도구를 쓰다 보면 비슷한 문제가 자주 생깁니다. 파일은 많고, 문서와 코드와 이미지가 섞여 있고, 모델은 매번 원본 파일을 다시 훑느라 느리고 비싸고 맥락을 놓칩니다. graphify는 이 문제를 “파일 모음”을 질의 가능한 지식 그래프로 바꾸는 방식으로 풀려는 도구입니다. (GitHub)특히 이 도구는 Claude Code, Codex, OpenCode, OpenClaw, Factory Droid 같은 AI 코딩 어시스턴트와 함께 쓰는..
이 글은 VoiceStar가 무엇인지, 왜 기존 제로샷 TTS보다 한 단계 더 주목받는지를 정리한 글입니다. 특히 “목소리만 비슷하게 복제하면 끝 아닌가?”가 아니라, 원하는 길이에 맞춰 음성을 만들고, 학습 때 본 것보다 더 긴 구간까지 안정적으로 생성하는 문제를 어떻게 다루는지에 초점을 맞춥니다. (arXiv)최근 TTS는 품질만으로는 차별화가 어렵습니다. 실무에서는 발화 길이 제어, 긴 문장 안정성, 말이 밀리거나 끊기지 않는 정렬, 빠른 테스트 환경이 더 중요해집니다. VoiceStar는 이 지점에서, 논문 기준으로 제로샷 TTS에서 duration control과 extrapolation을 동시에 달성한 첫 모델로 소개됩니다. (arXiv)이 글은 이런 분께 도움이 됩니다.제로샷 TTS를 처음 ..
최근 에이전트 개발은 “모델 호출” 자체보다도 라우팅, 메모리, 툴 연결, 워크플로, 관찰 가능성 같은 주변 인프라가 더 어렵습니다. VoltAgent는 이 부분을 TypeScript 중심으로 묶어, 에이전트 로직보다 인프라 조립에 시간을 덜 쓰게 하려는 방향을 갖고 있습니다. (GitHub)특히 JavaScript·TypeScript 스택에서 서버와 UI를 함께 다루는 개발자라면 볼 이유가 있습니다. 공식 문서 기준으로 VoltAgent는 Vercel AI SDK 위에 구축되어 있고, 모델 문자열 기반 설정과 TypeScript API를 통해 여러 모델 제공자를 바꿔 끼울 수 있게 설계되어 있습니다. (voltagent.dev) GitHub - VoltAgent/voltagent: AI Agent En..
이름 그대로 Reddit 글과 댓글을 바탕으로 쇼츠형 영상을 자동 생성해 주는 오픈소스 봇입니다. 저장소 소개 문구도 “한 번의 명령으로 Reddit 영상을 만든다”는 점을 전면에 내세우고 있습니다. (GitHub)이 도구가 흥미로운 이유는 단순히 “영상 하나를 편하게 만든다” 수준이 아니기 때문입니다. 원래는 Reddit 글 선정, 댓글 추출, 스크린샷, TTS 음성 생성, 배경 영상 합성, 자막 느낌의 구성까지 여러 단계를 사람이 따로 처리해야 합니다. RedditVideoMakerBot은 이 흐름을 코드로 묶어 자동화합니다. 공개 README 기준으로 설치 후 python main.py로 실행하고, Reddit 앱 설정과 봇 옵션을 입력해 결과 영상을 만드는 구조입니다. (GitHub)특히 이런 도..
AI가 글을 써주는 시대는 이미 지났습니다. 이제 중요한 건 “글을 한 편 생성하느냐”가 아니라, 검색 의도 분석부터 경쟁사 조사, 초안 작성, 최적화, 발행까지를 하나의 운영 시스템으로 묶을 수 있느냐입니다. SEO Machine은 바로 그 지점을 겨냥한 프로젝트입니다. 단순한 프롬프트 모음이 아니라, Claude Code 위에 올라가는 콘텐츠 생산 워크스페이스에 가깝습니다. (GitHub)특히 이 저장소가 흥미로운 이유는, “AI에게 블로그 글을 써 달라” 수준에서 멈추지 않고 리서치 → 작성 → 분석 → 최적화 → WordPress 발행까지를 하나의 흐름으로 설계했다는 점입니다. 저장소 설명에서도 이 프로젝트를 long-form SEO 콘텐츠 작성을 위한 Claude Code workspace로 정..
AI를 “잘 쓰는 사람”보다 앞으로 더 강해질 사람은, AI가 왜 그렇게 동작하는지 설명할 수 있는 사람일 가능성이 높습니다.요즘 대부분의 개발자는 LLM을 API로 호출합니다. 하지만 API 뒤에서 실제로 어떤 일이 벌어지는지, 토크나이저는 왜 필요한지, attention은 어디서 계산되는지, 왜 작은 모델은 금방 문맥을 잃는지까지 손으로 한 번 만들어본 사람은 많지 않습니다. 그래서 지금 Hacker News에서 주목받는 GuppyLM은 단순한 장난감 프로젝트가 아닙니다. 이 프로젝트는 “LLM은 거대한 GPU 클러스터와 미친 자본이 있어야만 이해할 수 있다”는 착각을 정면으로 깨버립니다. 작성자는 이 모델을 약 8.7M 파라미터, 약 130줄짜리 PyTorch 모델 코드, 60K 합성 대화 데이터,..
AI 에이전트 시대가 되면서 “사람이 읽기 좋은 문서”와 “기계가 읽기 좋은 데이터”를 동시에 제공하는 서비스가 점점 중요해지고 있습니다. KarpathyTalk는 바로 그 지점을 찌릅니다. 겉으로 보면 작은 소셜 서비스처럼 보이지만, 실제로는 마크다운 문서를 중심으로 한 공개형 개발자 커뮤니티를 아주 단순한 구조로 구현한 실험입니다. 일반적인 소셜 플랫폼처럼 데이터를 감추는 대신, 게시물과 사용자 정보를 JSON과 Markdown으로 열어두고 LLM 에이전트까지 염두에 둔 인터페이스를 제공합니다. (GitHub)프로젝트 소개KarpathyTalk는 Andrej Karpathy가 공개한 오픈소스 프로젝트로, 저장소 설명 그대로 “builders and agents를 위한 긍정적인 개발자 커뮤니티”를 지향..
