목록전체 글 (1727)
오늘도 공부
AI Agent를 만들기 시작하면 금방 비슷한 벽에 부딪힙니다.“툴 호출은 되는데 구조가 금방 꼬인다”, “멀티 에이전트 데모는 되는데 운영 환경으로 옮기기 어렵다”, “메모리, 추적, 평가를 붙이려니 프레임워크 바깥 일이 더 많다.”AgentScope는 바로 그 지점에서 등장한 프로젝트입니다. 단순히 “에이전트를 하나 띄우는 라이브러리”가 아니라, ReAct 에이전트, 툴, 메모리, MCP, A2A, RAG, tracing, evaluation, realtime voice까지 하나의 개발 경험으로 묶으려는 방향이 매우 분명합니다. 저장소 README는 AgentScope를 “production-ready, easy-to-use agent framework”로 소개하고, 실제 패키지 구조도 agent, ..
AI 에이전트가 코드를 짜고 문서를 읽고 웹을 탐색하는 시대다. 그런데 투자 리서치나 기업 분석처럼 데이터 정확성, 툴 선택, 반복 검증이 특히 중요한 문제에서는 “그럴듯하게 답하는 LLM”만으로는 부족하다. Dexter는 바로 그 지점을 겨냥한다. 이 프로젝트는 범용 챗봇이 아니라, 복잡한 금융 질문을 단계별 조사 계획으로 쪼개고, 실시간 데이터와 문서를 수집하고, 자기 결과를 다시 점검하면서 답을 완성하는 금융 특화 에이전트다. (GitHub)저장소 첫 문장도 이 성격을 아주 선명하게 보여준다. Dexter는 “deep financial research”를 위한 autonomous agent로 소개되며, 실제로 코드 구조를 보면 CLI 중심 실행기, 금융 툴 레지스트리, 메모리 계층, 승인 기반 파일..
AI 에이전트 시대에 새로 생긴 문제는 “모델이 똑똑하냐”가 아닙니다. 같은 스킬이 10번 중 몇 번이나 안정적으로 잘 동작하느냐입니다.많은 팀이 Claude Skills, 시스템 프롬프트, 내부 에이전트 워크플로를 잘 만들어 놓고도 중요한 사실을 놓칩니다. 한두 번 잘 돌아간다고 해서, 그 스킬이 운영 가능한 수준으로 안정화된 것은 아니라는 점입니다. 실제로 Ole Lehmann은 이 문제를 정면으로 다뤘습니다. 그가 적용한 방식은 Andrej Karpathy가 공개한 autoresearch 아이디어를 Claude Skills 개선 루프로 옮겨온 것이었고, 랜딩 페이지 카피 스킬의 품질 체크 통과율을 56%에서 92%까지 끌어올렸습니다. 사람이 프롬프트를 손으로 뜯어고친 것이 아니라, 에이전트가 스스로..
Anthropic이 2025년에 공개한 회로 추적 연구로 본 LLM 내부 동작의 실제 모습AI 모델이 점점 더 똑똑해질수록, 개발자에게 더 불편한 질문 하나가 남습니다.모델은 왜 그런 답을 냈는가?지금까지 우리는 프롬프트를 넣고 결과를 받는 방식으로 LLM을 써 왔습니다. 잘 맞으면 “추론을 잘하네”라고 말했고, 틀리면 “환각했네”라고 말했습니다. 하지만 그 사이, 즉 입력에서 출력까지 모델 내부에서 무슨 계산이 일어났는지는 거의 알지 못했습니다. Anthropic은 바로 그 지점을 건드렸습니다. 2025년 3월 공개한 연구에서 이들은 Claude 3.5 Haiku의 내부 계산을 추적하는 “회로 추적” 방법을 제안했고, 시 쓰기, 다국어 처리, 산수, 환각, 탈옥 프롬프트, chain-of-thought..
AI가 코드를 써주는 시대는 이미 왔습니다.그런데 팀에 바로 도움이 되는 건 “코드 생성”이 아니라, 실패한 CI를 다시 고치고, 리뷰 코멘트를 반영하고, 결국 PR을 머지하는 자동화입니다.optio는 바로 그 지점을 겨냥한 프로젝트입니다. 단순히 에이전트를 한 번 실행하는 도구가 아닙니다. AI 코딩 작업을 실제 소프트웨어 전달 파이프라인으로 바꾸는 시스템에 가깝습니다. 작업을 넣으면 저장소 전용 실행 환경을 만들고, Claude Code나 OpenAI Codex를 돌리고, PR을 열고, CI와 리뷰 상태를 감시하다가, 실패하면 다시 에이전트를 깨워 수정하고, 통과하면 자동으로 머지까지 진행합니다. 2026년 3월 24일 기준 0.1.0으로 공개된 초기 버전이며, 저장소는 TypeScript 기반 모노..
AI 코딩 에이전트가 좋아진다고 해서, 갑자기 덜 헤매는 건 아닙니다.오히려 더 자주 같은 실수를 반복합니다.문서에 안 적힌 API 동작, 버전 충돌, CI 설정 함정, 빌드 툴의 미묘한 차이 같은 것들을 세션마다 다시 발견하죠. 인간 개발자가 예전엔 검색으로 해결했다면, 이제는 에이전트가 매번 토큰과 시간을 태우며 같은 벽에 부딪히고 있습니다.Mozilla.ai의 Cq는 바로 이 지점을 찌릅니다. 이 프로젝트는 “AI가 코드를 더 잘 생성하게 하는 도구”라기보다, 에이전트가 이미 누군가 겪은 실패를 다시 겪지 않게 만드는 지식 공용층에 가깝습니다. 저장소의 공식 설명도 Cq를 “shared agent knowledge commons”이자 “shared agent learning을 위한 open stan..
Android는 Install Referrer, iOS는 딥링크+서버 설계로 풀어야 한다추천인 코드를 유저가 직접 입력하게 하면 전환율이 떨어집니다.가장 좋은 UX는 이겁니다.추천 링크를 누른다 → 앱을 설치한다 → 가입하면 추천인이 자동 적용된다.문제는 이 흐름이 Android와 iOS에서 같은 방식으로 동작하지 않는다는 점입니다.Android는 Google Play의 Install Referrer API가 있어서 “설치 직전 클릭 정보”를 앱이 읽을 수 있습니다. 반면 iOS는 Apple 공식 문서 기준으로 Android의 Install Referrer 같은 1:1 post-install referrer retrieval API가 보이지 않고, 공식 축은 Universal Links, campaign..
Hermes Agent (스스로 진화하는 에이전트)Hermes Agent의 핵심은 막연한 “기억하는 AI”가 아니라, 스킬 시스템, 세션 검색, 프롬프트 안정성, 다중 실행 환경, 메시징 게이트웨이, 크론 자동화, RL/trajectory 수집까지 포함한 장기 실행형 에이javaexpert.tistory.com Hermes Agent = “장기 실행 + 기억 + 스킬 축적”OpenClaw = “단일 작업을 잘 수행하는 실행형 에이전트”1. 출발점부터 다르다Hermes Agent장기 실행을 전제로 설계세션을 넘어서 계속 일함기억 + 스킬 축적운영형 시스템👉 “같이 일하는 에이전트”OpenClaw한 번의 task 수행에 집중입력 → 계획 → 실행 → 종료stateless 또는 짧은 상태👉 “작업 수행 도..
Hermes Agent의 핵심은 막연한 “기억하는 AI”가 아니라, 스킬 시스템, 세션 검색, 프롬프트 안정성, 다중 실행 환경, 메시징 게이트웨이, 크론 자동화, RL/trajectory 수집까지 포함한 장기 실행형 에이전트 플랫폼에 더 가깝습니다. 공식 README와 문서에서는 특히 skill_manage를 통한 에이전트 주도 스킬 생성, FTS5 기반 세션 검색, SQLite 기반 세션 저장, 다양한 터미널 백엔드, 메시징 플랫폼 연동, 그리고 연구용 trajectory/data generation을 주요 축으로 설명합니다. (GitHub)https://github.com/NousResearch/hermes-agent/ hermes-agent/README.md at main · NousResearc..
거대한 LLM을 보는 방식은 보통 두 가지입니다.하나는 이미 만들어진 모델을 불러와서 프롬프트를 던져보는 방식이고, 다른 하나는 **“이 모델이 실제로 어떻게 만들어지고 학습되는가”**를 끝까지 따라가 보는 방식입니다.MiniMind는 분명히 두 번째를 겨냥한 프로젝트입니다.이 저장소의 핵심 가치는 “작은 모델” 그 자체보다, LLM의 전체 생애주기—토크나이저, 프리트레인, SFT, LoRA, DPO, PPO/GRPO/SPO, 증류, OpenAI 호환 서빙—를 PyTorch 중심의 비교적 투명한 코드로 한 번에 보여준다는 데 있습니다. 게다가 가장 작은 모델은 26M 규모로, 개인 GPU에서도 실험 가능한 수준을 목표로 합니다. (GitHub) GitHub - jingyaogong/minimind: ?..
