목록AI (227)
오늘도 공부
AI 코딩 에이전트가 좋아졌다고 해서, 바로 팀으로 일도 잘하는 것은 아닙니다.오히려 실무에서는 더 어려운 문제가 남습니다.“어떤 역할로 에이전트를 나눌지”, “어떤 순서로 협업시킬지”, “각 에이전트에게 어떤 스킬을 줘야 할지”, “정말 이 구성이 성능을 높였는지 어떻게 검증할지” 같은 문제입니다. Harness는 바로 이 지점에 들어옵니다. 이 프로젝트는 새로운 에이전트 런타임을 만드는 도구가 아니라, 도메인별 에이전트 팀과 스킬을 설계·생성하는 메타 스킬로 설계되어 있습니다. Claude Code 안에서 “이 프로젝트용 하네스를 만들어줘”라고 말하면, .claude/agents/와 .claude/skills/ 구조를 자동으로 만들어 주는 식입니다. (GitHub) GitHub - revfactor..
AI 코딩 에이전트가 점점 똑똑해지면서, 이제 문제는 “에이전트가 코드를 잘 짜는가”가 아니라 “그 에이전트를 팀 안에서 어떻게 운영할 것인가”로 넘어가고 있습니다. 채팅창에서 한 번 요청하고 끝나는 수준이 아니라, 이슈를 받고, 상태를 바꾸고, 댓글을 남기고, 실제 로컬 코드베이스에서 작업까지 수행하는 존재로 다뤄야 하기 때문입니다. Multica는 바로 그 지점을 겨냥합니다. 이 프로젝트는 AI를 보조 도구가 아니라 프로젝트 관리 시스템의 정식 팀원으로 끌어올리려는 시도입니다. (GitHub) multica/README.md at main · multica-ai/multicaContribute to multica-ai/multica development by creating an account on..
LLM이 텍스트를 범용적으로 다루기 시작한 뒤, 개발자들은 자연스럽게 같은 질문을 던지게 됐습니다. “시계열에도 GPT 같은 기반 모델이 가능할까?” TimesFM은 그 질문에 꽤 실용적인 답을 내놓은 프로젝트입니다. 전통적인 예측 모델처럼 데이터셋마다 새로 학습시키는 대신, 이미 사전학습된 시계열 파운데이션 모델을 가져와 바로 예측에 쓰는 흐름을 보여줍니다. (GitHub)이 저장소는 Google Research가 공개한 시계열 예측용 오픈소스 구현체입니다. 최신 공개 버전 기준으로 TimesFM 2.5를 중심으로 하고 있고, PyTorch와 Flax 백엔드를 모두 염두에 둔 구조를 가지며, Hugging Face에서 사전학습 체크포인트를 불러와 추론하는 방식으로 사용됩니다. 저장소 README는 이것..
오디오 생성은 이미지 생성보다 훨씬 까다롭습니다.이미지는 한 번에 2D 공간을 보면 되지만, 오디오는 아주 긴 시간축, 미세한 파형 변화, 장기 구조, 샘플레이트 변환, 텍스트 조건부 생성까지 한꺼번에 해결해야 합니다. 그래서 많은 프로젝트가 특정 태스크 하나에만 집중합니다.그런데 audio-diffusion-pytorch는 조금 다르게 접근합니다.이 프로젝트는 “텍스트로 음악 만들기” 같은 데모용 모델 하나를 내놓는 대신, 오디오 생성 실험에 필요한 공통 부품을 라이브러리 형태로 정리해 둡니다. 무조건 생성기만 있는 것이 아니라, 무조건 생성, 텍스트 조건부 생성, 업샘플링, 보코더, 오토인코더, 인페인팅까지 하나의 PyTorch 인터페이스로 묶어 둔 점이 이 프로젝트의 핵심입니다. (GitHub) ..
AI 코딩 에이전트 시대에 더 무서운 변화는 “새 기능을 빨리 붙이는 것”이 아닙니다.진짜 변화는 오래된 소프트웨어의 설계 한계를 더 이상 존중하지 않아도 된다는 데 있습니다.Cloudflare의 EmDash가 흥미로운 이유가 바로 여기 있습니다. WordPress는 여전히 웹의 거대한 비중을 차지합니다. 2026년 4월 기준 W3Techs 통계에서 WordPress는 전체 웹사이트의 약 43%대, 알려진 CMS 중 약 60% 안팎을 차지합니다. 그런데 그 성공의 대가로, 플러그인과 테마가 코어와 너무 깊게 얽힌 구조도 함께 굳어졌습니다. EmDash는 이 문제를 “운영 잘하자” 수준으로 덮지 않고, 애초에 플러그인이 위험해질 수밖에 없는 실행 모델 자체를 폐기합니다. (W3Techs)이 프로젝트가 왜 ..
@mariozechner/pi-coding-agent가 제공하는 pi CLI는 확장(extensions) 으로 동작을 바꿀 수 있습니다. 서드파티 패키지 pi-subagents 도 “npm 패키지 + package.json의 pi 메타데이터 + ExtensionAPI” 조합으로 구현된 확장입니다.이 문서는 확장이 무엇인지, 파일·패키지 구조, pi-subagents가 하는 방식, SDK에 끼워 넣는 방법까지 한 번에 정리합니다.공식 세부 스펙은 upstream pi-mono 의 extensions.md · packages.md 를 함께 보세요.1. 확장이란 무엇인가TypeScript 모듈 하나(또는 디렉터리의 index.ts)가 기본 내보내기(default export) 로 함수를 내보냅니다.그 함수는 ..
https://9to5mac.com/2026/03/30/apple-steps-up-crackdown-on-vibe-coding-apps-pulls-anything-from-the-app-store/ Apple pulls vibe coding app ‘Anything’ from the App Store - 9to5MacApple pulled vibe coding app ‘Anything’ from the App Store last week, citing a self-containment rule from its App Review Guidelines.9to5mac.com 1️⃣ 공식 이유: App Store 구조 자체를 깨기 때문애플이 근거로 든 건 App Review Guideline 2.5.2입니다.“..
4.1일자 추가 ComfyUI SeeThrough 가 오픈소스로 나옴SeeThrough 프로젝트를 ComfyUI로 이식한 버전입니다. 단일 2D 캐릭터 이미지를 눈, 머리카락, 팔다리 등 개별 구성 요소로 분할하여, Live2D 리그를 위한 단일 이미지 분해를 가능하게 합니다. https://github.com/jtydhr88/ComfyUI-See-through정적인 2D 캐릭터를 움직이게 만드는 일은 생각보다 “애니메이션”보다 먼저 “노가다”가 시작됩니다. 머리카락을 따고, 옷을 나누고, 팔 뒤에 가려진 몸통을 상상해서 메우고, 장신구가 어디 앞에 와야 하는지 다시 정리해야 하죠. 문제는 이 과정이 창의적인 작업이라기보다, 숙련된 사람이 오래 붙잡고 있어야 하는 반복 노동에 가깝다는 점입니다.See-t..
같은 사용자명이 여러 플랫폼에서 반복해서 쓰이는 시대다.문제는 “그 이름이 어디에 존재하는가”를 찾는 일이 생각보다 훨씬 비효율적이라는 데 있다.브라우저 탭을 수십 개 띄우고, 검색엔진을 돌리고, 플랫폼별 URL 규칙을 외우는 방식은 OSINT 작업이 아니라 사실상 수작업에 가깝다. Sherlock은 바로 이 지점을 정면으로 건드린다. 하나의 username을 넣으면 수백 개 사이트에 대해 병렬로 존재 여부를 확인하고, 결과를 텍스트·CSV·XLSX로 떨어뜨리는 도구다. 단순해 보이지만, 내부를 열어보면 “사이트별 판별 규칙을 데이터로 관리하고, 실행 엔진은 범용으로 유지하는” 꽤 좋은 아키텍처를 가지고 있다. (GitHub) GitHub - sherlock-project/sherlock: Hunt do..
AI 에이전트가 코드를 생성하는 단계를 넘어, 이제는 실제 화면을 보고 버튼을 누르고 텍스트를 입력하는 단계로 넘어가고 있습니다. 문제는 여기서부터입니다. 브라우저 자동화만으로는 부족하고, 운영체제마다 입력 이벤트 처리 방식도 다르고, 화면 좌표와 해상도 이슈도 제각각입니다. “컴퓨터를 쓰는 에이전트”를 만들고 싶다면 모델보다 먼저 인프라가 필요해집니다.Cua는 바로 그 지점을 파고드는 프로젝트입니다. 단순한 GUI 자동화 스크립트가 아니라, AI 에이전트가 macOS, Linux, Windows, Android 환경을 같은 인터페이스로 다룰 수 있게 만드는 오픈소스 인프라입니다. 저장소 기준으로 약 13.3K 스타를 기록하고 있고, 조직 설명도 “Computer-Use Agents를 위한 오픈소스 인프..
AI 에이전트와 로컬 툴링이 늘어나면서, 개발자들은 점점 더 자주 이런 선택지 앞에 섭니다. “그냥 SQLite 붙일까?”, “Mongo 띄울까?”, “아니면 JSON 파일로 버틸까?” 그런데 이 셋 사이 어딘가를 정확히 노린 프로젝트가 하나 있습니다. 서버 없이, 런타임 의존성 없이, Node.js 프로젝트 안에서 바로 쓰는 문서형 DB. AgentDB는 바로 그 지점을 겨냥합니다. (GitHub)이 저장소를 자세히 보면, 단순히 “작은 DB 하나 만들었다” 수준이 아닙니다. 작성자는 바이너리 파일 포맷, 레코드 단위 AES-256-GCM 암호화, WAL 기반 크래시 복구, CRC32 무결성 검증, 필드 인덱스, TTL, 스키마 검증, 백업/복구, 마이그레이션까지 직접 구현했습니다. 그리고 이 모든 걸..
“코딩 도구”에서 “자율 개발 플랫폼”으로 진화하는 법많은 개발자들이 Claude Code를 단순한 “코딩 보조 CLI”로 사용하고 있습니다.하지만 실제로는 그 위에 훨씬 더 큰 레이어가 있습니다.Claude Code는코드를 작성하는 도구가 아니라,개발을 대신 수행하는 시스템입니다.이번 글에서는Claude Code 창시자 **Boris Cherny**가 공개한15가지 핵심 기능을 단순 기능 나열이 아니라👉 “개발 패러다임이 어떻게 바뀌는지” 중심으로 설명합니다.🧠 핵심 철학 (이 글의 요약)이 15개 기능을 관통하는 한 문장:“개발자가 하던 일을 시스템에 위임하라”1️⃣ 개발 환경의 해방(Device → Context 중심으로 이동)✔ 모바일에서 코딩iOS / Android 앱에서 바로 코드 작업 가..
AI 에이전트 시대가 오면서, 이제 문제는 “에이전트를 만들 수 있느냐”가 아닙니다.진짜 어려운 문제는 그 다음입니다. 누가 설정을 바꾸고, 어떤 도구를 붙이고, 여러 에이전트를 어떻게 운영하느냐죠.LangChain이 공개했던 Open Agent Platform은 바로 이 지점을 겨냥했습니다. 에이전트를 코드 덩어리가 아니라 운영 가능한 제품 단위로 다루게 만든 플랫폼입니다. 다만 지금 이 프로젝트를 볼 때 꼭 알아야 할 점이 하나 있습니다. 이 저장소는 2026년 2월 25일에 아카이브되었고, README에서도 deprecated 상태라고 명시하며 현재는 LangSmith의 Agent Builder 사용을 권장하고 있습니다. 즉, OAP는 “지금 당장 도입할 최신 메인 제품”이라기보다, LangChai..
AI 에이전트가 숫자를 읽고, 분석가가 대시보드를 만들고, 퀀트가 파이썬 코드로 시계열 데이터를 다루는 시대다. 문제는 늘 같다. 데이터는 많지만 인터페이스가 제각각이라는 점이다. 공급자마다 인증 방식이 다르고, 응답 스키마가 다르고, 심지어 같은 “주가 히스토리”도 필드 이름과 파라미터가 다르다. OpenBB는 이 지점을 정면으로 겨냥한다. 이 프로젝트는 단순한 금융 라이브러리가 아니라, 금융 데이터를 한 번 연결해서 여러 실행 표면에서 재사용하게 만드는 데이터 플랫폼으로 진화했다. (GitHub)예전에는 OpenBB를 “오픈소스 금융 터미널” 정도로 이해해도 크게 틀리지 않았다. 하지만 지금의 저장소를 보면 방향이 훨씬 분명하다. OpenBB가 강조하는 것은 터미널 UI가 아니라 Open Data P..
AI Agent가 코드를 짜고, 문서를 읽고, 실험을 돌리는 시대가 왔습니다. 그런데 막상 복잡한 일을 맡겨보면 금방 한계가 드러납니다. 에이전트 하나는 똑똑할 수 있어도, 큰 작업을 병렬로 쪼개고, 서로 결과를 주고받고, 충돌 없이 합치고, 다시 우선순위를 바꾸는 일까지 잘하진 못합니다. 결국 사람 개발자가 “매니저” 역할을 하게 됩니다. (GitHub)ClawTeam은 바로 그 지점을 겨냥한 프로젝트입니다. 저장소 설명 그대로, 이 프로젝트는 framework-agnostic한 멀티 에이전트 coordination CLI이고, 에이전트가 다른 에이전트를 spawn하고, task를 나누고, inbox로 메시지를 주고받고, git worktree로 각자 격리된 작업 공간에서 일하게 만듭니다. 즉 “에이전..
1️⃣ 핵심 문제 정의: 왜 캐릭터가 계속 바뀌는가AI는 확률 기반 생성 (seed 랜덤성) → 동일 프롬프트라도 결과 달라짐"은발 남자" → 매번 다른 얼굴 생성됨👉 즉AI는 ‘캐릭터’를 인식하지 않고 ‘조건 조합’을 생성한다2️⃣ 캐릭터 일관성의 3대 원칙✔ 1. 구체성vague ❌ → "handsome man"구체 ✔ → 이름 + 디테일 조합👉 핵심:이름 + 머리 + 눈 + 얼굴 특징 + 액세서리✔ 2. 반복동일 속성 반복 → AI가 “하나의 개체”로 인식👉 사실상:반복 = identity 학습✔ 3. 참조 이미지텍스트보다 훨씬 강력캐릭터 고정의 핵심 무기3️⃣ 일관성 달성 수준 (현실 기준)방법일관성프롬프트만60~70%참조 이미지75~85%Face Embedding85~92%LoRA90~97..
AI 에이전트가 코드를 고치는 시대는 이미 시작됐습니다. 그런데 진짜 재미있는 지점은 “코드를 한 번 생성하는 것”이 아니라, 측정 가능한 목표를 놓고 수십 번 실험하며 스스로 더 나은 방향을 찾게 만드는 것입니다. pi-autoresearch는 바로 그 지점을 정면으로 겨냥한 프로젝트입니다. 터미널에서 동작하는 AI 코딩 에이전트 pi 위에 얹혀, 아이디어를 시도하고, 벤치마크를 돌리고, 개선만 남기고, 퇴행은 되돌리는 루프를 자동화합니다. (GitHub) GitHub - davebcn87/pi-autoresearch: Autonomous experiment loop extension for piAutonomous experiment loop extension for pi. Contribute to ..
Claude-4.6 Opus 상호작용에서 얻은 최첨단 사고 연쇄(Chain-of-Thought, CoT) 추출 기술에 대해 알아보자.CoT는 Chain of Thought의 약자이고, 한국어로는 보통 사고의 연쇄, 생각의 흐름, 단계적 추론 과정 정도로 말합니다.쉽게 말하면, AI가 답만 바로 내놓는 게 아니라왜 그런 답이 나왔는지 중간 사고 단계를 따라가며 푸는 방식 입니다.예를 들어 볼게요.질문:“사과가 3개 있고 2개를 더 사면 몇 개예요?”일반 답변은 그냥:“5개입니다.”CoT 방식은:“처음에 3개가 있고, 2개를 더 샀으니 3+2를 계산하면 5입니다.”즉, 정답만 말하는 것이 아니라 그 정답에 도달하는 과정까지 풀어서 보여주는 것이 CoT입니다.왜 중요하냐CoT가 중요한 이유는, AI가 복잡한 ..
AI 음성 전사는 이제 “된다”의 문제가 아니라 “얼마나 빨리, 얼마나 실용적으로, 얼마나 쉽게 붙일 수 있느냐”의 문제로 넘어왔습니다.insanely-fast-whisper는 바로 그 지점을 찌르는 프로젝트입니다. Whisper를 단순히 잘 돌리는 수준이 아니라, GPU 배치 처리와 최신 attention 구현을 활용해 긴 오디오도 매우 빠르게 전사할 수 있는 형태로 밀어붙였습니다. README에서는 A100 80GB 기준으로 150분 오디오를 Whisper Large v3 + Flash Attention 2 조합으로 98초 안에 처리했다고 소개합니다. (GitHub)이 프로젝트가 흥미로운 이유는 단순합니다.많은 개발자가 Whisper를 좋아하지만, 실제 서비스나 내부 툴에 붙이려는 순간 설치, GPU..
AI 에이전트가 UI를 만들고 나서 “완료했습니다”라고 말하는 순간이 있다. 그런데 정작 개발자가 받는 건 코드 diff와 말뿐이다. 화면이 진짜 떴는지, 버튼이 눌리는지, 콘솔 에러가 없는지, 데모 영상 하나 없이 끝나는 경우가 많다. ProofShot은 바로 그 지점을 찌른다. 이 프로젝트는 AI 코딩 에이전트가 기능을 만든 뒤 실제 브라우저 세션을 녹화하고, 스크린샷과 로그까지 묶어서 사람이 검토할 수 있는 “시각적 증거”를 남기는 CLI다. (GitHub)핵심은 “에이전트가 UI를 만들 수 있느냐”가 아니라 “에이전트가 만든 결과를 사람이 빠르게 믿을 수 있느냐”다. ProofShot은 Claude Code, Cursor, Codex, Gemini CLI, Windsurf처럼 셸 명령을 실행할 수..
AI 시대의 개발팀은 더 이상 “이벤트 수집 도구” 하나만으로 제품을 운영하지 않습니다. 사용자 행동을 보고, 기능을 점진 배포하고, 실험하고, 세션 리플레이로 문제를 재현하고, 필요하면 SQL로 바로 파고들어야 합니다. PostHog가 흥미로운 이유는 이 흐름을 각각의 SaaS로 쪼개지 않고, 하나의 오픈소스 코드베이스 안에서 통합하려 한다는 점입니다. 저장소를 자세히 들여다보면, 이 프로젝트는 단순한 프로덕트 애널리틱스가 아니라 “개발팀용 제품 운영 OS”에 가깝습니다. (GitHub) GitHub - PostHog/posthog: 🦔 PostHog is an all-in-one developer platform for building successful products. We offer prod..
AI Agent를 만들기 시작하면 금방 비슷한 벽에 부딪힙니다.“툴 호출은 되는데 구조가 금방 꼬인다”, “멀티 에이전트 데모는 되는데 운영 환경으로 옮기기 어렵다”, “메모리, 추적, 평가를 붙이려니 프레임워크 바깥 일이 더 많다.”AgentScope는 바로 그 지점에서 등장한 프로젝트입니다. 단순히 “에이전트를 하나 띄우는 라이브러리”가 아니라, ReAct 에이전트, 툴, 메모리, MCP, A2A, RAG, tracing, evaluation, realtime voice까지 하나의 개발 경험으로 묶으려는 방향이 매우 분명합니다. 저장소 README는 AgentScope를 “production-ready, easy-to-use agent framework”로 소개하고, 실제 패키지 구조도 agent, ..
AI 에이전트가 코드를 짜고 문서를 읽고 웹을 탐색하는 시대다. 그런데 투자 리서치나 기업 분석처럼 데이터 정확성, 툴 선택, 반복 검증이 특히 중요한 문제에서는 “그럴듯하게 답하는 LLM”만으로는 부족하다. Dexter는 바로 그 지점을 겨냥한다. 이 프로젝트는 범용 챗봇이 아니라, 복잡한 금융 질문을 단계별 조사 계획으로 쪼개고, 실시간 데이터와 문서를 수집하고, 자기 결과를 다시 점검하면서 답을 완성하는 금융 특화 에이전트다. (GitHub)저장소 첫 문장도 이 성격을 아주 선명하게 보여준다. Dexter는 “deep financial research”를 위한 autonomous agent로 소개되며, 실제로 코드 구조를 보면 CLI 중심 실행기, 금융 툴 레지스트리, 메모리 계층, 승인 기반 파일..
AI 에이전트 시대에 새로 생긴 문제는 “모델이 똑똑하냐”가 아닙니다. 같은 스킬이 10번 중 몇 번이나 안정적으로 잘 동작하느냐입니다.많은 팀이 Claude Skills, 시스템 프롬프트, 내부 에이전트 워크플로를 잘 만들어 놓고도 중요한 사실을 놓칩니다. 한두 번 잘 돌아간다고 해서, 그 스킬이 운영 가능한 수준으로 안정화된 것은 아니라는 점입니다. 실제로 Ole Lehmann은 이 문제를 정면으로 다뤘습니다. 그가 적용한 방식은 Andrej Karpathy가 공개한 autoresearch 아이디어를 Claude Skills 개선 루프로 옮겨온 것이었고, 랜딩 페이지 카피 스킬의 품질 체크 통과율을 56%에서 92%까지 끌어올렸습니다. 사람이 프롬프트를 손으로 뜯어고친 것이 아니라, 에이전트가 스스로..
Anthropic이 2025년에 공개한 회로 추적 연구로 본 LLM 내부 동작의 실제 모습AI 모델이 점점 더 똑똑해질수록, 개발자에게 더 불편한 질문 하나가 남습니다.모델은 왜 그런 답을 냈는가?지금까지 우리는 프롬프트를 넣고 결과를 받는 방식으로 LLM을 써 왔습니다. 잘 맞으면 “추론을 잘하네”라고 말했고, 틀리면 “환각했네”라고 말했습니다. 하지만 그 사이, 즉 입력에서 출력까지 모델 내부에서 무슨 계산이 일어났는지는 거의 알지 못했습니다. Anthropic은 바로 그 지점을 건드렸습니다. 2025년 3월 공개한 연구에서 이들은 Claude 3.5 Haiku의 내부 계산을 추적하는 “회로 추적” 방법을 제안했고, 시 쓰기, 다국어 처리, 산수, 환각, 탈옥 프롬프트, chain-of-thought..
AI가 코드를 써주는 시대는 이미 왔습니다.그런데 팀에 바로 도움이 되는 건 “코드 생성”이 아니라, 실패한 CI를 다시 고치고, 리뷰 코멘트를 반영하고, 결국 PR을 머지하는 자동화입니다.optio는 바로 그 지점을 겨냥한 프로젝트입니다. 단순히 에이전트를 한 번 실행하는 도구가 아닙니다. AI 코딩 작업을 실제 소프트웨어 전달 파이프라인으로 바꾸는 시스템에 가깝습니다. 작업을 넣으면 저장소 전용 실행 환경을 만들고, Claude Code나 OpenAI Codex를 돌리고, PR을 열고, CI와 리뷰 상태를 감시하다가, 실패하면 다시 에이전트를 깨워 수정하고, 통과하면 자동으로 머지까지 진행합니다. 2026년 3월 24일 기준 0.1.0으로 공개된 초기 버전이며, 저장소는 TypeScript 기반 모노..
AI 코딩 에이전트가 좋아진다고 해서, 갑자기 덜 헤매는 건 아닙니다.오히려 더 자주 같은 실수를 반복합니다.문서에 안 적힌 API 동작, 버전 충돌, CI 설정 함정, 빌드 툴의 미묘한 차이 같은 것들을 세션마다 다시 발견하죠. 인간 개발자가 예전엔 검색으로 해결했다면, 이제는 에이전트가 매번 토큰과 시간을 태우며 같은 벽에 부딪히고 있습니다.Mozilla.ai의 Cq는 바로 이 지점을 찌릅니다. 이 프로젝트는 “AI가 코드를 더 잘 생성하게 하는 도구”라기보다, 에이전트가 이미 누군가 겪은 실패를 다시 겪지 않게 만드는 지식 공용층에 가깝습니다. 저장소의 공식 설명도 Cq를 “shared agent knowledge commons”이자 “shared agent learning을 위한 open stan..
Hermes Agent (스스로 진화하는 에이전트)Hermes Agent의 핵심은 막연한 “기억하는 AI”가 아니라, 스킬 시스템, 세션 검색, 프롬프트 안정성, 다중 실행 환경, 메시징 게이트웨이, 크론 자동화, RL/trajectory 수집까지 포함한 장기 실행형 에이javaexpert.tistory.com Hermes Agent = “장기 실행 + 기억 + 스킬 축적”OpenClaw = “단일 작업을 잘 수행하는 실행형 에이전트”1. 출발점부터 다르다Hermes Agent장기 실행을 전제로 설계세션을 넘어서 계속 일함기억 + 스킬 축적운영형 시스템👉 “같이 일하는 에이전트”OpenClaw한 번의 task 수행에 집중입력 → 계획 → 실행 → 종료stateless 또는 짧은 상태👉 “작업 수행 도..
Hermes Agent의 핵심은 막연한 “기억하는 AI”가 아니라, 스킬 시스템, 세션 검색, 프롬프트 안정성, 다중 실행 환경, 메시징 게이트웨이, 크론 자동화, RL/trajectory 수집까지 포함한 장기 실행형 에이전트 플랫폼에 더 가깝습니다. 공식 README와 문서에서는 특히 skill_manage를 통한 에이전트 주도 스킬 생성, FTS5 기반 세션 검색, SQLite 기반 세션 저장, 다양한 터미널 백엔드, 메시징 플랫폼 연동, 그리고 연구용 trajectory/data generation을 주요 축으로 설명합니다. (GitHub)https://github.com/NousResearch/hermes-agent/ hermes-agent/README.md at main · NousResearc..
거대한 LLM을 보는 방식은 보통 두 가지입니다.하나는 이미 만들어진 모델을 불러와서 프롬프트를 던져보는 방식이고, 다른 하나는 **“이 모델이 실제로 어떻게 만들어지고 학습되는가”**를 끝까지 따라가 보는 방식입니다.MiniMind는 분명히 두 번째를 겨냥한 프로젝트입니다.이 저장소의 핵심 가치는 “작은 모델” 그 자체보다, LLM의 전체 생애주기—토크나이저, 프리트레인, SFT, LoRA, DPO, PPO/GRPO/SPO, 증류, OpenAI 호환 서빙—를 PyTorch 중심의 비교적 투명한 코드로 한 번에 보여준다는 데 있습니다. 게다가 가장 작은 모델은 26M 규모로, 개인 GPU에서도 실험 가능한 수준을 목표로 합니다. (GitHub) GitHub - jingyaogong/minimind: ?..
