목록전체 글 (1727)
오늘도 공부
AI 에이전트가 브라우저와 코드 실행 환경을 다루는 시대를 지나, 이제는 카메라·라이다·모터·드론까지 다루려는 오픈소스가 나오고 있습니다. DimOS는 바로 그 지점에서 등장한 프로젝트입니다. 단순히 “로봇 제어 라이브러리” 하나를 더 만든 것이 아니라, 로봇을 에이전트가 실행 가능한 소프트웨어 플랫폼으로 재정의하려는 시도에 가깝습니다. 자연어로 명령하고, 여러 하드웨어를 같은 추상화로 다루고, 센서 입력부터 제어 루프까지 하나의 실행 모델 안에 넣겠다는 발상입니다. (GitHub) GitHub - dimensionalOS/dimos: Dimensional is the agentic operating system for physical space. Vibecode humanoids, quadrupeds..
https://github.com/hesamsheikh/awesome-openclaw-usecases1. Social Media / 정보 수집1️⃣ Daily Reddit Digest설명사용자가 지정한 subreddit을 모니터링인기 글을 요약해 매일 전달관심 주제 커뮤니티를 자동 큐레이션핵심→ Reddit 자동 뉴스레터2️⃣ Daily YouTube Digest설명구독 채널의 새 영상 탐색영상 요약 생성매일 요약 리포트 제공핵심→ 유튜브 콘텐츠 요약 봇3️⃣ X Account Analysis설명특정 X(Twitter) 계정을 분석활동 패턴 / 콘텐츠 스타일 / 영향력 평가전략적인 SNS 분석 리포트 생성핵심→ SNS 계정 분석 AI4️⃣ Multi-Source Tech News Digest설명RSS /..
AI 에이전트가 하나일 때는 터미널 하나로도 충분합니다.하지만 에이전트가 여러 개가 되고, 작업이 끊임없이 생성되고, 누가 어떤 일을 하고 있는지 추적해야 하는 순간부터 문제는 완전히 달라집니다.mission-control은 바로 그 지점에서 등장한 프로젝트입니다. 단순히 “에이전트를 실행하는 도구”가 아니라, 에이전트 운영 자체를 눈에 보이게 만드는 대시보드입니다. 작업 생성, 계획 수립, 에이전트 할당, 실행, 결과물 추적까지 한 화면에서 이어 붙이려는 시도가 이 프로젝트의 핵심입니다. 저장소 설명 기준으로 이 프로젝트는 OpenClaw Gateway를 통해 AI 에이전트를 관리하고, 작업을 배정하고, 멀티 에이전트 협업을 조율하는 오케스트레이션 대시보드입니다. 또한 2026년 3월 13일 기준 최신..
AI Agent를 만들다 보면 어느 순간 이런 벽에 부딪힙니다.대화 기록은 메모리 시스템에 들어가 있고, 문서는 벡터 DB에 들어가 있고, 툴 설명은 프롬프트 어딘가에 붙어 있고, 세션 상태는 또 별도 저장소에 흩어져 있습니다.Agent가 똑똑해질수록 정작 개발자는 “이 Agent가 지금 무엇을 알고 있고, 왜 그걸 꺼냈는지”를 설명하기 어려워집니다.OpenViking은 바로 이 지점을 정면으로 겨냥한 프로젝트입니다.이 프로젝트는 단순한 벡터 검색 라이브러리가 아닙니다. OpenViking은 AI Agent가 사용하는 모든 컨텍스트를 파일시스템처럼 구조화해서 관리하자는 관점에서 출발한, 꽤 야심찬 Agent-native context database입니다. ByteDance의 Volcengine Viki..
AI에게 일을 맡기려면 지금까지는 보통 이렇게 했다.프롬프트를 정교하게 작성하거나API를 연결하거나자동화 스크립트를 만들거나하지만 최근 등장한 한 프로젝트는 이 흐름을 완전히 뒤집는다.“설명하지 말고 그냥 보여줘.”최근 Hacker News에 올라와 화제가 된 Understudy라는 오픈소스 프로젝트는사용자가 컴퓨터에서 작업을 한 번 수행하는 것을 보여주면,AI가 그 과정을 학습해 앞으로 그 작업을 대신 수행하는 데스크탑 에이전트를 만든다.프롬프트도 필요 없다.API도 필요 없다.워크플로우 빌더도 필요 없다.그냥 **“한 번 시연하면 끝”**이다.이 글에서는 Understudy가 어떤 프로젝트인지,왜 등장했는지, 그리고 내부적으로 어떻게 동작하는지 개발자 관점에서 분석해본다. GitHub - under..
AI 음성 합성(TTS)은 이미 많은 서비스에서 사용되고 있다.하지만 대부분의 고품질 음성 모델은 폐쇄형 API에 의존한다.OpenAIElevenLabsGoogle TTS이런 서비스들은 뛰어난 성능을 제공하지만 커스터마이징이 어렵고 비용이 발생한다.그렇다면 질문이 하나 생긴다.“LLM처럼 강력한 음성 생성 모델을 오픈소스로 만들 수는 없을까?”바로 이 질문에서 등장한 프로젝트가 있다.Fish Speech최근 AI 음성 생태계에서 빠르게 주목받고 있는완전 오픈소스 기반의 고품질 음성 생성 모델이다.이 글에서는 Fish Speech가 무엇인지,왜 등장했는지, 그리고 개발자가 어떻게 활용할 수 있는지 아키텍처 중심으로 분석해보자. GitHub - fishaudio/fish-speech: SOTA Open S..
GitHub의 AstrBotDevs/AstrBot를 자세히 보면, AstrBot은 단순한 “챗봇 하나”라기보다 여러 메신저 플랫폼, 여러 LLM 제공자, 플러그인 시스템, 지식베이스, Agent 실행 계층을 하나로 묶은 통합형 AI 챗봇 인프라에 가깝습니다. 공식 설명도 “주요 IM 플랫폼과 통합되는 오픈소스 올인원 Agent 챗봇 플랫폼”이며, 개인용 AI 비서부터 고객지원, 업무 자동화, 사내 지식베이스까지 다양한 시나리오를 겨냥하고 있습니다. 문서와 저장소를 함께 보면 이 프로젝트는 AstrBotDevs 조직과 전 세계 오픈소스 기여자들이 유지하는 비영리 성격의 프로젝트이며, 라이선스는 AGPL-v3입니다. 또 네트워크 서비스 형태로 수정본을 제공하면 변경사항 공개 의무가 생긴다는 점이 문서에 명시..
AI 코딩 에이전트가 점점 강력해지면서 **“AI가 실제 개발 업무를 끝까지 수행하게 만들 수 있을까?”**라는 질문이 자연스럽게 등장했습니다.최근 등장한 Hatice는 바로 이 문제를 해결하기 위한 프로젝트입니다.이 글에서는 GitHub 프로젝트 Hatice가 무엇인지, 왜 등장했는지, 그리고 어떤 구조로 동작하는지 개발자 관점에서 살펴보겠습니다. GitHub - mksglu/hatice: Hatice is an autonomous coding agent orchestration system.Hatice is an autonomous coding agent orchestration system. - mksglu/haticegithub.com 프로젝트 소개Hatice는 GitHub Issues나 Lin..
Google이 Android를 AI 에이전트 중심 OS로 발전시키기 위한 새로운 접근을 발표했습니다. 핵심은 AppFunctions라는 기능으로, 앱의 특정 기능을 AI 에이전트가 직접 호출할 수 있도록 표준화하는 프레임워크입니다. (Android Developers Blog)이 개념은 최근 AI 생태계에서 많이 언급되는 MCP(Model Context Protocol)와 매우 유사합니다. 다만 MCP가 서버 기반 도구 연결을 표준화한다면, AppFunctions는 모바일 앱 내부 기능을 AI에게 노출하는 방식이라고 볼 수 있습니다. (Android Developers)이 글에서는 Google이 발표한 Android의 “Intelligent OS” 전략과 AppFunctions가 무엇인지, 그리고 개발자..
promptfoo는 LLM 애플리케이션을 위한 평가(eval), 레드팀(red teaming), 취약점 스캐닝, CI/CD 자동화를 한데 묶은 오픈소스 CLI이자 라이브러리입니다. 저장소 README와 공식 문서는 이 프로젝트를 “프롬프트, 모델, RAG, 에이전트를 시험하고 보안 점검하는 도구”로 설명하고 있습니다. GitHub 기준으로 저장소는 2026년 3월 9일 기준 최신 릴리스가 0.121.1이고, 약 11.8k 스타를 보유하고 있습니다. (GitHub) promptfoo/README.md at main · promptfoo/promptfooTest your prompts, agents, and RAGs. AI Red teaming, pentesting, and vulnerability sca..
