목록전체 글 (1582)
오늘도 공부
AI 음성 합성(TTS)은 이미 많은 서비스에서 사용되고 있다.하지만 대부분의 고품질 음성 모델은 폐쇄형 API에 의존한다.OpenAIElevenLabsGoogle TTS이런 서비스들은 뛰어난 성능을 제공하지만 커스터마이징이 어렵고 비용이 발생한다.그렇다면 질문이 하나 생긴다.“LLM처럼 강력한 음성 생성 모델을 오픈소스로 만들 수는 없을까?”바로 이 질문에서 등장한 프로젝트가 있다.Fish Speech최근 AI 음성 생태계에서 빠르게 주목받고 있는완전 오픈소스 기반의 고품질 음성 생성 모델이다.이 글에서는 Fish Speech가 무엇인지,왜 등장했는지, 그리고 개발자가 어떻게 활용할 수 있는지 아키텍처 중심으로 분석해보자. GitHub - fishaudio/fish-speech: SOTA Open S..
GitHub의 AstrBotDevs/AstrBot를 자세히 보면, AstrBot은 단순한 “챗봇 하나”라기보다 여러 메신저 플랫폼, 여러 LLM 제공자, 플러그인 시스템, 지식베이스, Agent 실행 계층을 하나로 묶은 통합형 AI 챗봇 인프라에 가깝습니다. 공식 설명도 “주요 IM 플랫폼과 통합되는 오픈소스 올인원 Agent 챗봇 플랫폼”이며, 개인용 AI 비서부터 고객지원, 업무 자동화, 사내 지식베이스까지 다양한 시나리오를 겨냥하고 있습니다. 문서와 저장소를 함께 보면 이 프로젝트는 AstrBotDevs 조직과 전 세계 오픈소스 기여자들이 유지하는 비영리 성격의 프로젝트이며, 라이선스는 AGPL-v3입니다. 또 네트워크 서비스 형태로 수정본을 제공하면 변경사항 공개 의무가 생긴다는 점이 문서에 명시..
AI 코딩 에이전트가 점점 강력해지면서 **“AI가 실제 개발 업무를 끝까지 수행하게 만들 수 있을까?”**라는 질문이 자연스럽게 등장했습니다.최근 등장한 Hatice는 바로 이 문제를 해결하기 위한 프로젝트입니다.이 글에서는 GitHub 프로젝트 Hatice가 무엇인지, 왜 등장했는지, 그리고 어떤 구조로 동작하는지 개발자 관점에서 살펴보겠습니다. GitHub - mksglu/hatice: Hatice is an autonomous coding agent orchestration system.Hatice is an autonomous coding agent orchestration system. - mksglu/haticegithub.com 프로젝트 소개Hatice는 GitHub Issues나 Lin..
Google이 Android를 AI 에이전트 중심 OS로 발전시키기 위한 새로운 접근을 발표했습니다. 핵심은 AppFunctions라는 기능으로, 앱의 특정 기능을 AI 에이전트가 직접 호출할 수 있도록 표준화하는 프레임워크입니다. (Android Developers Blog)이 개념은 최근 AI 생태계에서 많이 언급되는 MCP(Model Context Protocol)와 매우 유사합니다. 다만 MCP가 서버 기반 도구 연결을 표준화한다면, AppFunctions는 모바일 앱 내부 기능을 AI에게 노출하는 방식이라고 볼 수 있습니다. (Android Developers)이 글에서는 Google이 발표한 Android의 “Intelligent OS” 전략과 AppFunctions가 무엇인지, 그리고 개발자..
promptfoo는 LLM 애플리케이션을 위한 평가(eval), 레드팀(red teaming), 취약점 스캐닝, CI/CD 자동화를 한데 묶은 오픈소스 CLI이자 라이브러리입니다. 저장소 README와 공식 문서는 이 프로젝트를 “프롬프트, 모델, RAG, 에이전트를 시험하고 보안 점검하는 도구”로 설명하고 있습니다. GitHub 기준으로 저장소는 2026년 3월 9일 기준 최신 릴리스가 0.121.1이고, 약 11.8k 스타를 보유하고 있습니다. (GitHub) promptfoo/README.md at main · promptfoo/promptfooTest your prompts, agents, and RAGs. AI Red teaming, pentesting, and vulnerability sca..
전세사기 피해가 계속 발생하면서 정부가 전세 계약 전에 위험 정보를 한 번에 확인할 수 있는 시스템을 도입합니다.이번 대책의 핵심은 사후 구제 중심 → 사전 예방 중심으로 정책을 전환하는 것입니다.즉, 계약 전에 이 집이 위험한 전세인지 미리 확인할 수 있게 하겠다는 것입니다.---1️⃣ 계약 전 전세 위험 정보를 한 번에 확인지금까지는 전세 계약 전에 위험 여부를 확인하기가 매우 어려웠습니다.예를 들어 확인해야 할 정보가 많습니다.등기부등본 (근저당 여부)확정일자 현황기존 전세 세입자 정보세금 체납 여부임대인의 신용 상태문제는 이 정보들이 여러 기관에 흩어져 있고 접근도 쉽지 않았다는 것입니다.정부는 이를 해결하기 위해 여러 기관의 데이터를 통합 분석하여 제공할 예정입니다.통합되는 주요 정보정보 제공 ..
js_repl로 Playwright를 오래 붙잡고 테스트하는 방법브라우저 자동화는 익숙해질수록 역설적인 불편이 생긴다.테스트 한 번 돌리고 끝나는 용도라면 괜찮지만, 화면을 조금 고치고 다시 보고, 상태를 바꾸고 또 보고, 모바일까지 확인하는 반복 작업에서는 매번 처음부터 브라우저를 다시 띄우는 방식이 금방 비효율적으로 느껴진다.여기서 유용한 접근이 js_repl 기반의 Playwright 세션 유지 방식이다. 핵심은 단순하다. Playwright를 한 번 띄우고 끝내는 게 아니라, 같은 브라우저와 같은 페이지 핸들을 계속 붙잡은 채로 테스트를 이어가는 것이다.왜 이 방식이 좋은가보통 브라우저 자동화는 이런 흐름으로 끝난다.스크립트 실행브라우저 실행페이지 이동테스트 수행종료문제는 실제 UI 작업이 저렇게..
AI Agent 시대가 본격적으로 열리면서 기존 소프트웨어를 AI가 직접 사용하는 문제가 점점 중요해지고 있습니다.하지만 대부분의 소프트웨어는 GUI 중심으로 설계되어 있기 때문에 AI Agent가 사용하기 어렵습니다.이 문제를 해결하기 위해 등장한 프로젝트가 바로 CLI-Anything입니다.이 글에서는 GitHub 프로젝트 CLI-Anything이 무엇인지, 어떤 문제를 해결하는지, 그리고 실제로 어떻게 사용하는지 개발자 관점에서 정리해보겠습니다. GitHub - HKUDS/CLI-Anything: CLI-Anything: Making ALL Software Agent-NativeCLI-Anything: Making ALL Software Agent-Native. Contribute to HKUDS/..
OpenRAG는 할 수 있게 만든 Retrieval-Augmented Generation(RAG) 플랫폼입니다. GitHub 저장소 설명과 공식 문서 기준으로 보면, 이 프로젝트는 Langflow 기반 워크플로우, Docling 기반 문서 처리, OpenSearch 기반 검색 인덱싱, 그리고 Next.js/Starlette 기반 애플리케이션 계층을 하나의 패키지처럼 묶어 제공하는 것이 핵심입니다. 저장소는 langflow-ai/openrag에 공개되어 있고, 현재 공개 릴리스는 2026년 2월 27일 기준 0.2.5입니다. (GitHub)프로젝트 소개OpenRAG를 한 문장으로 정리하면, **“설치 직후 바로 돌려볼 수 있는 셀프 호스팅형 문서 검색·대화 플랫폼”**입니다. 사용자는 문서를 업로드한 뒤 ..
개발을 하다 보면 문서 정리, 아이디어 정리, 프로젝트 관리, 협업 등을 위해 여러 도구를 사용하게 됩니다.대표적으로 Notion, Miro, Obsidian, Google Docs 같은 서비스들이 있죠.하지만 이런 SaaS 도구에는 몇 가지 공통적인 문제가 있습니다.데이터가 클라우드 서비스에 종속오프라인 사용이 제한확장이나 커스터마이징이 어려움AI나 자동화 기능을 개발자가 직접 통제하기 어려움이런 문제를 해결하기 위해 등장한 프로젝트가 바로 AFFiNE 입니다.AFFiNE는 Notion + Miro + Obsidian의 장점을 결합한 오픈소스 지식 관리 플랫폼으로, 로컬 우선(Local-first) 구조와 확장 가능한 아키텍처를 특징으로 합니다. GitHub - toeverything/AFFiNE: ..
