목록2026/03/19 (2)
오늘도 공부
연구자가 하던 일을 에이전트가 대신하는 시대가 정말 오고 있다.그런데 이 저장소가 흥미로운 이유는 “논문을 요약하는 AI”가 아니라, 실제로 코드를 수정하고 학습을 돌리고 성능이 좋아졌는지 판단한 뒤 다음 실험으로 넘어가는 AI 연구 루프를 아주 작은 형태로 보여주기 때문이다.autoresearch는 거대한 플랫폼이 아니다. 오히려 반대다.파일 몇 개, 단일 GPU, 5분짜리 실험, 하나의 평가 지표. 이 단순한 제약 안에서 “AI가 연구를 수행하게 하려면 무엇을 고정하고 무엇을 열어둬야 하는가”를 굉장히 영리하게 보여준다. 저장소 설명 그대로 핵심은 에이전트에게 작은지만 실제적인 LLM 학습 환경을 주고, train.py를 바꾸며 성능 향상을 탐색하게 하는 것이다. 2026년 3월 19일 기준 이 저장..
종이 문서를 스캔해서 폴더에 쌓아두는 방식은, 디지털화가 아니라 단순한 “파일 덤프”에 가깝습니다. 진짜 필요한 건 PDF를 저장하는 도구가 아니라, 문서 안의 텍스트를 읽고, 분류하고, 다시 찾아낼 수 있게 만드는 시스템입니다. Paperless-ngx는 바로 그 지점을 겨냥한 프로젝트입니다. 스캔한 영수증, 계약서, 고지서, 세금 문서를 그냥 보관하는 수준을 넘어서, OCR·인덱싱·자동 분류·검색까지 하나의 파이프라인으로 묶어줍니다. (GitHub)이 프로젝트가 흥미로운 이유는 “문서 보관함”처럼 보이지만, 실제로는 꽤 잘 설계된 비동기 문서 처리 플랫폼에 가깝기 때문입니다. Docker Compose로 비교적 쉽게 올릴 수 있고, 백엔드는 Django 기반, 작업 처리는 Celery와 Redis, ..
