저사양 홈서버로 AI 에이전트 돌리기: 구형 PC + Hermes Agent 후기
구형 PC 한 대면 충분했다 — Hermes 에이전트 써본 후기
OpenClaw1가 한동안 유행할 때 굳이 찾아서 사용하지는 않았습니다. Claude Code2류의 에이전트로 충분하다고 느꼈고, 보안 위협에 대한 얘기가 너무 많아 시도해볼 엄두를 못 냈습니다.
그 외에도 몇 가지 고민되는 부분은, 토큰 사용량이 너무나 많습니다. 보안 문제가 심각하니 적어도 격리된 환경을 구성해야 합니다. 이 정도가 가장 큰 미룸의 원인이었습니다.
OpenClaw의 열기가 잠깐 수그러들었고 최근에는 Hermes Agent3가 유행하고 있는 듯싶습니다.
(1) OpenClaw — 2025년 11월 오스트리아 개발자 Peter Steinberger가 공개한 오픈소스 자율 AI 에이전트. 공식 레포: github.com/openclaw/openclaw
(2) Claude Code — Anthropic이 만든 터미널 기반 코딩 에이전트. 공식 레포: github.com/anthropics/claude-code
(3) Hermes Agent — Nous Research가 2026년 2월 공개한 학습형 오픈소스 AI 에이전트. 대화 경험을 스스로 스킬로 축적하며 성장합니다. 공식 레포: github.com/NousResearch/hermes-agent
홈서버로 쓰고 있는 컴퓨터도 공간이 많이 남아, VM4을 새로 만들고 설치를 시작했습니다. OpenClaw의 경우 설치가 까다롭다고 들었고, GUI5 환경이 에이전트에 더 적절하다는 얘기를 들었는데, Hermes의 경우 Linux 환경에서도 잘 작동합니다.
설치도 쉬웠고, 디스코드 연결도 쉬웠습니다. 처음 시도하는 분들은 디스코드 봇 토큰 발급이 가장 헷갈리거나 어려운 부분이 아닐까 싶습니다. 그나마 토큰이 넉넉한 Codex6를 붙여서 GPT-5.4-mini7 모델로 시작했습니다.
(4) VM(Virtual Machine, 가상 머신) — 실제 컴퓨터 안에 소프트웨어로 만든 또 다른 컴퓨터. 격리된 환경이라 호스트에 영향 없이 실험할 수 있습니다.
(5) GUI(Graphical User Interface) — 마우스와 아이콘으로 조작하는 그래픽 화면 방식. 터미널(CLI)과 반대 개념.
(6) Codex — OpenAI의 코딩 CLI. 공식 레포: github.com/openai/codex
사실 아직도 경량 모델은 코딩 실력을 못 미더워 Claude, Gemini, Codex CLI8를 설치하고 세팅까지 마쳤습니다.
놀랐던 점은 GPT-5.4-mini도 꽤 일을 잘한다는 것입니다. 고용노동부에서 주최하는 AI 공모전에 대한 정보를 수집하는 것을 시켰는데, 공식 정보뿐만 아니라 작년 수상작 PDF를 읽고 잘 정리해서 주었습니다. PDF를 열어 확인해 봤는데 할루시네이션9 없이 잘 처리했습니다. 또 어떻게 했는지 모르겠지만, 웹사이트에 들어가서 화면 캡처도 꽤 잘하는…. (왜 잘하지?)
나중에 별도로 다뤄보고 싶지만, 간략하게 말하자면 프론티어 모델의 토큰 사용량이 어마어마해서 경량 모델을 다양하게 써보고 있습니다. 현재로서는 Sonnet > GPT-5.4-mini > Gemini Flash 순으로 믿을 만합니다. 미니 모델로 돌리니 토큰량도 꽤 넉넉하다는 생각이 듭니다. (현재 ChatGPT Plus 구독)
(7) GPT-5.4-mini — OpenAI의 경량 모델. 가격·토큰 사용량이 낮아 에이전트를 장시간 돌리기 적합합니다.
(8) Claude / Gemini / Codex CLI — 각 LLM 공급사의 터미널 기반 코딩 도구. Claude는 Anthropic, Gemini는 Google, Codex는 OpenAI.
(9) 할루시네이션(hallucination) — LLM이 실제로 존재하지 않는 사실을 그럴듯하게 지어내는 현상.
실제로 이 환경에서 간단한 웹앱을 몇 개 만들어 폰에서 띄워 쓰고 있습니다. Hermes VM 안에 올려두고 브라우저로 접속만 하면 됩니다.

<공복 경과 시간을 타임랩스로 보여주는 단식 앱입니다. sqlite3에 세션을 저장하고, 공복 단계(0-4h, 8h, 12h, 16-18h, 24h+)에 맞춰 시각 요소가 바뀝니다.>

<채팅으로 일정·할일을 주면 에이전트가 대신 등록하는 달력형 보드입니다. 날짜를 누르면 그날 상세만 뜨는 구조로 단순화했습니다.>
이런 형태가 새로운 OS10가 될 거란 의견에 크게 공감이 되었습니다. 간단한 어플은 직접 만들어 쓸 거 같다는 생각입니다. 커뮤니티 형태의 서비스만 남지 않을까? LLM11이 활용 가능한 형태로 대부분 전환되지 않을까? 하는 생각도 듭니다.
집에 남는 컴퓨터가 있다면(구형 컴퓨터도 상관없습니다.) 한 번쯤 시도해 볼 만한 가치가 있다고 생각합니다. 하고 싶은 것이 있다면 활용법은 무궁무진할 것 같고, 다만 인간이 병목이라는 말이… 틀린 말은 아닌 것 같습니다.
(10) OS(Operating System, 운영체제) — 사용자가 컴퓨터를 조작할 수 있게 해주는 기반 소프트웨어. 여기서는 "LLM 에이전트가 새로운 OS 레이어가 된다"는 의미로 썼습니다.
(11) LLM(Large Language Model, 대규모 언어 모델) — ChatGPT, Claude, Gemini 같은 언어 모델의 통칭.