블로그 목록

AI 에이전트 활용법: 도구 분리(Tool Separation)로 경량 모델 한계 넘기

에이전트 적극 활용하기 — 도구 분리로 귀찮음 극복하기


앞선 글에서 GPT-mini 모델도 제법 일을 잘한다고 말씀을 드렸습니다만… 당연한 얘기겠지만, 완전히 만족할 만한 수준은 아닙니다. 말을 제법 못 알아들을 때도 많고(이전 맥락으로 파악했어야 함에도 다시 설명해야 하는 경우가 제법 있었습니다.) 지시를 우회하는 경우도 제법 있었습니다.

대표적으로 간단한 웹앱을 만드는데, 코딩 CLI1 사용에 어려움(에러 또는 사용법 미숙?)을 겪는 상황이 오면 지시를 무시하고 스스로 고치는 경우가 꽤 있었습니다. 결과물도 만족스럽지 못했고…

현재의 경량 모델 수준에서는, 이게 가장 좋은 사용법이 아닌가 하고 생각하고 있는데 다음과 같습니다.

  1. 웹앱 등 코딩이 필요한 경우 코딩 CLI에 일임합니다.
  2. API2를 이용해서 웹앱을 통제하는 법을 스킬(Skill) 형태로 만듭니다.
  3. 경량 모델이 스킬을 활용해서 웹앱을 통제합니다.

모듈형 에이전트 구조도

<경량 에이전트는 사용자의 의도를 해석해 스킬을 사용하는 역할을 담당합니다.>

현재 디스코드를 통해서 에이전트에 간단한 일정이나 메모 사항을 맡기고 있는데, 이걸 한눈에 보고 싶다는 생각이 들었습니다. VM에 Tailscale3도 설치되어 있으니, 간단한 대시보드를 만들고자 했습니다. 코딩 CLI에게 위임하여 생성하게 하고, API 스펙 및 사용법을 스킬로 만들게 했습니다. 일정의 등록과 수정은 디스코드를 통해 에이전트에 지시하면 에이전트가 스킬을 활용해서 등록, 수정을 합니다.

(1) CLI(Command Line Interface) — 그래픽(마우스)을 사용하는 GUI 환경과 달리, 정해진 텍스트 명령어만으로 컴퓨터를 정밀하게 제어하는 환경입니다. 스크립트를 통한 자동화와 작업 효율성에 강점이 있으며, 본문에서는 주로 코딩을 대신 짜주는 전용 터미널 도구(Codex 등)를 통칭합니다.

(2) API(Application Programming Interface) — 프로그램들이 서로 소통하고 데이터를 주고받기 위한 접점이나 규칙을 뜻합니다.

(3) Tailscale(테일스케일) — 복잡한 설정 없이 원격지의 기기들을 가상 사설망(VPN)으로 묶어주는 오픈소스 서비스. 공식 웹사이트: tailscale.com

이런 방식을 택한 이유는 귀찮음 때문입니다. 일정 등록을 습관화하려는 시도를 몇 번이나 했으나 실패했던 건 과정이 너무 많다는 점이었습니다. 날짜를 선택하고 내용과 장소, 특이사항을 각각 입력창에 입력하고…. 일정 등록 하나에 몇 개의 단계를 거치는지… 상당히 귀찮은 일이었습니다. 그래서 에이전트에 개떡같이 던져주면 그걸 잘 가공해서 만족스럽게 등록해 줍니다.

앞으로 만들 것들도 이런 식이 되지 않을까 합니다. 각각의 업무를 대시보드 형태로 올리고, 에이전트 하나에 스킬을 달아두고 모든 일을 하게끔 하는… 이게 사이즈가 작으니 잘 작동하지만, 데이터가 커지면 어떻게 될지 아직은 잘 모르겠습니다. 1년 만에 이 정도까지 온 것을 생각하면 시간이 해결해 줄 걸로 기대되긴 합니다.

한 가지 더 보태자면, 데이터 개인정보 문제로 로컬 LLM4을 사용하겠다는 생각은 하지 않는 게 좋습니다. Gemma 4가 출시되고 온갖 호들갑들을 많이 봤지만, 현실적으로 개인이 돌릴 수 있는 모델 사이즈로는 에이전트의 역할을 맡길 만한 성능이 나오질 않습니다. 큰 모델을 돌리기엔 금액이 너무 많이 들고…. 현실적인 타협은 구독 모델로 가는 것이 제일 나아 보입니다.

(4) 로컬 LLM(Local LLM) — 클라우드 서버 대신 내 컴퓨터나 홈서버의 자원을 이용해 직접 돌리는 AI. 외부로 데이터가 나가지 않아 프라이버시가 보호되지만, 장비 구매 비용 대비 얻을 수 있는 에이전트 추론 성능에는 명확한 한계가 있습니다.

다른 글 보기