← back

bestwork-agent

Claude Code Plugin · npm · Node ≥20 · MIT License ·

Claude Code를 위한 하네스 엔지니어링. 에이전트가 한 줄 치면, 하네스가 나머지를 전부 잡아냅니다.

AI 코딩 에이전트는 환각을 만들고, 루프를 돌고, 요구사항을 빠뜨리고, 보안 결함을 포함한 코드를 만들어냅니다. bestwork-agent는 실제 엔지니어링 팀이 사용하는 품질 게이트를 자동으로 적용합니다 — 워크플로우를 바꿀 필요 없이.

7개 자동 품질 게이트

모든 게이트는 자동으로 실행됩니다. 프롬프트만 치면 됩니다.

게이트 타이밍 잡아내는 것
GroundingPreToolUse (Edit/Write)읽지 않은 파일 수정 시도
Scope LockPreToolUse잠긴 디렉토리 바깥 편집
Strict ModePreToolUserm -rf, git push --force
Type CheckPostToolUse (Edit/Write)변경마다 TypeScript 에러
ReviewOn demand / PostToolUse가짜 import, 환각 메서드, 플랫폼 불일치, deprecated API
Requirement CheckPostToolUse (Edit/Write)clarify/validate 세션의 미충족 요구사항
ValidateBefore building근거 기반 go/no-go — 이 기능을 만들 가치가 있는가?
HARNESS EFFECTIVENESS BENCHMARK

  Scenarios:      13
  Accuracy:       100.0%

  Harness ON:     100% (10/10)  False pos: 0
  Harness OFF:    0% (0/10)

  Categories:     hallucination 3/4 | platform 4/4 | deprecated 1/1 | security 1/1

두 가지 실행 모드

Hierarchy 모드 — 권한 기반 의사결정

CTO → Tech Lead → Sr. Engineer → Jr. Engineer

주니어가 먼저 구현합니다. 선입견 없이 새로운 시각으로 접근할 수 있기 때문입니다. 시니어가 코드를 다듬고, 리드가 아키텍처를 검토하고, C레벨이 최종 전략적 판단을 합니다. 각 단계에서 문제가 있으면 아래 단계로 다시 내려보냅니다.

Squad 모드 — 수평적 협업

Backend + Frontend + Product + QA (동등, 병렬)

단일 기능이나 버그 픽스처럼 빠르게 끝내야 할 작업에 적합합니다. 한 명의 권한자가 아니라 합의 기반으로 결정하고, 모든 멤버가 동시에 작업합니다.

자동 팀 편성

Gateway가 요청을 분석해서 어떤 모드와 팀이 적합한지 자동으로 판단합니다. 실행 전에 편성 계획을 보여주고 확인을 받습니다.

시그널 선택되는 모드
간단한 수정, 리네임, 포맷팅Solo
관련된 2개 하위 작업Pair
여러 하위 작업Trio
대규모, 여러 디렉토리, 아키텍처 변경Hierarchy
단일 기능, 버그 픽스Squad
보안 민감 파일Security Team
인프라 / CI·CD 파일Infra Squad

14개 역할, 4단계 레벨

레벨 역할 관점
C-LevelCTO, CPO, CISO전략 — 아키텍처, 제품 방향, 보안 포스처
LeadTech Lead, EM, QA Lead, Product Lead전술 — 코드 품질, 딜리버리, 테스트 전략
SeniorBackend, Frontend, Fullstack, Infra, Security깊은 구현과 멘토링
JuniorEngineer, QA새로운 시각 — 가정에 질문, 엣지 케이스 발견

8개 프리셋 팀

Full Team (Hierarchy) CTO → Tech Lead → Sr. Fullstack → Jr. Engineer
Backend Team (Hierarchy) CTO → Tech Lead → Sr. Backend → Jr. Engineer
Frontend Team (Hierarchy) CPO → Product Lead → Sr. Frontend → Jr. Engineer
Security Team (Hierarchy) CISO → Tech Lead → Sr. Security → Jr. QA
Feature Squad Sr. Backend + Sr. Frontend + Product Lead + QA Lead
Infra Squad Sr. Infra + Sr. Security + Tech Lead
Code Review Board Tech Lead + Sr. Security + QA Lead (2/3 승인)
Architecture Review CTO + Tech Lead + EM (방향성만, 코드 없음)

49개 도메인 전문가

조직 구조 위에 49개의 도메인 전문가가 추가로 배치됩니다. 기술 에이전트 25개 (백엔드, 프론트엔드, 인프라, 보안, ML, 모바일, 인증 등), PM 에이전트 10개 (프로덕트, API, 플랫폼, 컴플라이언스, DX 등), 크리틱 에이전트 14개 (성능, 확장성, 환각 감지, 타입 안전성, 비용 등)로 구성되어 있습니다.

모든 에이전트의 프롬프트는 prompts/ 디렉토리에 있어서 리빌드 없이 수정할 수 있습니다.

환각 방지

파일 그라운딩

읽지 않은 파일을 수정하려고 하면 경고합니다. 존재하지 않는 파일을 참조하는 환각을 잡습니다.

타입 체크

TypeScript 코드를 변경할 때마다 자동으로 타입 체크를 돌려서 깨진 코드를 즉시 감지합니다.

플랫폼 리뷰

OS나 런타임 불일치를 감지합니다. macOS 전용 코드를 Linux에서 돌리려는 실수를 막습니다.

스코프 락 & 스트릭트 모드

지정된 경로 바깥의 파일 수정을 차단합니다. rm -rf, git push --force 같은 위험한 명령도 막습니다.

요구사항 체크

clarify/validate 세션에서 수집한 요구사항이 구현에 반영되었는지 자동으로 검증합니다.

사전 검증 (Validate)

구현 전 근거 기반 go/no-go 판단. 만들 가치가 있는 기능인지 리서치하고 스트레스 테스트합니다.

22개 스킬

슬래시 커맨드로 바로 실행됩니다.

validate

코드를 짜기 전에 "이걸 만들어야 하는가?"부터 따집니다. 실제 유저 시나리오로 스트레스 테스트해서 만들 가치가 없으면 거기서 멈춥니다.

clarify

"로그인 기능 만들어줘"라고만 하면 OAuth? 이메일? 세션 만료는? 같은 질문을 먼저 던집니다. 구현 중에 뒤집히는 요구사항을 미리 잡아냅니다.

superthinking

계획 → 구현 → 검증 → 비판 → 개선을 1000회 반복 시뮬레이션합니다. 한 번에 완벽한 답을 내는 게 아니라 반복적으로 다듬어서 결과물의 밀도를 높입니다.

pipeline-run

GitHub 이슈 10개를 큐에 넣으면 각각 브랜치를 따고, 팀을 배정하고, PR을 만들고, 머지까지 자동으로 처리합니다. 사람이 하나씩 처리할 필요가 없습니다.

trio

하나의 작업에 개발자 + PM + 크리틱을 붙여서 병렬로 돌립니다. 구현하는 사람과 검증하는 사람이 분리되어 있어서 셀프 리뷰의 맹점을 없앱니다.

waterfall

설계 → 구현 → 테스트 → 리뷰 순서로 흐르고, 앞 단계를 통과하지 못하면 다음으로 넘어가지 않습니다. 단계별 품질 보증이 필요할 때 씁니다.

blitz

모든 작업을 동시에 터뜨립니다. 조율 오버헤드 없이 최대 속도로 밀어붙여야 할 때 — 예를 들어 마감 직전 일괄 수정 같은 상황에 적합합니다.

deliver / delegate

deliver는 "끝날 때까지 끝난 게 아니다" — 검증이 통과할 때까지 수정을 반복합니다. delegate는 분류부터 실행까지 확인 없이 자율적으로 처리합니다.

관측성

TUI 대시보드에서 세션 목록, 도구 사용 분석, 에이전트 트리, 주간 개요를 확인할 수 있습니다. 365일 활동 히트맵, 루프 감지, 단계별 리플레이, 프롬프트 효율 추세도 제공합니다. Discord와 Slack 웹훅으로 작업 완료 알림을 받을 수 있고, git diff, 플랫폼 리뷰, 세션 헬스를 포함한 요약이 색상 코드와 함께 전송됩니다.

팀 자동 최적화 기능으로 과거 세션 데이터를 학습해 에이전트 배분을 점점 더 효율적으로 조정합니다.

$ claude "리팩터링해줘 — auth 모듈 전체"

[bestwork-agent] Gateway 분석 중...
  Scope: 대규모 (8 files, 3 directories)
  Mode:  Hierarchy — Full Team

  CTO         → 아키텍처 방향 결정
  Tech Lead   → 코드 품질 / 리뷰 기준 설정
  Sr. Backend → 구현 및 리팩터링
  Jr. Engineer→ 엣지 케이스 검증

  실행할까요? [Y/n] y

Jr. Engineer → 구현 시작 (auth/session.ts, auth/middleware.ts)
Sr. Backend  → 리뷰: 세션 만료 로직 수정 제안
Tech Lead    → 승인: 인터페이스 분리 컨벤션 적용
CTO          → 최종 승인: 보안 포스처 확인 완료

 완료 — 4 files changed, 12 checks passed