GOOS: 테스트로 키우는 객체지향 소프트웨어 (Outside-In TDD)

GOOS 한 장 요약 — 왼쪽은 이중 루프 TDD(바깥은 인수 테스트가 "무엇을 원하는가"를 한동안 Red로 잡아 두는 큰 루프, 그 안의 작은 루프에서 단위 테스트 Red-Green-Refactor가 빠르게 여러 번 돌아 바깥 하나를 Green으로 통과시킴), 오른쪽은 outside-in 성장(가장 바깥 OrderService부터 시작해 아직 없는 협력자를 mock으로 역할만 발견하고, 그 역할이 다음 안쪽 작업이 되어 객체가 한 겹씩 자라남).

들어가며

이 글은 Testing-Refactoring-Essential 시리즈의 4단계이자 마지막입니다. 앞선 3단계 Refactoring: 동작을 지키며 설계를 개선하는 규율에서는 이미 존재하는 코드의 구조를 동작을 깨뜨리지 않은 채 안전하게 다듬는 규율을 익혔습니다. 이번에는 그 위에서 한 걸음 더 나아가, 처음부터 테스트가 설계를 이끌게 하는 접근, 즉 Freeman & Pryce의 Growing Object-Oriented Software, Guided by Tests(이하 GOOS)가 제시하는 mock 기반 outside-in TDD를 다룹니다. 리팩터링이 “이미 있는 코드를 다듬는 칼”이라면, GOOS는 “아직 없는 코드를 길러내는 흙”입니다.

GOOS의 핵심 통찰은 단순합니다. 객체지향 시스템은 한꺼번에 설계되는 것이 아니라, 테스트의 안내를 받으며 자라난다(grow)는 것입니다. 우리는 시스템을 바깥(인수 테스트)에서부터 시작해 안쪽(단위 테스트)으로 내려가며, 협력하는 객체들의 역할(role)과 그들이 주고받는 메시지(message)를 mock으로 먼저 발견합니다. 전체 로드맵은 Testing-Refactoring Essential Curriculum에서 확인할 수 있습니다. 이 글은 시리즈의 마지막 단계로, 2단계 회고에서 예고했던 London(mockist) 스타일을 실전으로 펼쳐 시리즈를 매듭짓습니다.

📌 이 글에서 다루는 내용

🔍 핵심 주제

Walking Skeleton: 가장 얇은 end-to-end 슬라이스로 배포 파이프라인부터 먼저 세우기
Outside-In TDD: 인수 테스트(바깥)에서 시작해 단위 테스트(안쪽)로 내려가며 설계하기
Mock으로 협력 설계 (Tell, Don’t Ask): 역할·책임·메시지를 테스트로 발견하기
테스트 가능성 = 좋은 설계: “listening to the tests”로 설계 결함을 조기에 감지하기
테스트 유지보수성: 명확한 이름·구조로 회귀 가능한 테스트 작성하기

Walking Skeleton: 배포 파이프라인부터 세운다

대부분의 프로젝트는 “도메인 로직부터 완성한 뒤 나중에 배포를 붙이자”는 유혹에 빠집니다. GOOS는 정반대를 권합니다. 가장 먼저 만들어야 할 것은 가장 얇은 end-to-end 슬라이스, 곧 Walking Skeleton입니다.

Walking Skeleton은 “거의 아무 기능도 없지만, 시스템의 모든 주요 구성 요소를 한 줄로 꿰뚫고 실제로 빌드·배포·실행되는 가장 작은 구현”을 뜻합니다. 예를 들어 웹 서비스라면, 화면에서 버튼 하나를 누르면 서버를 거쳐 DB에 한 줄이 기록되고 다시 화면에 결과가 표시되는 정도의 흐름 하나면 충분합니다. 로직은 비어 있어도 됩니다. 중요한 건 배포·통합·실행의 인프라가 첫날부터 살아 있다는 것입니다.

왜 이것이 그토록 중요할까요? 통합과 배포는 프로젝트에서 가장 위험하고 가장 늦게 드러나는 문제이기 때문입니다. Walking Skeleton은 이 위험을 프로젝트 첫날로 끌어당깁니다. 동시에 첫 번째 인수 테스트를 실행할 수 있는 환경을 만들어 주므로, 이후 모든 outside-in 사이클의 출발점이 됩니다.

Walking Skeleton의 목표는 “기능”이 아니라 “흐름”입니다. 무엇을 계산하느냐가 아니라, 시스템의 끝에서 끝까지가 연결되어 실제로 돌아가는지를 증명하는 것이 핵심입니다.

Outside-In TDD: 바깥에서 안쪽으로 설계한다

Walking Skeleton이 깔리면, 본격적인 개발은 두 겹의 루프로 진행됩니다.

flowchart TD
    A["실패하는 인수 테스트 작성<br/>(바깥 루프 · 무엇을 원하는가)"] --> B["기능을 구현하기 위한<br/>단위 테스트 작성 (안쪽 루프)"]
    B --> C["단위 테스트 통과 + 리팩터링"]
    C --> D{"인수 테스트<br/>통과?"}
    D -->|아니오| B
    D -->|예| E["기능 완성 · 다음 인수 테스트로"]

바깥 루프(인수 테스트)는 “사용자가 무엇을 원하는가”를 시스템 경계에서 표현합니다. 이 테스트는 한동안 빨간 막대(red)로 머무릅니다. 그 빨간 테스트를 통과시키기 위해 우리는 안쪽 루프(단위 테스트)로 내려가, 필요한 객체를 하나씩 TDD로 길러냅니다.

여기서 “outside-in”의 진짜 의미가 드러납니다. 우리는 가장 바깥의 객체(예: OrderService)부터 작성합니다. 그런데 그 객체는 아직 존재하지 않는 협력자들(예: 결제 게이트웨이, 알림 발송기)을 필요로 합니다. 이때 그 협력자들을 구현하지 않고 mock으로 세워 둔 채, 바깥 객체가 협력자에게 “어떤 메시지를 보내야 하는가”를 먼저 결정합니다. 즉 구현이 아니라 인터페이스(역할)를 테스트가 발견하게 하는 것입니다. 이렇게 발견된 역할이 다음 단계의 작업 목록이 되고, 우리는 한 겹씩 안쪽으로 내려가며 시스템을 완성합니다.

Mock으로 협력 설계: 역할·책임·메시지 (Tell, Don’t Ask)

GOOS의 가장 독창적인 기여는 mock을 “설계 도구”로 사용한다는 점입니다. 흔히 mock을 “DB나 네트워크 같은 느린 의존성을 끊는 트릭”으로만 생각하지만, GOOS에서 mock의 목적은 다릅니다. mock은 아직 존재하지 않는 협력 객체의 역할과, 그 객체에게 보낼 메시지를 먼저 설계하기 위한 수단입니다. 이 스타일을 흔히 mockist(런던파, London School) TDD라 부릅니다.

이때 설계의 나침반이 되는 원칙이 “Tell, Don’t Ask”입니다. 객체에게서 데이터를 꺼내 와(ask) 호출자가 직접 판단하지 말고, 객체에게 “이렇게 해 달라”고 명령(tell)하라는 것입니다. 객체가 상태를 노출하는 대신 행동을 노출할 때, 협력은 “메시지 교환”이 되고 시스템은 자율적인 객체들의 망(network)으로 자랍니다.

원서 GOOS는 Java + jMock 기반으로 예제를 전개합니다. 아래에서는 같은 사고방식을 Python의 unittest.mock으로 옮겨 보겠습니다. 도구는 다르지만 “메시지를 먼저 설계한다”는 핵심은 동일합니다.

Worked Example: OrderService를 outside-in으로 키우기

주문을 처리하는 OrderService를 만든다고 합시다. 주문을 처리하려면 (1) 결제를 청구하고 (2) 고객에게 알림을 보내야 합니다. 우리는 아직 결제 게이트웨이도, 알림 발송기도 구현하지 않았습니다. 그래도 괜찮습니다. OrderService가 그들에게 보낼 메시지를 테스트로 먼저 정의하면 됩니다. 아래 그림은 이때 mock이 어떻게 “협력자의 인터페이스를 발견”하는 도구가 되는지를 보여 줍니다.

mock으로 협력 인터페이스를 발견하는 outside-in 설계 — 데이터를 꺼내 직접 판단하는 Ask를 버리고, 미구현 OrderService가 협력자에게 Tell(명령)하면, 그 메시지(charge(order)·notify(...))가 곧 PaymentGateway·Notifier라는 새 역할의 인터페이스로 발견된다. 두 협력자는 아직 점선(미구현) — 구현은 다음 사이클로 미룬다.

# test_order_service.py
import unittest
from unittest.mock import Mock

from order_service import OrderService, Order


class OrderServiceTest(unittest.TestCase):
    def test_주문_처리시_결제를_청구하고_고객에게_알린다(self):
        # 협력자(역할)를 아직 구현하지 않은 채 mock으로 세운다.
        # 이 mock들이 곧 PaymentGateway, Notifier의 "인터페이스 발견"이다.
        payment_gateway = Mock(name="PaymentGateway")
        notifier = Mock(name="Notifier")

        order = Order(customer="alice", amount=12_000)
        service = OrderService(payment_gateway, notifier)

        service.place(order)

        # Tell, Don't Ask: 데이터를 꺼내 비교하지 않고,
        # "협력자에게 이런 메시지를 보냈는가"를 검증한다.
        payment_gateway.charge.assert_called_once_with(order)
        notifier.notify.assert_called_once_with(
            "alice", "주문이 정상 처리되었습니다."
        )

이 테스트를 쓰는 순간, 우리는 코드를 한 줄도 구현하지 않고 두 개의 역할과 그 메시지 시그니처를 설계해 버렸습니다. PaymentGateway는 charge(order)를, Notifier는 notify(customer, message)를 이해해야 한다는 계약이 테스트에 박제된 것입니다. 이제 이 빨간 테스트를 통과시키는 가장 단순한 구현을 작성합니다.

# order_service.py
from dataclasses import dataclass


@dataclass
class Order:
    customer: str
    amount: int


class OrderService:
    def __init__(self, payment_gateway, notifier):
        # 생성자 주입: 협력자(역할)를 외부에서 받는다.
        self._payment_gateway = payment_gateway
        self._notifier = notifier

    def place(self, order: Order) -> None:
        # Ask가 아니라 Tell: 협력자에게 "해 달라"고 명령한다.
        self._payment_gateway.charge(order)
        self._notifier.notify(
            order.customer, "주문이 정상 처리되었습니다."
        )

OrderService는 결제가 “어떻게” 일어나는지, 알림이 “어떻게” 발송되는지 전혀 모릅니다. 오직 무엇을 시킬지(메시지)만 압니다. 이것이 outside-in이 만들어내는 느슨한 결합입니다. 협력자의 구체 구현(StripeGateway, EmailNotifier 등)은 다음 사이클에서 각자의 단위 테스트로 길러내면 됩니다 — 바깥에서 안쪽으로 한 겹 더 내려간 것입니다.

여기서 mock이 단지 “가짜 객체”가 아니라 협력 관계에 대한 명세임에 주목하세요. assert_called_once_with는 “이 객체는 협력자에게 이런 메시지를, 이런 인자로, 이만큼 보낸다”는 설계 결정을 검증합니다. 구현이 아니라 상호작용(interaction)을 테스트하는 것이 mockist 스타일의 본질입니다.

한 걸음 더: 실패 경로의 메시지도 설계한다

협력 설계는 정상 경로에서 끝나지 않습니다. 결제가 실패하면 알림 메시지도 달라져야 합니다. 이 역시 mock으로 “어떤 메시지를 보낼지”를 먼저 결정합니다.

    def test_결제_실패시_고객에게_실패를_알린다(self):
        payment_gateway = Mock(name="PaymentGateway")
        payment_gateway.charge.side_effect = PaymentDeclined  # 협력자의 행동을 지정
        notifier = Mock(name="Notifier")

        service = OrderService(payment_gateway, notifier)
        service.place(Order(customer="bob", amount=9_000))

        notifier.notify.assert_called_once_with(
            "bob", "결제가 거절되어 주문이 취소되었습니다."
        )

테스트가 요구하는 대로 OrderService.place에 예외 처리 분기를 추가하면, 우리는 실패 경로의 협력 메시지까지 설계를 마친 셈이 됩니다. 테스트가 다음에 무엇을 구현할지 알려주는 outside-in의 리듬입니다.

경고: “mock everything” 안티패턴

mock은 강력하지만 남용하면 독이 됩니다. 모든 것을 mock으로 감싸면, 테스트는 구현 세부에 들러붙어 작은 변경에도 깨지는(brittle) 부서지기 쉬운 테스트가 되고, 정작 객체들이 함께 동작하는지는 검증하지 못합니다. GOOS의 권고는 명확합니다. mock은 당신이 소유하고 설계 중인 “역할” 경계에만 사용하세요. 값 객체(value object)나 표준 라이브러리, 단순한 데이터 구조까지 mock으로 대체하면 안 됩니다. “Only mock types you own”이라는 격언이 바로 이 경계를 지키라는 뜻입니다.

테스트 가능성 = 좋은 설계: listening to the tests

GOOS의 부제로 삼아도 될 만큼 중요한 통찰이 “listening to the tests”입니다. 테스트를 작성하기가 유난히 어렵다면, 그것은 테스트의 문제가 아니라 설계의 문제라는 신호입니다. 테스트는 설계 품질을 비추는 거울입니다.

구체적으로, 다음과 같은 “테스트의 고통”은 설계 결함의 징후입니다.

mock이 너무 많이 필요하다 → 객체가 협력자를 너무 많이 안다. 책임이 과도하거나(God Object) 결합이 강하다는 신호입니다.
mock을 또 다른 mock이 반환해야 한다(mock이 mock을 낳는다) → 객체가 협력자의 내부를 깊이 파고든다(디미터 법칙 위반). “Tell, Don’t Ask”가 깨진 자리입니다.
준비(setup) 코드가 거대하다 → 객체를 쓰려면 너무 많은 맥락이 필요하다. 의존성 주입이나 책임 분리가 필요합니다.
무엇을 검증할지 애매하다 → 객체의 책임이 흐릿하다는 뜻입니다.

이 신호들이 보이면 구현을 비틀어 테스트를 억지로 통과시키지 말고, 설계로 되돌아가 역할을 다시 나누고 메시지를 다시 정의해야 합니다. 즉 테스트하기 쉬운 구조를 향해 설계를 바꾸는 것입니다. 이렇게 테스트를 “들으며” 설계를 교정하는 과정이 GOOS가 말하는 진짜 outside-in TDD입니다.

테스트 유지보수성: 회귀 가능한 테스트 작성하기

마지막으로, 테스트는 한 번 통과시키고 버리는 일회용이 아닙니다. 수년간 함께 살아가며 회귀(regression)를 잡아 주는 자산이어야 합니다. 그러려면 테스트 자체의 가독성과 유지보수성이 생산 코드만큼 중요합니다.

이름으로 의도를 말하라: test_1, test_order 같은 이름 대신 test_결제_실패시_고객에게_실패를_알린다처럼 행동과 기대를 한 문장으로 담습니다. 테스트 이름만 읽어도 시스템의 명세가 보여야 합니다.
Given-When-Then 구조를 지켜라: 준비(given) → 행동(when) → 검증(then)의 세 블록을 시각적으로 분리하면, 무엇을 테스트하는지가 한눈에 들어옵니다. 위 예제의 Mock 준비 → service.place(...) → assert_called_once_with가 정확히 이 구조입니다.
한 테스트는 한 가지만 검증하라: 하나의 테스트가 깨졌을 때 “무엇이 잘못됐는가”가 즉시 드러나도록, 검증의 초점을 하나로 모읍니다.
테스트 헬퍼로 의도를 드러내라: 반복되는 준비 코드는 의미 있는 이름의 빌더/팩토리(an_order_for("alice") 같은)로 추출해, 테스트가 무엇을 검증하는지에 집중하게 합니다.

좋은 테스트 이름과 구조는 단지 미관의 문제가 아닙니다. 6개월 뒤 빨간 막대를 마주한 당신(또는 동료)이 그 실패의 의미를 즉시 이해하고 고칠 수 있는가를 결정합니다. 유지보수 가능한 테스트만이 진짜 안전망입니다.

마무리

GOOS가 전하는 메시지는 한 문장으로 압축됩니다. “좋은 객체지향 설계는 테스트의 안내를 받으며 자란다.” Walking Skeleton으로 배포 파이프라인이라는 토양을 먼저 다지고, 인수 테스트(바깥)에서 단위 테스트(안쪽)로 내려가는 outside-in 리듬을 타며, mock으로 협력 객체의 역할과 메시지를 먼저 설계합니다. 이때 mock은 의존성을 끊는 트릭이 아니라 “Tell, Don’t Ask”에 기반한 설계 도구이며, 테스트하기 어렵다는 고통은 설계를 교정하라는 신호(“listening to the tests”)입니다.

여기에 더해, 명확한 이름과 Given-When-Then 구조를 갖춘 회귀 가능한 테스트는 시스템을 수년간 안전하게 진화시키는 자산이 됩니다. 다만 “mock everything”의 유혹을 경계하고, 당신이 소유한 역할 경계에만 mock을 쓰는 절제가 필요합니다. 3단계의 리팩터링이 이미 있는 코드를 다듬는 규율이었다면, 마지막 4단계의 GOOS는 처음부터 좋은 구조가 자라나게 하는 규율입니다.

이로써 Testing-Refactoring-Essential 시리즈를 완주했습니다 🎉. ①정전(TDD By Example)에서 Red-Green-Refactor의 호흡을, ②회고(Seven Years After)에서 TDD를 도그마가 아닌 도구로 보는 시각을, ③Refactoring에서 구조를 안전하게 개선하는 카탈로그를, 그리고 ④GOOS에서 테스트로 OO 시스템을 길러내는 실전을 얻었습니다. 네 권을 관통하는 한 문장은 이것입니다 — 테스트는 변경을 두렵지 않게 만들고, 두렵지 않은 변경만이 설계를 계속 진화시킨다.

다음 학습

Testing-Refactoring Essential Curriculum — 전체 로드맵 다시 보기
Refactoring: 동작을 지키며 설계를 개선하는 규율 — 3단계 다시 보기
OO-Design Essential Curriculum — 테스트가 길러낸 설계 감각을 객체지향 설계로 확장
Process Essential Curriculum — TDD·CI가 속한 애자일 실천으로 확장