Rust 디버깅과 프로파일링

이 글의 한 장 요약 — 왼쪽은 측정-수정 순환(빌드→실행→문제 관측→원인 파악→수정→재측정), 오른쪽은 원인 파악 도구가 증상에 따라 두 갈래로 갈리는 모습. 논리 버그는 dbg!·backtrace·rust-gdb/lldb로 값과 실행을 추적하고, 성능 문제는 criterion으로 측정하고 perf/flamegraph로 핫스팟을 찾는다.

들어가며

이 글은 Rust-Essential 로드맵의 7단계로, 코드를 추적하고 성능을 측정하는 도구들을 다룹니다. 이전 단계인 Rust 스마트 포인터, 동시성, 그리고 프로젝트에서 만든 프로그램이 올바르게 동작하는지, 그리고 충분히 빠른지를 확인할 차례입니다. 전체 학습 경로는 Rust Essential Curriculum에서 확인할 수 있습니다.

📌 이 글에서 다루는 내용

🔍 핵심 주제

Debugging: dbg! 매크로, RUST_BACKTRACE, rust-gdb/rust-lldb 연동
Benchmarking: criterion 크레이트로 통계적 벤치마킹
Profiling: cargo-flamegraph로 핫스팟 시각화, release 빌드의 중요성

디버깅

문제의 증상이 도구를 정합니다. 값이 이상하거나 panic이 나는 논리 버그라면 먼저 가벼운 추적(dbg!/backtrace)으로 시작해 필요할 때 디버거로 내려가고, “느리다”는 성능 문제라면 먼저 criterion으로 숫자를 확인한 뒤 flamegraph로 핫스팟을 찾습니다. 아래 흐름이 그 선택의 지도입니다.

flowchart TD
    S["무엇이 문제인가?"] -->|"값이 틀리거나 panic<br/>(논리 버그)"| L1["dbg! 매크로<br/>RUST_BACKTRACE"]
    S -->|"느리다<br/>(성능)"| P1["criterion 벤치마크<br/>먼저 숫자로 확인"]
    L1 -->|"값만으론 부족<br/>흐름을 멈춰 보고 싶다"| L2["rust-gdb / rust-lldb<br/>중단점·스텝 실행"]
    L1 -->|"원인 파악됨"| FIX["수정"]
    L2 --> FIX
    P1 -->|"어느 함수가 느린가?"| P2["cargo flamegraph<br/>(release 빌드)"]
    P2 -->|"더 깊은 분석"| P3["perf / Instruments"]
    P1 --> FIX
    P2 --> FIX
    P3 --> FIX
    FIX -->|"재측정"| S

println!의 한계

가장 손쉬운 디버깅 방법은 println!이지만, 단점이 분명합니다. 표준 출력으로 나가기 때문에 프로그램의 정상 출력과 섞이고, 어느 파일·라인에서 찍은 값인지 직접 적어주지 않으면 알 수 없습니다. 또한 출력하려는 값이 Display를 구현하지 않으면 {:?}(Debug)을 따로 지정해야 합니다.

fn main() {
    let nums = vec![1, 2, 3];
    // 어디서 찍었는지, 무슨 값인지 직접 라벨을 달아야 한다
    println!("nums = {:?}", nums);
}

로그성 출력이라면 표준 에러로 보내는 eprintln!을 쓰는 편이 낫습니다. 정상 출력(stdout)과 진단 출력(stderr)을 분리할 수 있기 때문입니다.

fn main() {
    eprintln!("디버그 메시지는 stderr로"); // 파이프라인 출력과 섞이지 않는다
    println!("실제 결과는 stdout으로");
}

dbg! 매크로

dbg! 매크로는 표현식을 출력하면서 그 값을 그대로 반환합니다. 파일명·라인 번호와 표현식 자체를 함께 stderr로 찍어주기 때문에 라벨을 직접 달 필요가 없습니다.

fn factorial(n: u64) -> u64 {
    // dbg!(n)은 n을 출력한 뒤 n 값을 그대로 돌려준다
    if dbg!(n) <= 1 {
        1
    } else {
        n * factorial(n - 1)
    }
}

fn main() {
    let result = dbg!(factorial(4)); // 중간 값과 최종 값을 모두 추적
    println!("결과: {}", result);
}

값을 반환하므로 표현식 중간에 끼워 넣어도 코드 흐름을 바꾸지 않습니다. 출력은 다음과 같은 형태로 나옵니다.

[src/main.rs:3:8] n = 4
[src/main.rs:3:8] n = 3
[src/main.rs:11:18] factorial(4) = 24

RUST_BACKTRACE로 panic 추적

프로그램이 panic하면 기본적으로 한 줄짜리 메시지만 보입니다. RUST_BACKTRACE=1 환경 변수를 설정하면 패닉이 발생하기까지의 호출 스택 전체를 볼 수 있습니다.

fn main() {
    let v: Vec<i32> = vec![1, 2, 3];
    let _ = v[10]; // index out of bounds: panic 발생
}

# 백트레이스와 함께 실행
RUST_BACKTRACE=1 cargo run

# 더 자세한 프레임까지 보고 싶다면
RUST_BACKTRACE=full cargo run

rust-gdb / rust-lldb로 디버거 연동

값 한두 개가 아니라 실행 흐름을 단계별로 멈춰가며 보고 싶을 때는 디버거를 씁니다. Rust는 gdb/lldb를 Rust 타입에 맞게 감싼 rust-gdb, rust-lldb 래퍼를 제공합니다. 이 래퍼들은 Vec, String 같은 타입을 사람이 읽기 좋은 형태로 보여줍니다.

debug 빌드에는 디버그 심볼이 기본 포함되므로, 그냥 cargo build로 만든 바이너리를 디버거에 넘기면 됩니다.

# debug 빌드 (심볼 포함)
cargo build

# Linux: gdb 래퍼로 실행
rust-gdb ./target/debug/myapp

# macOS: lldb 래퍼로 실행
rust-lldb ./target/debug/myapp

디버거 안에서는 중단점을 걸고 한 줄씩 실행하며 변수를 확인할 수 있습니다.

(gdb) break main.rs:3   # 3번 라인에 중단점
(gdb) run               # 실행
(gdb) print v           # 변수 v 출력
(gdb) next              # 다음 줄로
(gdb) continue          # 계속 진행

CLI가 부담스럽다면 VS Code에 CodeLLDB 확장을 설치해 GUI에서 중단점·변수 검사·스텝 실행을 그대로 사용할 수 있습니다. launch.json에 debug 빌드 바이너리를 지정하면 됩니다.

벤치마킹

“빠르다”는 느낌이 아니라 숫자로 확인하려면 벤치마킹이 필요합니다. criterion 크레이트는 여러 번 반복 측정해 통계적으로 신뢰할 수 있는 결과를 내고, 이전 실행과 비교해 성능 회귀까지 잡아줍니다.

먼저 Cargo.toml의 [dev-dependencies]에 criterion을 추가하고, 벤치 타깃을 등록합니다.

[dev-dependencies]
criterion = "0.5"

# benches/my_benchmark.rs 를 벤치 타깃으로 등록
[[bench]]
name = "my_benchmark"
harness = false

벤치 코드는 benches/ 디렉토리에 둡니다. black_box는 컴파일러가 입력을 상수 폴딩으로 최적화해 없애버리지 않도록 막아주는 함수입니다.

// benches/my_benchmark.rs
use criterion::{black_box, criterion_group, criterion_main, Criterion};

fn fibonacci(n: u64) -> u64 {
    match n {
        0 => 0,
        1 => 1,
        n => fibonacci(n - 1) + fibonacci(n - 2),
    }
}

fn bench_fib(c: &mut Criterion) {
    // black_box로 입력 최적화를 방지
    c.bench_function("fib 20", |b| b.iter(|| fibonacci(black_box(20))));
}

criterion_group!(benches, bench_fib);
criterion_main!(benches);

cargo bench로 실행하면 평균 시간과 분포를 출력하고, target/criterion/에 HTML 리포트를 생성합니다.

cargo bench

프로파일링

벤치마킹이 “얼마나 빠른가”를 재는 것이라면, 프로파일링은 “어디서 시간을 쓰는가”를 찾는 작업입니다.

release 빌드로 측정하는 이유

프로파일링은 반드시 release 빌드로 해야 합니다. debug 빌드는 최적화가 꺼져 있어(-O0) 실제 배포 바이너리와 성능 특성이 완전히 다르고, 인라이닝·루프 최적화가 적용되지 않아 핫스팟이 엉뚱하게 보입니다.

# 최적화가 적용된 release 빌드로 측정
cargo build --release

다만 release 빌드는 디버그 심볼을 빼버려 프로파일에서 함수 이름이 보이지 않을 수 있습니다. Cargo.toml에서 release 프로파일에 심볼을 다시 켜주면 됩니다.

# 최적화는 유지하면서 디버그 심볼만 추가
[profile.release]
debug = true

cargo-flamegraph로 핫스팟 시각화

flamegraph는 호출 스택별로 소비한 시간을 가로 폭으로 보여주는 시각화입니다. 폭이 넓을수록 그 함수에서 시간을 많이 쓴 것이므로 최적화 대상을 한눈에 찾을 수 있습니다. cargo-flamegraph를 설치하면 한 명령으로 생성할 수 있습니다.

# 설치
cargo install flamegraph

# release 빌드로 실행하며 flamegraph.svg 생성
cargo flamegraph --release

# 인자가 필요한 바이너리라면 -- 뒤에 전달
cargo flamegraph --release -- --input data.txt

flamegraph는 한 번 읽는 법을 익히면 누적된 CPU 시간을 한눈에 보여줍니다. 가로 폭은 시간(넓을수록 그 함수에서 오래 머묾), 세로 높이는 호출 스택 깊이(위로 갈수록 더 안쪽에서 호출된 함수)입니다. 색은 보통 의미가 없고, 넓은 막대가 최적화 대상이라는 점만 기억하면 됩니다.

flamegraph 읽는 법 — 가로 폭은 누적 시간(넓을수록 그 함수에서 오래 머묾), 세로 높이는 호출 스택 깊이(위로 갈수록 더 안쪽 호출). 아래 main은 전체의 100%를 차지하고, 그 위로 갈라진 막대 중 가장 넓은 parse가 최적화 1순위다. 색은 대개 의미 없고 폭만 본다.

생성된 flamegraph.svg를 브라우저로 열면 넓은 막대(시간을 많이 쓴 함수)부터 살펴보며 최적화 우선순위를 정할 수 있습니다.

내부적으로 cargo-flamegraph는 Linux에서는 perf, macOS에서는 dtrace/Instruments 같은 OS 프로파일러를 호출합니다. 더 깊은 분석이 필요하면 Linux에서는 perf record/perf report를, macOS에서는 Xcode의 Instruments(Time Profiler)를 직접 사용해 CPU·메모리 동작을 자세히 들여다볼 수 있습니다.

마무리

dbg!와 RUST_BACKTRACE로 빠르게 값을 추적하고, 필요하면 rust-gdb/rust-lldb로 실행을 단계별로 멈춰 들여다봅니다. 성능은 느낌이 아니라 criterion으로 측정하고, cargo flamegraph로 핫스팟을 찾아 우선순위를 정합니다. 프로파일링은 항상 release 빌드로 한다는 원칙만 지키면 측정 자체가 거짓말을 하지 않습니다.

다음 학습

Rust로 하는 TDD — 테스트를 먼저 작성하며 안정적으로 코드를 키우는 방법
criterion의 비교 모드로 성능 회귀를 자동 감지하기
perf/Instruments로 캐시 미스·메모리 할당까지 파고들기
Rust Essential Curriculum — 전체 학습 로드맵 다시 보기