4주차클로드 코드 효율 극대화하기요일

LLM 엔진 최적화와 컨텍스트 관리

1. LLM 엔진 최적화

클로드 코드를 더 효율적으로, 더 빠르게, 더 저렴하게 사용하려면 AI 모델 자체의 특성을 이해해야 합니다.

모델 선택 전략

모든 작업에 최고 성능 모델을 쓰는 것은 낭비입니다. 작업 유형에 따라 모델을 선택하세요:

  • claude-opus-4-5: 복잡한 아키텍처 설계, 어려운 버그 분석, 창의적인 문제 해결
  • claude-sonnet-4-5: 일반적인 코딩, 코드 리뷰, 리팩토링 (가장 균형적)
  • claude-haiku-4-5: 간단한 질문, 코드 포맷팅, 짧은 번역
# 빠른 작업은 Haiku로
claude --model claude-haiku-4-5 -p "이 함수에 JSDoc 주석 달아줘: $(cat utils.js)"

# 복잡한 설계는 Opus로
claude --model claude-opus-4-5
> 분산 시스템에서 일관성과 가용성의 트레이드오프를 고려한 이벤트 소싱 아키텍처를 설계해줘

컨텍스트 윈도우 효율적 사용

컨텍스트가 너무 길어지면 성능이 저하됩니다. 다음 전략을 사용하세요:

  • 관련 없는 파일은 @로 참조하지 말 것
  • 작업 완료 후 /clear로 컨텍스트 초기화
  • CLAUDE.md에 핵심 정보만 담아서 불필요한 설명 반복 제거
  • 큰 파일은 특정 줄 범위만 읽도록 요청
> src/api/routes.py 파일의 100-150번 줄만 읽고 분석해줘

프롬프트 캐싱 이해하기

클로드 API는 프롬프트 캐싱을 지원합니다. 같은 CLAUDE.md나 시스템 프롬프트를 반복적으로 보내면 캐시에서 읽어서 비용과 속도를 최적화합니다. 클로드 코드는 이를 자동으로 처리합니다.

/compact — 컨텍스트 압축

대화가 길어지면 클로드 코드는 성능이 저하됩니다. /compact로 대화를 요약하면 컨텍스트를 절약하면서 중요한 맥락을 유지할 수 있습니다:

/compact
# 선택적: 압축 시 유지할 내용 지정
/compact 인증 관련 결정사항과 현재 구현 중인 파일 목록은 반드시 유지해줘

빠른 작업을 위한 /fast 모드

토큰 스트리밍 속도를 높이는 모드입니다. 빠른 편집이나 간단한 작업에 활용하세요:

/fast    # 토글 — 빠른 출력 모드 활성화/비활성화

Extended Thinking 활용

복잡한 문제에는 클로드가 내부적으로 더 깊이 생각하는 Extended Thinking 모드를 활용할 수 있습니다:

> [복잡한 알고리즘 문제]
  충분한 시간을 들여서 최선의 해결책을 찾아줘.
  다양한 접근법을 검토하고 트레이드오프를 분석해줘.

비용 추적

인터랙티브 모드 종료 시 세션 요약에서 사용된 토큰과 비용을 확인할 수 있습니다. 비용이 걱정된다면:

  • 작업 완료 후 /clear로 즉시 컨텍스트 초기화
  • 단순 작업은 claude-haiku-4-5 모델 사용
  • 큰 파일 전체 참조보다 필요한 줄 범위만 참조

2. 메모리 시스템 활용

클로드 코드는 세션이 끝나면 대화를 기억하지 못합니다. 하지만 다양한 방법으로 "기억"을 구현할 수 있습니다.

CLAUDE.md가 메모리다

프로젝트와 관련된 중요한 결정, 규칙, 컨텍스트는 모두 CLAUDE.md에 기록합니다:

> 오늘 결정한 내용을 CLAUDE.md에 추가해줘:
  - 인증은 JWT 대신 세션 방식으로 결정
  - 이유: 모바일 앱에서 토큰 갱신 복잡도 때문
  - 결정 날짜: 2025-01-15

클로드 코드의 자동 메모리 시스템

클로드 코드는 ~/.claude/projects/ 디렉터리에 프로젝트별 메모리 파일을 자동으로 관리합니다:

> 오늘 대화에서 나온 중요한 결정들을 메모리에 저장해줘

저장된 메모리는 다음 세션에서도 불러올 수 있습니다.

외부 컨텍스트 파일 활용

긴 컨텍스트가 필요한 작업은 파일로 준비합니다:

# 요구사항 문서를 파일로 만들기
cat requirements.md | claude -p "이 요구사항을 분석해서 개발 태스크 목록을 만들어줘"

대화 내보내기

중요한 대화 내용은 파일로 저장해서 나중에 참조합니다:

# 터미널 스크롤백을 파일로 저장
script -q -c "claude" session.log

컨텍스트 압축 전략

대화가 길어지면 클로드 코드는 이전 내용을 자동으로 요약해서 컨텍스트를 압축합니다. 중요한 내용이 잘려나가는 것을 방지하려면 중요 결정이나 규칙은 대화 중에 CLAUDE.md에 바로 저장하세요.

> 지금까지 우리가 결정한 것들을 한 번 정리해서 CLAUDE.md에 추가해줘

3. 멀티 세션 전략

복잡한 작업을 하나의 긴 세션에서 처리하기보다, 명확한 목적을 가진 여러 세션으로 나누면 훨씬 효율적입니다.

세션 분리 패턴

# 세션 1: 탐색 (읽기 전용)
claude
> 현재 인증 시스템의 구조를 파악해줘. 코드는 수정하지 마.
# /clear 또는 종료

# 세션 2: 설계 (Plan 모드)
claude
> [이전 세션 결과 참조] 이 구조에서 OAuth를 추가하는 설계를 해줘.
# 설계를 파일로 저장 후 /clear

# 세션 3: 구현 (실행)
claude
> @docs/oauth-design.md 이 설계대로 구현해줘

/rewind — 실수 되돌리기

잘못된 방향으로 갔을 때 /rewind로 이전 상태로 돌아갈 수 있습니다:

/rewind    # 마지막 대화 턴을 취소하고 이전 상태로 복구

단, /rewind는 대화 히스토리만 되돌립니다. 이미 수정된 파일은 되돌아가지 않으므로 git을 병행 사용하세요.

내 메모
📝내 메모