본문 바로가기
MoneyBallScore

예측 방법론

MoneyBall Score 의 KBO 승부예측은 직관이나 감으로 만들지 않습니다. 세 가지 데이터 소스에서 매일 자동 수집한 세이버메트릭스 지표 10개를 가중합산한 뒤, AI 에이전트 3개가 토론하여 최종 승률을 결정합니다. 매 경기 종료 후 실제 결과와 비교하여 적중률을 측정하고, 정해진 검증 표본이 쌓이면 가중치를 재조정합니다. 이 페이지는 그 전체 과정을 숨김없이 공개합니다.

1. 핵심 원칙 3가지

① 정량 우선

"어느 팀 분위기 좋다" 같은 직관 평가 X. 모든 예측은 측정 가능한 세이버메트릭스 지표로 환산됩니다.

② AI 토론 검증

정량 모델이 낸 1차 결과를 홈/원정 옹호 에이전트가 각자 변호하고, 심판 에이전트가 양측 주장을 비교하여 보정.

③ 실측 검증

매 경기 종료 후 적중률을 누적. 표본이 충분히 쌓이면 통계적으로 유의미한 항목만 가중치 조정에 반영.

2. 데이터 소스 3종

하나의 소스에 의존하지 않습니다. 같은 지표를 여러 출처에서 교차 확인하여 데이터 오류를 차단합니다.

  • KBO 공식 (koreabaseball.com)

    경기 일정 · 결과 · 라이브 스코어

    경기 일정, 선발 투수 확정 시각, 최종 결과, 이닝별 점수를 공식 사이트에서 수집. 가장 권위 있는 원천 데이터.

  • KBO Fancy Stats (kbofancystats.com)

    FIP · xFIP · WAR · wOBA · SFR · Elo

    세이버메트릭스 고급 지표의 주 원천. 분석 가중치 10팩터 중 7개를 이 소스에서 가져온다.

  • FanGraphs KBO (fangraphs.com/leaders/international/kbo)

    wRC+ · ISO · BB%/K% (보조)

    메이저리그 분석으로 유명한 FanGraphs 의 KBO 섹션. 보조 검증용. 주 소스가 갱신 지연 시 대체 데이터로 활용.

※ statiz.co.kr 은 robots.txt 가 전체 차단되어 사용 불가.

3. 10팩터 가중합산 (v1.8)

각 팩터를 -1 ~ +1 범위로 정규화한 뒤 가중치를 곱해 합산합니다. 결과에 홈팀 어드밴티지 +1.5% 를 더하여 최종 승률 0 ~ 1 을 산출. 가중치 합계 = 85%.

팩터가중치
선발 투수 FIP15%
선발 투수 xFIP5%
타선 wOBA15%
불펜 FIP10%
팀 전력 Elo10%
최근 폼 (10경기)10%
팀 WAR8%
수비 SFR5%
구장 보정 (Park Factor)4%
상대 전적3%

홈팀 어드밴티지 +1.5% 는 2023 ~ 2026 시즌 N=2180 경기 데이터에서 측정한 홈 승률 51.93% 기반. 통계적 의미를 가지지 않을 만큼 작아 보수적으로 +1.5% 만 반영.

4. AI 에이전트 토론

정량 모델이 1차 승률을 계산한 뒤 Claude 3종 (Haiku × 2 + Sonnet × 1) 이 토론을 진행합니다.

홈팀 에이전트 (Haiku)

홈팀 입장에서 우호적인 지표를 강조. "선발 FIP 3.20 로 리그 상위 10%, 최근 5경기 4승" 등 옹호 논리 생성.

원정팀 에이전트 (Haiku)

원정팀 입장에서 우호적인 지표를 강조. 두 에이전트는 같은 raw 데이터 를 받지만 서로 다른 각도로 해석.

심판 에이전트 (Sonnet)

양측 주장을 비교 (Steelman 원칙) 하여 정량 모델 결과에 ±5% 보정. 승률을 0.15 ~ 0.85 범위로 제한 (극단 회피).

경기 종료 후 심판 판정 vs 실제 결과를 비교하여 사후 분석 (회고). 자주 틀리는 패턴은 팀별 메모리에 저장되어 다음 예측 시 프롬프트로 주입. 모델이 자기 실수를 학습하는 구조입니다.

5. 검증 방법

예측이 맞았나 틀렸나 단순히 세는 것 외에 통계적으로 정밀한 두 지표를 함께 사용합니다.

Brier Score

예측 승률과 실제 결과 (0 또는 1) 의 제곱 오차 평균. 낮을수록 ↑정확. 0.25 = 동전 던지기 수준, 0.20 이하 = 우수. 우리 모델 현재 0.246 (cycle 375 보정 이후 정상 계산).

Calibration

"70% 확신 한 예측 중 실제 70% 가 맞아야 정상." 신뢰도와 실제 적중률 의 일치도를 측정. /accuracy 페이지에서 SVG 차트로 공개.

매 예측의 입력 지표 · 예측 결과 · 실제 결과 · scoring_rule 버전이 모두 데이터베이스에 저장됩니다. 사용자는 예측 기록 페이지에서 과거 모든 예측을 검색 가능. 적중률 조작 X — 모든 결과가 공개됩니다.

6. 모델 진화 History

가중치는 고정 X. 누적 데이터로 통계적 유의미가 입증된 변경만 적용.

  • v1.0

    2026-04 (초기)

    10 팩터 + 균등 가중 baseline. KBO 첫 시즌 적용.

  • v1.5

    2026-04

    AI 에이전트 토론 통합 (홈/원정/심판 3-agent). Brier 0.255 → 0.243.

  • v1.6

    2026-04 ~ 05

    park_factor 4% + sfr 5% 도입. 노이즈 영역 식별.

  • v1.7-revert

    2026-05

    park_factor 가중치 일시 강화 후 적중률 ↓ 측정 → 원복 결정. 데이터 기반 의사결정 evidence.

  • v1.8

    2026-05-12 ~ 현재

    head_to_head 5% → 3% (표본 부족 노이즈 인정) + elo 8% → 10% (정보가치 Δ +0.30 최강). Sunday cap 도입 — 일요일 0.55 초과 시 0.45 강등.

  • v2.0 (예정)

    n=150 도달 후

    검증 표본 n=150 이상 누적 시 전면 가중치 재조정. 현재 119 누적 (cycle 542 측정).

7. 한계 + 면책

  • 우천 취소, 선수 부상 교체, 신예 데뷔 등 사전 측정 불가능한 변수는 가중치에 반영되지 않습니다.
  • KBO 한 시즌 720 경기 (정규 시즌) 의 표본은 메이저리그 (2430 경기) 의 1/3 수준. 통계 모델의 정밀도 한계가 명확.
  • 예측은 통계 추정이며 결과를 보장하지 않습니다. 본 서비스는 스포츠 토토·베팅 안내가 아니며, 도박 관련 정보를 제공하지 않습니다.
  • 데이터 소스 (KBO 공식 / Fancy Stats / FanGraphs) 가 갱신 지연 또는 장애 발생 시 일부 경기 예측이 누락될 수 있습니다.

더 알아보기