예측 방법론

MoneyBall Score 의 KBO 승부예측은 직관이나 감으로 만들지 않습니다. 세 가지 데이터 소스에서 매일 자동 수집한 세이버메트릭스 지표 10개를 가중합산한 뒤, AI 에이전트 3개가 토론하여 최종 승률을 결정합니다. 매 경기 종료 후 실제 결과와 비교하여 적중률을 측정합니다. n=150 검증 표본 임계 달성 완료 — v1.8 유지 확정 (2026-07-06). 이 페이지는 그 전체 과정을 숨김없이 공개합니다.

1. 핵심 원칙 3가지

① 정량 우선

"어느 팀 분위기 좋다" 같은 직관 평가 X. 모든 예측은 측정 가능한 세이버메트릭스 지표로 환산됩니다.

② AI 토론 검증

정량 모델이 낸 1차 결과를 홈/원정 옹호 에이전트가 각자 변호하고, 심판 에이전트가 양측 주장을 비교하여 보정.

③ 실측 검증

매 경기 종료 후 적중률을 누적. 누적 표본 n=178 달성 + v1.8 유지 확정 (2026-07-06). 실시간 적중률 /accuracy 참조.

2. 데이터 소스 3종

하나의 소스에 의존하지 않습니다. 같은 지표를 여러 출처에서 교차 확인하여 데이터 오류를 차단합니다.

KBO 공식 (koreabaseball.com)
경기 일정 · 결과 · 라이브 스코어
경기 일정, 선발 투수 확정 시각, 최종 결과, 이닝별 점수를 공식 사이트에서 수집. 가장 권위 있는 원천 데이터.
KBO Fancy Stats (kbofancystats.com)
선발 FIP · 선발 xFIP · 타선 wOBA · 불펜 FIP · 팀 WAR · Elo 레이팅 · 수비 SFR
세이버메트릭스 고급 지표의 주 원천. 분석 가중치 10팩터 중 7개를 이 소스에서 가져온다.
FanGraphs KBO (fangraphs.com/leaders/international/kbo)
wRC+ · ISO · BB%/K% (보조)
메이저리그 분석으로 유명한 FanGraphs 의 KBO 섹션. 보조 검증용. 주 소스가 갱신 지연 시 대체 데이터로 활용.

※ statiz.co.kr 은 robots.txt 가 전체 차단되어 사용 불가.

3. 10팩터 가중합산 (v1.8)

각 팩터를 -1 ~ +1 범위로 정규화한 뒤 가중치를 곱해 합산합니다. 결과에 홈팀 어드밴티지 +1.5% 를 더하여 최종 승률 0 ~ 1 을 산출. 가중치 합계 = 85%.

팩터	가중치	도입 근거
선발 FIP	15%	선발이 게임 전체 흐름의 절반 이상을 만든다. FIP 는 운/수비 영향을 제거한 투수 본인 실력이라 다음 등판 예측에 ERA 보다 정확.
선발 xFIP	5%	FIP 의 홈런 변동성을 정규화한 보조 지표. 시즌 후반으로 갈수록 신뢰도가 ↑.
타선 wOBA	15%	단타·2루타·홈런·볼넷 각각에 가중치를 둔 종합 타격 생산성. 타율보다 득점 기여도와 강한 상관.
불펜 FIP	10%	선발 강판 후 경기 결과를 좌우. 불펜 평균자책점 (RA) 은 수비 운에 흔들리니 FIP 사용.
Elo 레이팅	10%	체스에서 유래한 상대적 전력. 강팀을 이기면 많이 오르고 약팀에 지면 많이 내려간다. KBO Fancy Stats Elo 와 비교하여 우리 모델 성능을 검증.
최근 폼	10%	시즌 전체 성적보다 현재 팀 컨디션을 반영. 부상자 복귀·trade 후 변화도 빠르게 잡힌다.
팀 WAR	8%	Wins Above Replacement. 대체 선수 대비 팀 승리 기여도 총합. 시즌 전체 누적 전력 척도.
수비 SFR	5%	Skill-based Fielding Runs. 수비 능력을 점수로 환산. 운/구장 효과 분리.
구장 보정	4%	잠실 (투수 친화) ↔ 사직 (타자 친화) 같은 구장별 득점 환경 차이를 보정.
상대 전적	3%	두 팀 시즌 내 맞대결 기록. 분석에서 가장 작은 가중치 — 표본이 작아 노이즈가 크다는 사실을 누적 데이터로 확인.

홈팀 어드밴티지 +1.5% 는 2023 ~ 2026 시즌 N=2180 경기 데이터에서 측정한 홈 승률 51.93% 기반. 통계적 의미를 가지지 않을 만큼 작아 보수적으로 +1.5% 만 반영.

4. AI 에이전트 토론

정량 모델이 1차 승률을 계산한 뒤 Claude 3종 (Haiku × 2 + Sonnet × 1) 이 토론을 진행합니다.

홈팀 에이전트 (Haiku)

홈팀 입장에서 우호적인 지표를 강조. "선발 FIP 3.20 로 리그 상위 10%, 최근 5경기 4승" 등 옹호 논리 생성.

원정팀 에이전트 (Haiku)

원정팀 입장에서 우호적인 지표를 강조. 두 에이전트는 같은 raw 데이터 를 받지만 서로 다른 각도로 해석.

심판 에이전트 (Sonnet)

양측 주장을 비교 (Steelman 원칙) 하여 정량 모델 결과에 ±5% 보정. 승률을 0.15 ~ 0.85 범위로 제한 (극단 회피).

경기 종료 후 심판 판정 vs 실제 결과를 비교하여 사후 분석 (회고). 자주 틀리는 패턴은 팀별 메모리에 저장되어 다음 예측 시 프롬프트로 주입. 모델이 자기 실수를 학습하는 구조입니다.

5. 검증 방법

예측이 맞았나 틀렸나 단순히 세는 것 외에 통계적으로 정밀한 두 지표를 함께 사용합니다.

Brier Score

예측 승률과 실제 결과 (0 또는 1) 의 제곱 오차 평균. 낮을수록 ↑정확. 0.25 = 동전 던지기 수준, 0.20 이하 = 우수. 실측치는 /accuracy 페이지 참조.

Calibration

"70% 확신 한 예측 중 실제 70% 가 맞아야 정상." 신뢰도와 실제 적중률 의 일치도를 측정. /accuracy 페이지에서 SVG 차트로 공개.

매 예측의 입력 지표 · 예측 결과 · 실제 결과 · scoring_rule 버전이 모두 데이터베이스에 저장됩니다. 사용자는 예측 기록 페이지에서 과거 모든 예측을 검색 가능. 적중률 조작 X — 모든 결과가 공개됩니다.

6. 모델 진화 History

가중치는 고정 X. 누적 데이터로 통계적 유의미가 입증된 변경만 적용.

v1.0
2026-04 (초기)
10 팩터 + 균등 가중 baseline. KBO 첫 시즌 적용.
v1.5
2026-04
AI 에이전트 토론 통합 (홈/원정/심판 3-agent). Brier 0.255 → 0.243.
v1.6
2026-04 ~ 05
park_factor 4% + sfr 5% 도입. 노이즈 영역 식별.
v1.7-revert
2026-05
park_factor 가중치 일시 강화 후 적중률 ↓ 측정 → 원복 결정. 데이터 기반 의사결정 evidence.
v1.8
2026-05-12 ~ 현재
head_to_head 5% → 3% (표본 부족 노이즈 인정) + elo 8% → 10% (정보가치 Δ +0.30 최강). Sunday cap 도입 — 일요일 0.55 초과 시 0.45 강등.
v2.0 (v2.1-B rejected — v1.8 유지 확정)
n=150 crossed — 2026-07-06 결정
임계 n=150 달성 완료 + v2.1-B shadow rejected (Brier 0.4635, n=52) — home_win_prob Brier 0.24 pre/post 안정 (calibration 정상), 전면 재조정 불필요. v1.8 유지 확정. 실시간 적중률 /accuracy 참조.

7. 한계 + 면책

우천 취소, 선수 부상 교체, 신예 데뷔 등 사전 측정 불가능한 변수는 가중치에 반영되지 않습니다.
KBO 한 시즌 720 경기 (정규 시즌) 의 표본은 메이저리그 (2430 경기) 의 1/3 수준. 통계 모델의 정밀도 한계가 명확.
예측은 통계 추정이며 결과를 보장하지 않습니다. 본 서비스는 스포츠 토토·베팅 안내가 아니며, 도박 관련 정보를 제공하지 않습니다.
데이터 소스 (KBO 공식 / Fancy Stats / FanGraphs) 가 갱신 지연 또는 장애 발생 시 일부 경기 예측이 누락될 수 있습니다.

예측 방법론

1. 핵심 원칙 3가지

① 정량 우선

② AI 토론 검증

③ 실측 검증

2. 데이터 소스 3종

KBO 공식 (koreabaseball.com)

KBO Fancy Stats (kbofancystats.com)

FanGraphs KBO (fangraphs.com/leaders/international/kbo)

3. 10팩터 가중합산 (v1.8)

4. AI 에이전트 토론

홈팀 에이전트 (Haiku)

원정팀 에이전트 (Haiku)

심판 에이전트 (Sonnet)

5. 검증 방법

Brier Score

Calibration

6. 모델 진화 History

v1.0

v1.5

v1.6

v1.7-revert

v1.8

v2.0 (v2.1-B rejected — v1.8 유지 확정)

7. 한계 + 면책

더 알아보기

소개

용어 사전

적중률

AI 인사이트