예측 방법론
MoneyBall Score 의 KBO 승부예측은 직관이나 감으로 만들지 않습니다. 세 가지 데이터 소스에서 매일 자동 수집한 세이버메트릭스 지표 10개를 가중합산한 뒤, AI 에이전트 3개가 토론하여 최종 승률을 결정합니다. 매 경기 종료 후 실제 결과와 비교하여 적중률을 측정하고, 정해진 검증 표본이 쌓이면 가중치를 재조정합니다. 이 페이지는 그 전체 과정을 숨김없이 공개합니다.
1. 핵심 원칙 3가지
① 정량 우선
"어느 팀 분위기 좋다" 같은 직관 평가 X. 모든 예측은 측정 가능한 세이버메트릭스 지표로 환산됩니다.
② AI 토론 검증
정량 모델이 낸 1차 결과를 홈/원정 옹호 에이전트가 각자 변호하고, 심판 에이전트가 양측 주장을 비교하여 보정.
③ 실측 검증
매 경기 종료 후 적중률을 누적. 표본이 충분히 쌓이면 통계적으로 유의미한 항목만 가중치 조정에 반영.
2. 데이터 소스 3종
하나의 소스에 의존하지 않습니다. 같은 지표를 여러 출처에서 교차 확인하여 데이터 오류를 차단합니다.
KBO 공식 (koreabaseball.com)
경기 일정 · 결과 · 라이브 스코어경기 일정, 선발 투수 확정 시각, 최종 결과, 이닝별 점수를 공식 사이트에서 수집. 가장 권위 있는 원천 데이터.
KBO Fancy Stats (kbofancystats.com)
FIP · xFIP · WAR · wOBA · SFR · Elo세이버메트릭스 고급 지표의 주 원천. 분석 가중치 10팩터 중 7개를 이 소스에서 가져온다.
FanGraphs KBO (fangraphs.com/leaders/international/kbo)
wRC+ · ISO · BB%/K% (보조)메이저리그 분석으로 유명한 FanGraphs 의 KBO 섹션. 보조 검증용. 주 소스가 갱신 지연 시 대체 데이터로 활용.
※ statiz.co.kr 은 robots.txt 가 전체 차단되어 사용 불가.
3. 10팩터 가중합산 (v1.8)
각 팩터를 -1 ~ +1 범위로 정규화한 뒤 가중치를 곱해 합산합니다. 결과에 홈팀 어드밴티지 +1.5% 를 더하여 최종 승률 0 ~ 1 을 산출. 가중치 합계 = 85%.
| 팩터 | 가중치 |
|---|---|
| 선발 투수 FIP | 15% |
| 선발 투수 xFIP | 5% |
| 타선 wOBA | 15% |
| 불펜 FIP | 10% |
| 팀 전력 Elo | 10% |
| 최근 폼 (10경기) | 10% |
| 팀 WAR | 8% |
| 수비 SFR | 5% |
| 구장 보정 (Park Factor) | 4% |
| 상대 전적 | 3% |
홈팀 어드밴티지 +1.5% 는 2023 ~ 2026 시즌 N=2180 경기 데이터에서 측정한 홈 승률 51.93% 기반. 통계적 의미를 가지지 않을 만큼 작아 보수적으로 +1.5% 만 반영.
4. AI 에이전트 토론
정량 모델이 1차 승률을 계산한 뒤 Claude 3종 (Haiku × 2 + Sonnet × 1) 이 토론을 진행합니다.
홈팀 에이전트 (Haiku)
홈팀 입장에서 우호적인 지표를 강조. "선발 FIP 3.20 로 리그 상위 10%, 최근 5경기 4승" 등 옹호 논리 생성.
원정팀 에이전트 (Haiku)
원정팀 입장에서 우호적인 지표를 강조. 두 에이전트는 같은 raw 데이터 를 받지만 서로 다른 각도로 해석.
심판 에이전트 (Sonnet)
양측 주장을 비교 (Steelman 원칙) 하여 정량 모델 결과에 ±5% 보정. 승률을 0.15 ~ 0.85 범위로 제한 (극단 회피).
경기 종료 후 심판 판정 vs 실제 결과를 비교하여 사후 분석 (회고). 자주 틀리는 패턴은 팀별 메모리에 저장되어 다음 예측 시 프롬프트로 주입. 모델이 자기 실수를 학습하는 구조입니다.
5. 검증 방법
예측이 맞았나 틀렸나 단순히 세는 것 외에 통계적으로 정밀한 두 지표를 함께 사용합니다.
Brier Score
예측 승률과 실제 결과 (0 또는 1) 의 제곱 오차 평균. 낮을수록 ↑정확. 0.25 = 동전 던지기 수준, 0.20 이하 = 우수. 우리 모델 현재 0.246 (cycle 375 보정 이후 정상 계산).
Calibration
"70% 확신 한 예측 중 실제 70% 가 맞아야 정상." 신뢰도와 실제 적중률 의 일치도를 측정. /accuracy 페이지에서 SVG 차트로 공개.
매 예측의 입력 지표 · 예측 결과 · 실제 결과 · scoring_rule 버전이 모두 데이터베이스에 저장됩니다. 사용자는 예측 기록 페이지에서 과거 모든 예측을 검색 가능. 적중률 조작 X — 모든 결과가 공개됩니다.
6. 모델 진화 History
가중치는 고정 X. 누적 데이터로 통계적 유의미가 입증된 변경만 적용.
v1.0
2026-04 (초기)10 팩터 + 균등 가중 baseline. KBO 첫 시즌 적용.
v1.5
2026-04AI 에이전트 토론 통합 (홈/원정/심판 3-agent). Brier 0.255 → 0.243.
v1.6
2026-04 ~ 05park_factor 4% + sfr 5% 도입. 노이즈 영역 식별.
v1.7-revert
2026-05park_factor 가중치 일시 강화 후 적중률 ↓ 측정 → 원복 결정. 데이터 기반 의사결정 evidence.
v1.8
2026-05-12 ~ 현재head_to_head 5% → 3% (표본 부족 노이즈 인정) + elo 8% → 10% (정보가치 Δ +0.30 최강). Sunday cap 도입 — 일요일 0.55 초과 시 0.45 강등.
v2.0 (예정)
n=150 도달 후검증 표본 n=150 이상 누적 시 전면 가중치 재조정. 현재 119 누적 (cycle 542 측정).
7. 한계 + 면책
- 우천 취소, 선수 부상 교체, 신예 데뷔 등 사전 측정 불가능한 변수는 가중치에 반영되지 않습니다.
- KBO 한 시즌 720 경기 (정규 시즌) 의 표본은 메이저리그 (2430 경기) 의 1/3 수준. 통계 모델의 정밀도 한계가 명확.
- 예측은 통계 추정이며 결과를 보장하지 않습니다. 본 서비스는 스포츠 토토·베팅 안내가 아니며, 도박 관련 정보를 제공하지 않습니다.
- 데이터 소스 (KBO 공식 / Fancy Stats / FanGraphs) 가 갱신 지연 또는 장애 발생 시 일부 경기 예측이 누락될 수 있습니다.