AI 적중 기록
MoneyBall Score AI가 얼마나 정확한지 솔직하게 공개합니다. 시즌 내 모든 검증 완료 예측 기준.
최종 업데이트: 2026년 5월 24일
검증 완료
109
경기
전체 적중률
49.5%
54/109 적중
Brier Score
0.245
낮을수록 좋음 (동전=0.25)
보정 오차
+4.1%p
과신 경향
최근 30일 AI 토론 사용률
83/107 AI 추론 활성 (78%)나머지 24건은 정량 모델만 사용했습니다 (AI 토론·사후분석 미적용). 보통 API 한도·일시 장애 영향이며, 적중 기록은 AI 토론이 적용된 예측만 사용합니다.
최근 정량 fallback: 5. 24. AM 11:20 KST
최근 예측 폼
검증 완료된 최근 20경기 순서. 왼쪽이 이전, 오른쪽이 최신.
신뢰도 vs 실제 적중률
AI가 60% 확신으로 예측하면 실제로 60%를 맞히는가? 대각선에 가까울수록 잘 보정된 AI입니다. 원 크기 ∝ 예측 건수. 세로 막대 = 95% 신뢰구간.
주별 적중률 트렌드
| 주차 | 예측 | 적중 | 적중률 |
|---|---|---|---|
| 4/13 주 | 11 | 9 | 81.8% |
| 4/20 주 | 26 | 11 | 42.3% |
| 4/27 주 | 25 | 9 | 36.0% |
| 5/4 주 | 27 | 15 | 55.6% |
| 5/11 주 | 13 | 6 | 46.2% |
| 5/18 주 | 7 | 4 | 57.1% |
요일별 적중률
KST 기준. 요일에 따라 예측 난이도가 다를 수 있습니다. 막대 높이 ∝ 적중률. 일요일은 과적합 방지를 위해 AI 신뢰도 상한 45%를 적용합니다.
AI 확신도별 분석
AI가 스스로 매긴 확신도 구간별 실제 적중률. 확신이 높을수록 맞아야 잘 보정된 모델.
낮은 확신
~55%
50%
33/66
보통 확신
55~65%
49%
21/43
역전 패턴 ⚠
높은 확신
65%~
—
데이터 없음
보통 확신 예측이 낮은 확신보다 적중률이 낮습니다. AI가 중간 구간에서 과보수하거나 어려운 경기를 중간 확신으로 표현하는 패턴입니다.
AI 모델 버전별 성과
가중치 버전별 예측 정확도. 실패에서 배우고 개선하는 AI 진화 기록.
| 버전 | 기간 | 경기 | 적중률 |
|---|---|---|---|
| v1.5 | 4/16~4/21 | 16 | 75%±21% |
| v1.6 | 4/22~5/3 | 46 | 37% |
| v1.7 | 5/5~5/12 | 32 | 53% |
| v1.8진행 중 | 5/13~5/24 | 15 | 53%±25% |
각 버전 표본이 작아 95% 신뢰구간이 넓습니다 (±14~21%p). 절대 수치보다 방향성 참고용입니다.
현 버전 (v1.8) 세부 분석
v1.8 가중치 안에서 AI 토론이 실제 활성화된 예측과 API 한도로 정량 fallback 처리된 예측을 분리. AI 토론 신뢰성을 별도 측정합니다.
AI 토론 활성
15건 (100%)model_version: v2.0-debate
53%
±25%p CI8/15 적중
정량 fallback
0건 (0%)API 한도/장애로 LLM 비활성
—
데이터 없음
AI 토론 사용률 = 100% (15/15). 표본이 작은 구간은 신뢰구간이 넓습니다 (±15~25%p).
팀별 예측 성과
경기 관련 팀 기준. 홈/원정 구분 없이 집계. N < 3 팀은 샘플 부족 표시.
| 팀 | 예측 | 적중 | 적중률 |
|---|---|---|---|
| 두산 | 23 | 14 | 60.9% |
| KT | 20 | 11 | 55.0% |
| KIA | 24 | 13 | 54.2% |
| NC | 24 | 12 | 50.0% |
| 한화 | 20 | 10 | 50.0% |
| LG | 21 | 10 | 47.6% |
| 롯데 | 19 | 9 | 47.4% |
| 삼성 | 20 | 9 | 45.0% |
| SSG | 23 | 10 | 43.5% |
| 키움 | 24 | 10 | 41.7% |
팀별 상대 강약 분석
각 팀 경기에서 AI가 어떤 상대팀을 만날 때 잘 맞추고 못 맞추는지 분석합니다. n=1 결과는 연하게 표시됩니다 (표본 1건). 홈/원정 적중률은 각 n을 함께 표시합니다.