변경 로그

MoneyBall Score 의 모델·기능·운영 변경을 사이클 단위로 모두 공개합니다. 가중치 튜닝의 근거, 적중률 분석 결과, 신규 기능과 SEO·AdSense 보강까지 한 페이지에서 시간 역순으로 확인할 수 있습니다.

총 변경 항목: 89건
사이클 기록: 50건
최근 갱신: 2026-07-07

🔁 재사용 가능 패턴 — 2026-07-07 extract-pattern (cycle 1499)
2026-07-07cycle 1499
P1: LLM Provider CREDIT_EXHAUSTED 자동 failover ai_agent
Problem: Anthropic API credit 소진 → 예측이 conf=0.3 flat 으로 silently degraded. 22일 감지 지연 (2026-06-06~06-28).
Solution: LLM_BACKEND_FALLBACK=deepseek|ollama env 설정 + callLLM() 안 CREDIT_EXHAUSTED 체크 후 secondary backend 자동 재시도 + Sentry warning 캡처.
Results: 운영자 개입 없이 자동 복구. Sentry warning alert 즉각 발화.
재사용: Anthropic API 사용하는 모든 LLM 파이프라인. env 2개 설정만으로 활성화.
P2: LLM 백엔드 관측성 레이어 (DB 컬럼 + 이벤트 테이블) ai_agent
Problem: primary vs fallback LLM 품질 차이 측정 불가. Brier drift 원인 진단 불가.
Solution: predictions.llm_backend VARCHAR(16) + llm_fallback_events 이벤트 테이블 (ts, model, fallback_to, pipeline_run_id FK).
Results: pre/post-CE Brier 코호트 분리 (Fable S2c — 0.24/0.24 안정). winner-centric Brier drift = 측정 오류 확인.
재사용: 멀티 백엔드 LLM 파이프라인 모두. 컬럼 1개 + 이벤트 테이블 1개로 완전 관측성.
P3: LLM 다운그레이드 구간 UI — 팩터 배지 폴백 content_auto
Problem: CE 구간 conf=0.3 flat → 분석 UI 에 근거 없음 → 사용자 가치 0.
Solution: factors 컬럼에서 |score - 0.5| 기준 상위 2개 팩터를 UI 배지로 렌더링 (debate 없어도 항상 표시).
Results: LLM 다운타임 중 정량 분석 근거 유지. UX graceful degradation.
재사용: confidence score 기반 예측 UI. LLM outage 구간 폴백 패턴.
Anti-P1: conf=0.3 flat 무음 감지 지연 anti_pattern
Problem: CREDIT_EXHAUSTED → conf=0.3 + agentError 텍스트만 → 알림 없음 → 22일 미감지.
Root cause: 파이프라인 외형 정상 (예측 생성 + 검증 진행) → alert 미발화. "degraded but working" = 가장 감지 어려운 패턴.
Fix: conf histogram 이상치 (conf=0.3 비율 > 80% in 7일) Sentry alert 추가 권장.
📊 주간 리뷰 — 2026-W27 (06-29~07-05) / 2026-07-07 weekly-review
2026-07-07
이번 주 성과 요약
| 지표 | 수치 | |---|---| | 총 예측 (검증 완료) | 22 경기 | | 정확도 | 54.5% (12/22) | | CREDIT_EXHAUSTED 비율 | 20/22 (91%) | | CE 전용 정확도 (conf=0.3) | 60.0% (12/20) | | 정상 debate 정확도 | 0/2 (소표본) |
요일별 패턴
| 날짜 | 결과 | 비고 | |---|---|---| | 07-01 (수) | 0/4 (0%) | 2게임 normal debate (둘 다 틀림) | | 07-02 (목) | 5/5 (100%) | CE fallback 전 | | 07-03 (금) | 2/5 (40%) | | | 07-04 (토) | 3/5 (60%) | | | 07-05 (일) | 2/3 (67%) | |
팩터 인사이트
SFR(수비) 역신호 관찰 (단기, n=22):
- 틀린 예측에서 SFR >0.5(예측팀 수비 우위) 비율: 80%
- 맞춘 예측에서 SFR >0.5 비율: 33%
- 해석: SFR이 높은 팀을 예측했을 때 오히려 더 틀림 → 단기 노이즈 가능성 높음 (n=22)
나머지 팩터: elo / bullpen / lineup_woba → 맞춘/틀린 간 차이 미미 (±0.005 이내)
가중치 조정 결정
변경 없음 — v1.8 유지 (cycle 1460 확정, n=178 재입증 근거)
- 이번 주 54.5%는 전체 baseline(60.9%) 대비 -6.4pp
- 원인: CREDIT_EXHAUSTED 20/22 → debate 없는 quantitative-only 주
- CE 전용 정확도(60.0%)는 오히려 baseline 근접 → 모델 자체 이상 없음
- SFR 역신호는 1주 n=22 데이터로 결론 불가 (threshold: n≥50 필요)
CREDIT_EXHAUSTED 상태 (2026-06-06~)
31일+ 지속 중. 사용자 Anthropic 크레딧 충전 시 debate 복구 + accuracy 재확인 예정.
🎯 v1.8 유지 확정 결정 — n=178 임계 달성 (2026-07-06, cycles 1447/1450/1460)
2026-07-06
배경
v1.8 (10팩터, 3소스) 는 2026-05-13 (cycle 355) 론칭 후 pre_game verified 예측 축적 시작. v2.0 upgrade 임계는 n=150 — 세이버메트릭스 신뢰 구간 확보 표본 수. 42 cycle 만에 3 milestone 순차 도달. ← 최종 결정: cycle 1460 v1.8 유지 확정 (n=178 재입증, Brier DEFAULT 0.2443 vs Learned 0.2458, 차이 0.15% < 1pp) → v2.0 upgrade 불필요.
3 milestone 순차 도달
cycle 1447 (2026-07-03) — n=161 첫 crossing:
- v1.8 cohort n=150 threshold 첫 crossed (velocity 회복 ~0.87/cycle after phase 13-14 flatline)
- 실측 acc 60.9%, Brier 0.2714 → 0.2995 (calibration drift 관찰)
- v2.1-B shadow n=52 / 51.9% / Brier 0.4635 = 즉시 reject
cycle 1450 (2026-07-03) — 51th skill-evolution milestone (반세기+1):
- trigger 3 단독 발화 (cycle_n % 50 == 0)
- 20 consecutive milestone metric-only pattern 유지
- silent drift family streak 992 cycle (cycle 458~1450, wave 186 시점)
cycle 1460 (2026-07-06) — v1.8 유지 확정 최종 결정:
- plan #16 2차 fire — expanding window OOS n=27→178 재입증
- Brier DEFAULT 0.2443 vs Learned 0.2458 (최대 차이 0.15% < 1pp 임계)
- Fable plan 진단: post-CREDIT_EXHAUSTED (2026-06-06~) Brier drift = 측정 오류 (Fable S2c evidence, home_win_prob Brier pre/post = 0.24/0.24 안정)
- 최종 결정: v1.8 유지. 전면 가중치 재조정 불필요.
정합 sweep (waves 186~196, cycle 1459~1463)
silent drift family sweep 11 wave 순차 정합:
| Wave | Cycle | Surface | 정합 결과 | |---|---|---|---| | 186 | 1459 | fix(test): /accuracy guard | methodology v2.0 block 복원 | | 188 | 1459 | CI red 복원 | 후속 | | 192 | 1458 | v2.0 "재조정 결정 대기" | v1.8 유지 확정 정합 | | 193 | 1459 | CF Worker cron fire count + role count | 실제 값 정합 | | 194 | 1461 | CLAUDE.md v2.0 calibration | v1.8 유지 확정 정합 | | 195 | 1462 | packages/ src comments v2.0 | v1.8 유지 확정 정합 | | 196 | 1463 | TODOS.md/memory/dashboard v2.0 tracking | v1.8 유지 확정 정합 |
v2.1-B rejected 근거
- N=52 소표본 → n=150 임계 미달
- Brier 0.4635 = DEFAULT (0.2443) 대비 2배 열화
- 가중치 re-fit = 소진된 카드 (v2.1-B 증거)
CREDIT_EXHAUSTED 상태 (2026-06-06~)
- debate.ts judge LLM Anthropic credit 소진 → 100% fallback → confidence=0.3 flat
- 22일간 감지 지연 (cycle 1400 P2 패턴 lesson)
- pre_game Brier 정상 (home_win_prob 기반), post-CREDIT_EXHAUSTED winner-centric Brier drift = 측정 오류
- 사용자 영역: Anthropic 크레딧 충전 pending
v1.8 유지 확정의 의미
- 42 cycle × 178 예측 축적 = 세이버메트릭스 신뢰 구간 확보 첫 사례
- 정량 evidence 기반 결정 (Brier / accuracy 실측) — 직관 배제
- 다음 upgrade 결정 = 새 데이터 소스 또는 팩터 발견 시. 표본 수 재조건 X
재사용 가능: ✅ 다요인 예측 모델의 upgrade 판단 = 표본 수 임계 + Brier delta < 1pp = 유지 확정. re-fit 은 새 신호 발견 시만.
🔬 패턴 추출 — cycle 1422 (2026-06-30)
2026-06-30cycle 1422
P5 — Team-Level Quantitative Overconfidence (data_pipeline / operational_analysis)
Problem: 다요인 예측 모델에서 특정 팀의 정량 스탯(FIP/xFIP/Elo/wOBA)이 실제 시즌 성적보다 과도하게 우수하게 나타날 때, 모델이 해당 팀을 체계적으로 over-predict. 증상: v1.8 SSG 랜더스 예측 1/8 = 12% (거의 역예측 수준). 잘못된 예측 8건 중 7건이 SSG를 이긴다고 예측했으나 상대팀이 승.
Solution:
- teamAccuracyRate(predictions, teamId) — 팀별 예측 적중률 집계
- 임계 플래그: model_win_rate(team) > actual_win_rate(team) + 0.20 = overconfidence 경고
- 이번 SSG 케이스: 모델이 SSG를 약 60% 확률로 예측 → 실제 시즌 승률은 ~40%대 추정
- 팀별 보정 계수(team_bias_correction) 적용 후속 검토 (v1.8 유지 확정 별도 layer, cycle 1460)
Results: W26 발견 (n=8 소표본). n=178 임계 달성 후 v1.8 유지 확정 (cycle 1447/1460) — 전 팀 체계적 측정은 팀별 표본 확보 후 별도 진행. 지금은 관찰 마커만 박제.
재사용 가능: ✅ 모든 스포츠 예측 모델. 팩터 기반 모델에서 개별 팀/선수의 "정량-성과 乖離"는 systematic bias 원인 1순위.
P6 — Weekend Recovery Pattern (operational_analysis)
Problem: 토요일(Sat) 이변 집중 → 일요일(Sun) 완벽 회복 패턴이 KBO 시즌 데이터에서 반복. v1.8 이번 주: 토 1/5 = 20% → 일 5/5 = 100%. 누적 요일별: 토 52% vs 일 71%.
Root cause 가설: 4연전 구조(화~일)에서 3차전(토)이 심리적 분기점 — 홈 3연패 시 원정 흐름 급전환. 4차전(일) = 정규화.
Solution:
- 요일 보정 계수 DAY_OF_WEEK_WEIGHT 상수 후보 (v1.8 유지 확정 후속 별도 layer, cycle 1460)
- 토요일 예측 신뢰도 티어 하향 (-5% 보정) 검토
- 일요일: 보정 불필요 (71% = 전체 평균 이상)
Results: 관찰 패턴 박제. n=178 임계 달성 (cycle 1447) 후 v1.8 유지 확정 — 요일 단위 통계 유의성은 요일별 표본 확보 (현 N=25 소표본) 후 재검증.
재사용 가능: ✅ 연속 시리즈 구조를 가진 모든 스포츠. NBA 홈/원정 back-to-back, MLB 3~4게임 시리즈에도 동일 패턴 존재 가능.
🔬 패턴 추출 — cycle 1400 (2026-06-27)
2026-06-27cycle 1400
P1 — Neutral-Factor Sparse Detection (ai_agent / data_pipeline)
Problem: normalize() 가 homeVal==awayVal 시 0.5 반환. 10팩터 중 5+가 0.5이면 동전던지기 품질 예측이지만 파이프라인은 구별 못 하고 조용히 통과.
Solution:
- countNeutralFactors(factors) — pure 함수, 0.5 exact 카운트
- PREDICTION_SPARSE_THRESHOLD = 5 — 50% neutral 임계
- captureSparsePredictionAlert() — Sentry warning 별도 채널 (z-score 채널 / silent-drift-family 채널과 분리)
- 7 guard tests in prediction-sparse.test.ts
Results: predict() 호출부가 ≥5 neutral 시 즉시 Sentry 알림. 시스템 정지 X (non-blocking .catch(() => {})).
재사용 가능: ✅ 모든 multi-factor 예측 시스템에 적용 가능. threshold는 factor 수 × 50% 기준.
P2 — Silent LLM Fallback Masking (anti_pattern)
Problem: debate.ts의 judgeResult.data || fallback 패턴 — judge LLM 실패 시 confidence=0.3 + 정량 모델 결과로 조용히 대체. 22일간 (2026-06-06~) 감지 안 됨. pipeline_runs.errors=[] (정상처럼 보임).
신호: confidence=0.3 flat (모든 예측 동일값) — DB 집계로만 탐지 가능.
Fix 방향: evaluateAndCaptureAgentFallback() 이미 존재하나 Sentry에 전달 X. 별도 scout issue로 박제 필요.
재사용 가능: ✅ LLM-in-pipeline 패턴에서 data || fallback 은 항상 anti-pattern. fallback 발화 시 반드시 alerting 채널 연결.
P3 — Registry Sweep Wave (quality_guard)
Problem: Literal strings/numbers 산포 — 한 곳 변경 시 나머지 stale. grep으로만 식별 가능.
Solution: 1 wave = 1 grep pattern → 해당 리터럴 → @moneyball/shared 상수화 → guard test. 현황: wave 163개 누적 (cycle 1350~1400: wave 153-163 = 11 waves).
패턴 규칙:
- 파일 3+ = wave 트리거
- 상수화 후 guard test 의무 (wave 156, 163 교훈)
- guard test 빠진 상수 = 다음 cycle 즉시 follow-up (cycle 1398 패턴)
재사용 가능: ✅ 모든 모노레포에 적용 가능. shared 패키지 + grep-driven wave 방식.
P4 — Alert Cascade by Pipeline Mode (data_pipeline)
Problem: 각 cron mode (predict_final, verify, postview, sparse) 가 silent drop 시 별도 채널 없음 — console.log만 존재.
Solution: shouldAlertSilentDrift(meta) — mode별 분기 + Sentry warning. 현황: predict_final → verify → postview → sparse = 4 coverage layer 누적.
확장 원칙: 새 mode 추가 시 silent-drift-alert.ts 에 분기 1개 추가 = 자연 확장.
재사용 가능: ✅ 모든 multi-mode 데이터 파이프라인 (ETL / ML inference / 검증 등).
📊 주간 리뷰 2026-W26 완성 (2026-06-23 ~ 2026-06-28, cycle 1421)
2026-06-23cycle 1421
> cycle 1400 부분 작성 (화~금) → cycle 1421 완성 (토+일 추가, n=127 갱신)
주간 성과 요약
| 지표 | 값 | |---|---| | 이번 주 적중률 (v1.8) | 70.0% (21/30, 6일 전체) | | 토 (6/27) | 1/5 = 20% (주간 최저, 4개 이변) | | 일 (6/28) | 5/5 = 100% (완벽) | | 누적 v1.8 | 59.1% (75/127) | | 가중치 조정 | 보류 (n=150 미달, 잔여 23건) ← stale: n=178 달성, v1.8 유지 확정 (cycle 1460) |
요일별 적중률
| 요일 | 결과 | |---|---| | 화 (6/23) | 3/5 = 60% | | 수 (6/24) | 4/5 = 80% | | 목 (6/25) | 4/5 = 80% | | 금 (6/26) | 4/5 = 80% | | 토 (6/27) | 1/5 = 20% ← 이변 집중 | | 일 (6/28) | 5/5 = 100% ← 완벽 회복 |
예측 실패 9경기
화~금 (5건) 1. 6/23 한화 vs 두산 — 두산 예측 → 한화 3:2 승 (홈 한화) 2. 6/23 LG vs 삼성 — 삼성 예측 → LG 4:3 승 (홈 LG) 3. 6/24 KT vs SSG — KT 예측 → SSG 원정 승 4. 6/25 롯데 vs NC — 롯데 예측 → NC 원정 8:2 승 5. 6/26 SSG vs 한화 — SSG 예측 → 한화 원정 9:2 승
토요일 이변 집중 (4건) 6. 6/27 SSG vs 한화 — SSG 예측 → 한화 원정 8:1 승 (3연승 한화) 7. 6/27 두산 vs KIA — KIA 예측 → 두산 홈 8:1 승 8. 6/27 롯데 vs LG — 롯데 예측 → LG 원정 8:7 승 9. 6/27 NC vs 키움 — NC 예측 → 키움 원정 3:1 승
핵심 발견
1. SSG 예측 취약 (v1.8 전체 1/8 = 12%)
- 이번 주: 한화전 3경기 모두 SSG 예측 → 3경기 모두 한화 승
- v1.8 전체: SSG 예측 시 적중 1건/8경기 = 거의 역예측 수준
- 원인 가설: SSG 정량 스탯(FIP/xFIP/Elo)이 현 시즌 실제 성적보다 과도하게 우수 → 모델 overconfidence
- SSG 관련 팩터 별도 검토 필요 (v1.8 유지 확정 후속 별도 layer, cycle 1460)
2. 토요일 이변 패턴 (4/5 = 80% 실패)
- 4개 경기 모두 원정팀 승리 (홈 어드밴티지 무력화)
- 패턴: 4연전 3차전(토요일) 홈팀 심리적 피로 + 원정 반격?
- v1.8 누적 토요일: 13/25 = 52% (평균 이하)
3. judge-agent 토론 24일째 비활성 (→ cycle 1421 기준)
- 2026-06-06 이후 모든 예측 confidence=0.30 (fallback 고정)
- 정량 모델 단독 이번 주 70% — 여전히 기준선 이상
- fix-incident 후속 대상 (판단 LLM 실패 원인 조사)
4. LG 예측 강점 (9/11 = 82%)
- v1.8 전체 팀별 최고 적중률
- LG 정량 스탯과 실제 성과가 잘 일치하는 팀
팀별 예측 적중률 (v1.8 전체, 8+ 게임)
| 팀 | 적중률 | n | |---|---|---| | LG 트윈스 | 82% | 11 | | 삼성 라이온즈 | 70% | 20 | | KIA 타이거즈 | 67% | 18 | | NC 다이노스 | 57% | 14 | | 두산 베어스 | 56% | 18 | | 롯데 자이언츠 | 50% | 14 | | KT 위즈 | 50% | 10 | | SSG 랜더스 | 12% | 8 ← 주의 |
v1.8 누적 cohort
| 시점 | n | 정확도 | |---|---|---| | cycle 1340 측정 | 118 | 58.5% | | cycle 1400 (6/27) | 117 | 59.0% | | cycle 1421 (6/30) | 127 | 59.1% |
- 잔여 23경기 → v2.0 임계 n=150 (ETA: 약 4.6일, velocity ~5/day 추정) ← stale: n=178 달성 (cycle 1447), v1.8 유지 확정
- 가중치 조정 보류 — cycle 1421 시점 기록. cycle 1447 n=161 threshold cross → cycle 1460 n=178 재입증 → v1.8 유지 확정 (전면 재조정 불필요, SSG 편향 + 토요일 패턴은 별도 후속 layer 로 검토)
🧪 plan #8 M1 — v2.0-cycle231 backtest harness fire (2026-05-26, cycle 903)
2026-05-26cycle 231
v2.0-cycle231 후보 baseline simulation 박제
cycle 231 정보가치 분석 후보 (elo +3pp / bullpen_fip +4pp / recent_form +3pp / sp_fip -7pp / lineup_woba -3pp, 합 0.85) 를 backtest-manual-weights-run.ts harness 에 추가 + Test 2024 (N=727) fire. 결과 apps/moneyball/data/v2-backtest-results.json 박제.
결과 비교 (Test 2024 N=727):
| 모델 | Brier | LogLoss | Acc | |------|-------|---------|-----| | coin_flip | 0.25000 | 0.69315 | 51.44% | | Manual v1.5 (현 prod) | 0.24974 | 0.69264 | 52.82% | | Manual v1.6 | 0.24886 | 0.69086 | 53.37% | | Manual v2.1-A | 0.24854 | 0.69023 | 52.96% | | Manual v2.1-B | 0.24830 | 0.68975 | 52.82% | | Manual v2.1-C | 0.24885 | 0.69084 | 53.09% | | Manual v2.0-cycle231 | 0.24977 | 0.69271 | 52.82% | | Logistic 4f | 0.24980 | 0.69276 | 52.41% | | Logistic 7f | 0.24661 | 0.68635 | 56.40% |
ΔBrier vs v1.5:
- v2.0-cycle231: -0.00003 (미미, evidence 부재)
- v2.1-B: +0.00143 (backtest 안 가장 우수)
- Logistic 7f: +0.00313
한계 명시
- backtest harness 매핑 가능 weight 합 = 0.62 (sp_fip / lineup_woba / recent_form / h2h / park / elo / sfr). 매핑 불가 = 0.23 (sp_xfip / bullpen_fip / war = 0.5 중립).
- v2.0-cycle231 후보 가중치 변화 중 bullpen_fip +4pp 매핑 불가 → backtest 결과 미반영. 실 prod 적용 시 결과 다를 가능성.
- N=727 wayback test set 결과 = 2024 시즌 데이터. v1.8 prod 누적 n=39 (cycle 886 기준) noise level 다름.
결론
- 결론 X (baseline 박제만). plan #8 self_verification rubric (risk 1, n=133 noise) 정합.
- v2.0-cycle231 backtest evidence 부재 (Δ -0.00003). 그러나 매핑 불가 영역 (bullpen) 큰 가중치 변화 미반영 → backtest 단독 판단 X.
- 실 prod n≥150 도달 (~2026-06-04) 후 v1.8 → v2.0-cycle231 또는 v2.1-B switch 결정 필요. evidence valuation 신중 (CI ±15%p). ← stale: v1.8 유지 확정 (cycle 1460), switch 불필요 (Brier diff < 1pp)
plan #8 status 갱신
- Tier 1 (M2/M5/M7/M10/L4) — 100% ship 완료
- Tier 2 M1 — 본 cycle 903 ship 완료
- Tier 2 L1 — cycle 887~898 partial ship
- Tier 2 L3 — cycle 898 closure
- Tier 2 closure 잔여 = 0 (Tier 3 = plan #9 carry-over, completed cycle 896)
🎰 Lotto 1225회 OOS + plan #7 Step E/F partial 박제 (2026-05-23, cycle 885)
2026-05-23cycle 885
1225회 OOS 검증 (PR #1246 cf86586) — 256 rules 100% PASS + 5등 6건 + score breakdown
- 추첨 결과: 8, 9, 19, 25, 41, 42 (보너스 33). 합 144 / 홀:짝 4:2 / 연속쌍 2.
- 256 rules OOS: PASS 256 / FAIL 0 (100% 통과). 누적 N=2 (1224 + 1225) 모두 PASS = filter robust 입증.
- 50세트 매칭: 5등 6건 (random expected 0.89건 → 6.7× over-perform). 평균 매칭 1.12 (1224회 0.84 → +0.28 향상).
- 1등 score breakdown: unpopularityScore(1등) = +6.60 (LUCKY 0 / consecPairs +6 / sum 거리 +0.6 / 등차·decade·저번호 0). 50세트 cutoff = 14.40 → gap 7.80. valid pool 7.7M 안 추정 rank ~836k (top 10.86%) → 추천 50,000 candidates 진입 fail.
- 약점 dimension 식별: sum 거리 가중치 책임 80%+. 모델 "평균 합 138 멀어진 조합 = 비인기 = 추천" 가정에서 1등 합 144 catch fail. N=2 evidence (1224 합 164 sum 거리 +2.60 / 1225 합 144 sum 거리 +0.60 양쪽 모두 cutoff 미달) = 가설 강화.
- 결론: rule 제거 0건 / 추가 동기 X. score 모델 sum 가중치 튜닝 evidence 누적 — N≥10 (~07-25 ETA) 후 GO.
plan #7 Step E + F partial 박제 (PR #1247 b1da036) — cron 자동 갱신
- scripts/lotto.ts: pick-md mode 신규 (buildCandidates + renderPickMarkdown + nextSaturdayKST + pickMd). 기존 pick 함수 = buildCandidates 재사용 (regression 0).
- .github/workflows/lotto-pick-update.yml: cron '19 0,3,6 * * 5' (UTC 금 multi-fire 3회 = KST 09:19/12:19/15:19) + idempotent skip + PR auto-merge (R7).
- .github/workflows/lotto-pick-monitor.yml: cron '0 17 * * 5' (KST 토 02:00) silent skip 감지 ::error::.
- apps/moneyball/data/lotto-picks/2026-05-30.md: pick-md smoke test bootstrap seed (1226회 50조합, 첫 cron fire 전 archive empty 차단).
- +9 신규 regression test (cron YAML + pick-md mode + AdSense surface signal grep).
- AdSense surface risk 0 — archive 만 매주 갱신 (cycle 822 PR #1240 이미 indexable), /lotto hub 미박제 (gating 유지).
- 사용자 가치: 매주 사용자 수동 50조합 박제 부담 제거 + Step C/D ship 시점 PR 부담 사전 분담.
잔여 carry-over (자율 영역 외)
- 14일 AdSense reject signal monitor (사용자 영역, ~06-05 ETA) → Step C/D 박제 GO trigger
- plan #7 Step C/D (/lotto hub + UI 강화) = gating (AdSense monitor 통과 후)
- N≥10 누적 OOS = 자연 누적 (매주 자동 cron 박제 + 사용자 'oos' mode 수동 fire)
- score 모델 sum 가중치 튜닝 = N≥10 evidence 누적 후 GO
regression
- pnpm test: 587 PASS (54 files, +9 신규) / pnpm lint 0 warning / pnpm exec tsc --noEmit 0 error / pnpm tsx scripts/lotto.ts pick-md 2026-05-30 1226 smoke test PASS / LottoDataSchema PASS
- deploy drift: production /api/version commit_sha = main HEAD = b1da036 (gap=0, 사례 9 family 재발 X)
📋 /insights 시즌 2 closure (2026-05-22, cycle 872~875)
2026-05-22cycle 872
plan #5 factor breakdown timeline integration 박제 6/6 Step closure
- cycle 872 PR #1228 (Step 1, plan write) — ~/.develop-cycle/plans/moneyballscore/5.md 외부 박제. lite mode 4축 review skip (자동 fire AskUserQuestion hang 차단, cycle 200 박제 정합).
- cycle 873 PR #1229 (Step 2~3) — apps/moneyball/src/lib/insights/loader.ts InsightEntry.factors: Record<string,number> | null 확장 + supabase select factors column 추가 + null-safe normalize (빈 객체 → null). apps/moneyball/src/app/insights/[date]/page.tsx 안 <FactorBreakdown factors={item.factors} ... /> JudgeReasoningCard 다음 stacked render.
- cycle 874 PR #1230 (Step 4) — /insights hub selectTopFactors helper + mini factor preview (상위 3 factor, Math.abs(value - 0.5) desc 정렬, "전체 팩터 보기" anchor → /insights/${date}#game-${gameId}).
- cycle 875 (Step 5~6) — selectTopFactors helper apps/moneyball/src/lib/insights/topFactors.ts 추출 + 5 신규 behavior unit test (null factors → [] / 비정상 값 filter / desc 정렬 + limit 슬라이스 / favorable home/away/neutral 분류 / pct 정수 round). pnpm test 549 → 554. CLAUDE.md + CHANGELOG.md sync.
- 사용자 가치: 정량 (factor breakdown) + 정성 (judge reasoning) 양쪽 archive timeline 동시 비교. 사용자 1 페이지에서 "왜 이 예측인가" + "어떤 factor 가 가중치 얼마였나" 비교 path 박제.
- AdSense article surface 강화: factor 한국어 label + percentage 자연어 노출 = thin content 회피 더 강력. glossary inline link (cycle 756 박제) inbound 자연 확장.
- regression: pnpm test 554 PASS (+5) / pnpm lint 0 warning / pnpm exec tsc --noEmit 0 error / pnpm build /insights + /insights/[date] static prerender 통과.
📋 W22 마감 노트 (2026-05-17, cycle 516 operational-analysis lite)
2026-05-17cycle 516
Sat reversion — Thu/Fri 1/10 noise 가설 강화
- 5/16 Sat 측정: 3/5 = 60.0% (Sat 누적 12/22 = 54.5% 안정 회복).
- W22 갱신 (n=20→25): 30.0% → 36.0%. scoring_rule 분해: v1.7-revert 2/5 (40.0%, 변동 X) + v1.8 7/20 (35.0%, cycle 490 26.7%→+8.3%p).
- 누적 갱신: n=109→114, 45.9%→46.5%, Brier 0.2469→0.2473.
- 5/17 Sun 10건 verify 대기: cron 14 UTC = 23:00 KST 대기 중. cycle 517 후속 측정.
- 가중치 결정: cycle 490 No-go gate 유지 (head_to_head 3% / elo 10%). v1.8 n=20 binomial CI ±21.5%p — 여전히 v1.7-revert 53.1% 와 통계적 분리 X.
- v2.0 임계 n=150 까지 36건: W23~W24 2주 후 도달 가능. ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — v2.0 upgrade 불필요.
- lesson: docs/lessons/2026-05-17-w22-saturday-recovery.md
- 다음 측정: cycle 517 5/17 Sun verify 후 + W23 (5/19~5/25) 데이터. ← stale: 완료
📋 W22 운영 노트 갱신 (2026-05-16, cycle 490 operational-analysis lite)
2026-05-16cycle 490
v1.8 첫 주 측정 — n=15 noise 영역, 가중치 유지
- fallback 해결 검증: 5/12~5/15 60건 예측 모두 실제 debate (model_version v2.0-debate / v1.8 / v1.8-postview). cycle 362 PR #372 fix 적용 후 silent fallback 0건.
- W22 적중: 6/20 = 30.0% (Tue 2/5 / Wed 3/5 / Thu 0/5 / Fri 1/5). scoring_rule 분해: v1.7-revert 2/5 (40%) + v1.8 4/15 (26.7%).
- v1.8 vs v1.7-revert: Δ=-26.4%p 큰 격차. 그러나 n=15 binomial CI ±25%p — v1.7-revert 53.1% 가 v1.8 CI 상단 근접. 통계적 분리 X.
- 누적 갱신: n=99→109, 49.5%→45.9%, Brier 0.2587→0.2469.
- 가중치 결정: 변경 X (head_to_head 3% / elo 10% 유지). 표본 n<30 시 가중치 회귀 No-go gate 박제.
- 요일별 누적 (n=109): Tue 45.0% (9/20) / Wed 53.8% (7/13) / Thu 45.8% (11/24) / Fri 57.1% (12/21) / Sat 52.9% (9/17) / Sun 14.3% (2/14, cap 적용 중). Fri 68.8%→57.1% 하락은 W22 1/5 Fri 영향.
- lesson: docs/lessons/2026-05-16-v18-first-week-downturn-noise.md
- 다음 측정: W23 (5/19~5/25) 데이터 누적 후 v1.8 재평가. v2.0 임계 n=150 까지 41건. ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460).
📋 W22 운영 노트 (2026-05-14, cycle 383 operational-analysis lite)
2026-05-14cycle 383
v1.8 era silent fallback 발견 (긴급)
- 상황: 2026-05-13 v1.8 첫 fire 부터 모든 예측이 quant-only fallback. totalTokens=0 + reasoning="에이전트 토론 불가. 정량 모델 v1.8 결과 사용." 10건 모두 동일 패턴 (5 pre_game + 5 postview).
- 시점: 5/12 (Tue) v1.7-revert 5건 중 4-5번째 부터 fail 시작 (mid-batch credit exhaustion 패턴). 5/13~ 전체 fail.
- 가설: ANTHROPIC_API_KEY credit 소진. PR #372 (cycle 362) 가 미리 식별한 시나리오 그대로.
- 잔존 silent drift: PR #372 fix 5/13 17:24 KST merge → 5/13 16:17 KST v1.8 pre_game fire 시점엔 미적용. mv='v2.0-debate' 라벨 silent. postview path 도 동일 silent (mv='v2.0-postview').
- 영향: v1.8 가중치 효과 (head_to_head 5→3% + elo 8→10%) 측정 불가능. n=99→150 진행 가속 가설 깨짐. AI reasoning UI 노출도 검토 필요.
- 후속 fix-incident heavy chain 권장: API key 상태 확인 / postview path agentsFailed 가시화 / Sentry captureException 직접 호출 / /accuracy 에 fallback 비율 표시.
- lesson: docs/lessons/2026-05-14-anthropic-credit-silent-fallback-v18.md
W22 (5/11~5/18) 부분 데이터
| 날짜 | scoring_rule | 검증 | 적중 | 비고 | |---|---|---|---|---| | 5/12 Tue | v1.7-revert | 5 | 2 | 40%. 1~3 게임 정상 토론 / 4~5 게임 fallback 시작 | | 5/13 Wed | v1.8 | 5 | 3 | 60%. 전부 fallback (quant-only) — 표면 적중률은 fallback quant 모델 성능 측정 | | 5/14 Thu | — | — | — | SP 미확정 (18:30 게임). 예측 미생성 |
전체 W22 검증 10건 / 5건 적중 = 50%. v1.8 등급화 분석 무효 — fallback 성능만 측정됨.
v0.5.49.0 (2026-05-13, cycles 355-365)
2026-05-13
Added
- AI 모델 버전별 성과 비교 (PR #373, cycle 363): /accuracy 에 scoring_rule별 적중률 비교 테이블 추가. v1.5→v1.6→v1.7-revert→v1.8 성과 추이 + 막대 시각화. buildVersionHistory() — scoring_rule 기반 집계.
- 팀별 상대 강약 분석 카드 (PR #371, cycle 360): /accuracy 에 10팀 매치업 카드 그리드. 홈/원정 적중률 + 상대팀별 n=1 이상 기록 표시. buildMatchupData() 기존 쿼리 재사용.
- AI 확신도별 분석 섹션 (PR #369, cycle 355): /accuracy 에 low/medium/high tier 역전 패턴 가시화. medium 37.5% < low 58.3% 역전 강조.
Fixed
- 일요일 신뢰도 상한 텍스트 정정 (cycle 364): Sunday cap 수치가 accuracy 페이지 표시값에서 55%→45% 불일치 수정 (2곳 + VERSION_META).
- agentsFailed 플래그 (PR #372, cycle 362): API credit 소진 시 LLM 호출 silent failure → v2.0-debate 잘못 라벨링 차단. agentsFailed / agentError 필드 + 회귀 테스트 4건.
- Sunday confidence cap 0.55→0.45 (cycle 358): medium tier 역전 오염 수정. judge-agent Sunday 상한을 0.55→0.45로 재조정.
Changed
- lockfile sync (cycle 358): @testing-library/user-event 불필요 의존성 제거.
v1.8 론칭 기준선 + v1.7-revert 팩터 완결 분석 (2026-05-13, cycle 365 operational-analysis)
2026-05-13cycle 365
누적 현황 (n=94, 2026-05-13 기준)
| 버전 | 건수 | 적중률 | 비고 | |---|---|---|---| | v1.5 | 16 | 75.0% | 소표본 | | v1.6 | 46 | 37.0% | 과적합 | | v1.7-revert | 32 | 53.1% | 개선 확인 | | v1.8 | 0 | — | 오늘(05-13) 시작 | | 전체 | 94 | 48.9% | Brier 0.2549 |
v1.7-revert 완결 팩터 분석 (n=32)
| 팩터 | 정답 avg | 오답 avg | Δ | 해석 | |---|---|---|---|---| | head_to_head | 0.391 | 0.341 | +0.050 | ⚠️ 양의 신호 — v1.8 축소(5→3%) 방향 재검토 필요 | | sfr | 0.265 | 0.319 | -0.054 | 극단값(0 또는 1.0) = 정확, 중간값 = 노이즈 | | sp_fip | 0.516 | 0.503 | +0.013 | 약한 양의 신호 (의도한 방향) | | bullpen_fip | 0.490 | 0.511 | -0.021 | 약한 반대 신호 | | elo | 0.500 | 0.499 | +0.001 | ≈ 완전 중립 (v1.8 증가 10% 근거 재검토 필요) | | recent_form | 0.486 | 0.491 | -0.005 | ≈ 중립 (W19 "가장 강한 신호"와 상충 — 표본 구간 차이) | | war / park_factor | 0.500 | 0.500 | 0.000 | 완전 중립 확인 |
핵심 발견
⚠️ head_to_head vs v1.8 방향 충돌: v1.7-revert n=32 분석에서 head_to_head Δ=+0.050으로 양의 신호 감지. v1.8은 5%→3% 축소를 적용했으나 이 데이터는 반대 방향 시사. TODOS "W20 35.3% 방향 적중률" 과의 모순 = 표본·집계 방식 차이. n=150 도달 전까지 양쪽 병행 추적 필요. ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — 추적 완료, 가중치 재조정 불필요
elo 거의 중립 (Δ=+0.001): v1.8에서 8%→10% 증가했지만, v1.7-revert 실측에서는 방향 신호 없음. 단, 이는 32건 소표본이며 정보가치 분석(Δ=+0.30, cycle 231)은 다른 방법론. 충돌 보류, v1.8 성과로 판단.
확신도 역전 지속: medium(55~64%) 37.5% < low(<55%) 58.3%. high tier 0건(judge 고확신 발화 미발화). v1.8 + Sunday cap 0.45 이후 첫 주 모니터링 시작.
W20 May 12: 2/5 = 40%. 3건 upset(모두 away 팀 승리). v1.8 시뮬레이션: elo 10% 적용 시 game 3819(NC 높은 elo) 개선 가능성 있음.
가중치 조정 결론
현 상태 유지 + v1.8 모니터링: v1.8 방금 시작. 3주(~15건) 누적 후 head_to_head + elo 방향 재평가. n=150 도달 시 heavy 재실행. ← stale: n=178 crossed (cycle 1447), v1.8 유지 확정 (cycle 1460) — 재실행 없음
주간 리뷰 W19~W20 (2026-05-13, cycle 359 weekly-review)
2026-05-13cycle 359
W19 성과 (2026-05-05~10): 15/27 = 55.6%, Brier 0.2542
| 지표 | 값 | |---|---| | 적중률 | 15/27 = 55.6% | | Brier | 0.2542 | | low(<55%) | 12/19 = 63.2% | | medium(55~64%) | 3/8 = 37.5% ← 역전 지속 | | high(≥65%) | 0건 |
W20 partial (2026-05-12 화요일): 2/5 = 40.0%
- 전 경기 low tier (conf ≤ 0.52, Sunday cap 0.45 이전 예측)
- v1.8 scoring_rule 첫 예측은 2026-05-13 16:17 KST~ 생성 예정
핵심 발견
medium tier 역전 패턴 4주 연속 확인: medium(55~64%) = 37.5% < low(<55%) = 63.2%. judge-agent가 확신도 55~64% 구간에서 과보수적으로 발화 → 이 구간 실제 정보 가치 낮음. cycle 358에서 Sunday cap 0.55→0.45로 1차 대응. 장기 해결: n=150 도달 후 judge calibration 재검토. ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — 가중치 재조정 불필요 결론. judge calibration = 독립 carry-over (CREDIT_EXHAUSTED 구간 측정 제한).
요일별 패턴 (W19):
- 금요일 4/4 = 100% (표본 소)
- 일요일 1/5 = 20% (cap 적용 이유)
- 화요일 2/3 = 67%, 수요일 3/5 = 60%
팩터 방향성 분석:
- recent_form: 정답 0.505 vs 오답 0.470 — 가장 강한 방향 신호
- sp_fip: 정답 0.516 vs 오답 0.498 — 약한 양의 신호
- war / park_factor: 항상 0.500 — 완전 중립 (가중치 조정 후보)
- elo: 거의 중립 (0.501 vs 0.500)
팀별 (W19+W20 partial):
- OB 6/7 = 85.7% ↑ (과거 패턴 일치)
- SK 2/7 = 28.6% ↓ (지속 예측 어려움)
가중치 조정 결론
조정 불필요. n=94/150 (v2.0 임계 56건 부족). 현 v1.7-revert 53.1% 안정. v2.0 트리거는 n=150 도달 시. ← stale: n=178 crossed (cycle 1447), v1.8 유지 확정 (cycle 1460) — v2.0 upgrade 불필요
재사용 패턴 추출 (2026-05-13, cycle 365 extract-pattern)
2026-05-13cycle 365
[ai_agent] api-credit-failure-labeling-guard
문제: 외부 LLM API credit 소진 시 HTTP 400 반환 → 모든 에이전트 호출 실패 → fallback verdict(confidence=0.3)로 예측이 v2.0-debate 레이블로 silently 저장. 사후 분석 시 "에이전트 토론 성공" 예측과 "fallback" 예측이 동일 버전으로 혼재 → 버전별 성과 오염.
해결: ```ts // types.ts — DebateResult에 실패 플래그 추가 agentsFailed?: boolean; agentError?: string;
// debate.ts — HTTP 4xx 감지 → agentsFailed=true // daily.ts — agentsFailed 시 errors[] push + debateSucceeded=false if (debateResult.agentsFailed) { errors.push(agents_failed: ${debateResult.agentError}); } ``` 회귀 테스트 4건: 성공 케이스 / 심판 실패 / 홈팀 실패 / 원정팀 실패.
결과: API 실패 시 console.error 로깅 + errors 배열 노출. v2.0-debate 레이블은 에이전트 토론 실제 성공 예측만.
범용성: LLM 멀티에이전트 파이프라인에서 외부 API 실패가 silent fallback으로 저장되는 모든 케이스에 적용. agentsFailed 플래그 = audit trail.
[anti_pattern] rolling-window-factor-correlation-contradiction
문제: W19 분석 → recent_form이 "가장 강한 방향 신호"(Δ=+0.035). v1.7-revert n=32 분석 → head_to_head가 "가장 강한 신호"(Δ=+0.050), recent_form은 중립(Δ=-0.005). 두 결과가 모순처럼 보여 가중치 결정에 혼란.
원인:
- W19 분석 = 15건 단기 윈도우, v1.7-revert 분석 = 32건 다른 윈도우
- n<50에서 팩터 Δ의 95% CI ≈ ±15%p → 단기 분석은 noise 가능성 50%+
- head_to_head = null 값 많아 유효 표본이 더 작음
해결:
- 팩터 분석은 최소 n=50 이상 누적 후 실행 (n=150 도달 전까지 "방향 신호" 수준으로만 참조 ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460))
- 단기 윈도우 분석은 CHANGELOG 기록하되 가중치 변경 근거로 단독 사용 금지
- 분석 윈도우(W19 vs v1.7-revert 전체) 명시 필수
결과: v1.8 head_to_head 축소(5→3%)는 cycle 290의 "W20 35.3% 방향 적중" 근거(다른 방법론). 이번 Δ 분석과의 모순은 방법론 차이로 설명 가능. n=150 이전 판단 유보. ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — 재조정 불필요
범용성: 소표본 ML 팩터 중요도 분석 시 윈도우/방법론 명시 없는 상충 결과 처리 패턴.
재사용 패턴 추출 (2026-05-13, cycle 346 extract-pattern)
2026-05-13cycle 346
[content_auto] cjk-safe-og-image-latin-fallback
문제: Next.js @vercel/og (Satori)는 CJK 폰트를 번들하지 않음. 한국어 팀명이 OG 이미지에서 ▢▢로 렌더링.
해결: 라틴 대체 맵 + route-collocated opengraph-image.tsx ``ts const OG_TEAM: Record<string, string> = { SK: "SSG", HT: "KIA", LG: "LG", OB: "Doosan", KT: "KT", SS: "Samsung", LT: "Lotte", HH: "Hanwha", NC: "NC", WO: "Kiwoom", };
- 한국어 팀 코드 → 글로벌 인식 라틴명 매핑
- export const runtime = "nodejs" (edge 런타임 CJK 제약 회피)
- DB에서 team.code 읽어 OG_TEAM 룩업 → fallback = code 그대로
결과: /analysis/game/[id] 전 경기 맞춤 소셜 카드. Away vs Home 매치업 + AI Pick 배지. 폰트 로딩 비용 0.
범용성: 한국어 콘텐츠 보유 Next.js 앱에서 OG 이미지 구현 시 공통 패턴. CJK 폰트 없는 환경 (Satori, PDF 등) 대응에 동일 라틴 맵 전략 재사용 가능.
[anti_pattern] accuracy-query-without-prediction-type-filter
문제: ML 파이프라인이 동일 테이블에 다수 예측 타입(pre_game / postview / live) 저장. 필터 없이 accuracy 집계 시 사후 분석 예측까지 포함 → 지표 왜곡.
발견: cycle 331 — predForPoll accuracy 쿼리가 postview 예측까지 포함 → 커뮤니티 vs AI 정확도 비교 오염.
해결: accuracy 관련 모든 쿼리에 prediction_type = 'pre_game' 필터 필수화 ```sql -- 잘못된 패턴 SELECT * FROM predictions WHERE game_id = $1
-- 올바른 패턴 SELECT * FROM predictions WHERE game_id = $1 AND prediction_type = 'pre_game' ```
결과: 순수 사전예측 적중률 분리. 후처리 분석이 지표를 오염시키지 않음.
범용성: output_type / prediction_type / stage 컬럼이 있는 모든 ML 파이프라인. 쿼리 작성 시 타입 필터를 기본값으로.
[data_pipeline] per-category-accuracy-outlier-detection
문제: 전체 정확도 지표(48.9%)가 카테고리별 극단 성과를 숨김. 특정 팀/요일/선수에서 모델이 체계적으로 실패해도 집계에 묻힘.
발견: cycle 346 — 팀별 분리 시 WO(키움) 1/6 = 16.7% 이상치 발견. 전체 평균 대비 -32pp 격차.
해결: 최소 샘플 임계(≥3) + 카테고리별 집계 → 이상치 정렬 ``python team_stats = defaultdict(lambda: {'correct':0,'total':0}) for team, stat in sorted(team_stats.items(), key=lambda x: -x[1]['total']): if stat['total'] >= 3: # 소표본 제거 acc = stat['correct']/stat['total']*100
결과: 키움 팀 특성(빠른 공격형/수비 스타일) 미반영 가능성 식별. n=150 후 팀별 보정 검토 트리거. ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — 팀별 보정 미진행
범용성: 분류 모델의 정기 성과 감사. 전체 metric만 추적 시 카테고리 drift 탐지 불가. 팀/지역/시간대별 세그먼트 분해가 ML 모니터링 표준 절차.
W22 팀별 정확도 + v1.8 첫날 (2026-05-13, cycle 346 operational-analysis lite)
2026-05-13cycle 346
팀별 예측 적중률 분석 (전체 n=94, 3경기 이상)
| 팀 | 적중 | 예측 건수 | 적중률 | 신호 | |---|---|---|---|---| | OB (두산) | 6 | 10 | 60.0% | ↑ 강세 | | KT | 8 | 14 | 57.1% | ↑ 안정 | | HH (한화) | 5 | 9 | 55.6% | ↑ 양호 | | LG | 7 | 13 | 53.8% | → 보통 | | SS (삼성) | 6 | 12 | 50.0% | → 중립 | | HT (KIA) | 6 | 13 | 46.2% | ↓ 주의 | | SK (SSG) | 5 | 11 | 45.5% | ↓ 주의 | | NC | 1 | 3 | 33.3% | ⚠️ 소표본 | | LT (롯데) | 1 | 3 | 33.3% | ⚠️ 소표본 | | WO (키움) | 1 | 6 | 16.7% | 🚨 심각 — 모델 미반영 가능 |
키움(WO) 분석: 6경기 예측 중 5경기 오답. 키움 관련 경기에서 모델이 팀 특성(빠른 공격/수비)을 팩터에 제대로 반영 못할 가능성. n=150 이후 팀별 보정 검토. ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — 팀별 보정 불필요 결론
요일별 적중률 (전체 n=94)
| 요일 | 적중 | 건수 | 적중률 | |---|---|---|---| | 금 | 11 | 16 | 68.8% ↑ 최강 | | 목 | 11 | 19 | 57.9% | | 토 | 9 | 17 | 52.9% | | 수 | 4 | 8 | 50.0% | | 화 | 9 | 20 | 45.0% | | 일 | 2 | 14 | 14.3% 🚨 Sunday cap 유지 중 |
v1.8 첫날 (2026-05-13) 시작 확인
- scoring_rule=v1.8 (head_to_head 3%, elo 10%) 적용 시작
- 블로그 주간 리뷰 URL: /reviews/weekly/2026-W20 (동적 실시간)
- 가중치 조정 결정: 없음 — v1.8 0건. n=94 (v2.0 임계 n=150까지 56건) ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460)
W22 중간 점검 (2026-05-13, cycle 341 operational-analysis lite)
2026-05-13cycle 341
재사용 패턴 추출 (cycles 334~341)
#### anti_pattern: Versioned Label Drift After Model Upgrade
- 문제: 가중치 파일 변경 후 파이프라인 코드의 version label 하드코딩이 자동 갱신 안 됨
- 사례: cycle 334 (scoring_rule='v1.6' 하드코딩) + cycle 340 (model_version='v1.7-revert' fallback)
- 해결: 버전 라벨 단일 소스 (CURRENT_SCORING_RULE 상수) + 파이프라인이 import 참조
- 범용성: ML 파이프라인에서 weights 파일과 logging 코드 분리 시 공통 패턴
#### quality_guard: Supply Chain Security CI Gate
- 문제: pnpm/action-setup semver 태그 + transitive 취약점 탐지 미자동화
- 해결: pnpm audit --audit-level=high CI 필수 스텝 + actions SHA 핀 + pnpm overrides
- 결과: 16개 CVE 차단, 향후 high severity 자동 차단 게이트
#### data_pipeline: Dual Version Field — model_version vs scoring_rule
- 발견: model_version='v2.0-debate' (에이전트 고정) vs scoring_rule (가중치 버전) 구분
- 의미: scoring_rule이 실질적 성과 비교 기준. v1.6(37%) 저성과가 누적 끌어내린 주범
- 범용성: 메타-버전과 하이퍼파라미터 버전 분리 관리 패턴
v1.8 scoring_rule 첫 배치 시작 확인
scoring_rule별 누적 성과 (n=94 전체): | scoring_rule | 적중 | 건수 | 적중률 | 비고 | |---|---|---|---|---| | v1.5 | 12 | 16 | 75.0% | game_id 81~150 (소표본) | | v1.6 | 17 | 46 | 37.0% | game_id 151~3252 | | v1.7-revert | 17 | 32 | 53.1% | game_id 3328~3822 (5/5~5/12) | | v1.8 | 0 | 0 | - | 5/13~부터 첫 배치 (cycle 340 fix 적용) |
핵심 발견: cycle 340 v1.8 label fix 이전 모든 예측이 v1.7-revert로 저장됨. v1.8 가중치 실제 적용일 = 2026-05-12 22:18 KST (cycle 335 deploy). 당일 5/12 경기는 오전 pipeline 실행 → v1.7-revert 라벨. 5/13부터 v1.8 첫 건 시작.
전체 현황:
- 누적 n=94, 48.9% / Brier 0.2549 (이전 0.2501에서 소폭 악화 — W22 5/12 40.0% 영향)
- v2.0 임계까지 56건 부족 (n=150 목표) ← stale: n=178 달성, v1.8 유지 확정 (cycle 1460)
확신도 역설 재확인 (W22 5/12):
- 저확신(≤0.35): 2/2 = 100% (HH, NC — 모두 0.30)
- 중확신(0.35~0.50): 0/1 = 0% (KT 0.45)
- 고확신(0.50+): 0/2 = 0% (LG 0.50, HT 0.52)
가중치 조정 결정: 없음 — v1.8 데이터 0건. ~~n=150 도달 후 v2.0 확정~~ ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — Brier diff < 1pp, upgrade 불필요.
W22 성과 업데이트 (2026-05-13, cycle 339 operational-analysis lite)
2026-05-13cycle 339
주간 성과 요약
| 주차 | 날짜 | 적중률 | 비고 | |---|---|---|---| | W22 | 5/12(화) | 2/5 = 40.0% | 원정팀 4/5 압승 패턴 | | W22 | 5/13(수) | — | 5경기 예정 (미완료) | | W21 | 5/5~5/10 | 15/27 = 55.6% | 일요일 제외 시 63.6% | | 누적 | n=94 | 46/94 = 48.9% | — |
W21 요일별 분석 (신규 발견)
| 요일 | 날짜 | 적중률 | 비고 | |---|---|---|---| | 화 | 5/5 | 3/5 = 60% | — | | 수 | 5/6 | 3/5 = 60% | — | | 목 | 5/7 | 2/4 = 50% | — | | 금 | 5/8 | 4/4 = 100% | 완벽 적중 | | 토 | 5/9 | 2/4 = 50% | — | | 일 | 5/10 | 1/5 = 20% | ⚠️ Sunday 패턴 확인 |
일요일 격리 효과 (핵심 발견)
- 비일요일 누적: 45/89 = 50.6% (n=5 일요일 제외)
- 일요일 누적: 1/5 = 20.0% (확인된 1개 일요일)
- 해석: 일요일이 전체 적중률을 48.9%까지 끌어내리는 주범. 비일요일만 보면 baseline(50%) 근접.
- Sunday cap 0.55 적용 중 — 그럼에도 20% 지속. 추가 조치 검토 필요 (n=150 이후) ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — Sunday cap 추가 조정 불필요
W22 5/12 원정팀 압승 패턴
- 5경기 중 4경기 원정팀 압승 (5:1, 8:1, 5:1, 5:1 역전) — 비정상적 흐름
- 정답 2경기 모두 저확신(0.3), 오답 3경기 모두 고/중확신(0.45~0.52)
- 확신도 역설 재확인: 고확신 48.1% < 저확신 53.3%
가중치 조정 결정
- 없음 — v1.8 (head_to_head 3%, elo 10%) 적용 직후 (5/12~). n=94 (v2.0 임계 n=150까지 56건 부족) ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460)
- 모니터링 지속: sfr 47.3% 유해 패턴 + Sunday 20% + 저확신 역설
v0.5.48.0 (2026-05-13, cycles 340-345)
2026-05-13
Added
- 경기 분석 동적 OG 이미지 (PR #365, cycle 345): /analysis/game/[id] 경기별 소셜 미리보기 이미지. AWAY vs HOME 매치업 + AI Pick 배지(predicted_winner + 확신%). CJK 폰트 제약 → 라틴 팀명 맵(OG_TEAM) + nodejs runtime 1200×630.
Changed
- model_version 라벨 수정 (cycle 340): pipeline fallback이 v1.7-revert → v1.8 라벨 정확히 기록하도록 수정
- 네비게이션 description 일관화 (PR #364, cycle 344): 팀·선수 / 리뷰·시즌 그룹 설명 추가. "기록" → "예측 기록" 레이블 명확화.
Fixed
- 소셜 프루프 가시성 (PR #363, cycle 342): picks 페이지 참여자 수 brand 색상 + CTA 텍스트 대비 강화
v0.5.47.3 (2026-05-13, cycle 338 fix-incident)
2026-05-13cycle 338
CI/CD 보안 강화 (PR #361, Fixes #360)
- next@16.2.6: DoS x3 (high), Middleware bypass x4 (high), SSRF (high), XSS x2 (moderate), Image Opt DoS (moderate), cache poisoning (moderate/low) — 16개 CVE 수정
- pnpm overrides: fast-uri>=3.1.2 + postcss>=8.5.10 (transitive high/moderate 제거)
- CI audit 게이트: pnpm audit --audit-level=high — 공급망 취약점 자동 차단
- pnpm/action-setup SHA 핀: semver 태그 → commit SHA 고정 (TanStack 공급망 침해 패턴 대응)
W22 모델 성과 분석 (2026-05-13, cycle 337 operational-analysis lite)
2026-05-13cycle 337
주간 성과 요약
- W22 (5/11~5/12, 진행 중): 2/5 = 40.0% — 초반 5경기 (5/13 경기 미집계)
- 누적 (n=94): 46/94 = 48.9% (n=89 대비 49.4%→48.9%, 5경기 추가)
- v1.7-revert 기준: 17/32 = 53.1% — 안정 유지
- v1.8 최초 적용: 2026-05-13 경기부터 (W22 후속 데이터 대기 중)
W22 5/12 주요 관찰
| 경기 | 결과 | 예측 | 확신 | 비고 | |---|---|---|---|---| | SS@LG | 9:1 SS 압승 | LG(홈) | 52% | 원정팀 압승 | | NC@LT | 8:1 NC 압승 | LT(홈) | 45% | 원정팀 압승 | | SK@KT | 5:1 SK 압승 | KT(홈) | 50% | 원정팀 압승 | | OB@HT | 5:1 OB 압승 | OB(원정) ✓ | 30% | 적중 | | HH@WO | 11:5 HH 압승 | HH(원정) ✓ | 30% | 적중 |
패턴: 5경기 중 원정팀이 4경기 압승. 저확신(30%) 예측 2개 모두 정답, 고/중확신 3개 모두 오답.
팩터별 방향 정확도 (전체 n=94)
| 팩터 | 방향 적중 | 신호 | |---|---|---| | lineup_woba | 78.7% | 최강 ↑ | | elo | 77.1% | 강력 ↑ (v1.8에서 +2%) | | bullpen_fip | 72.9% | 양호 ↑ | | sp_fip/sp_xfip | 55.3% | 보통 | | recent_form | 54.8% | 보통 | | head_to_head | 52.7% | 낮음 (v1.8에서 -2%) | | war | 50.5% | 중립 | | park_factor | 50.0% | 중립 | | sfr | 47.3% | 랜덤 이하 ⚠️ |
고확신 역전 현상 지속
- 고확신(≥0.5): 38/79 = 48.1% ← 랜덤 이하
- 저확신(<0.5): 8/15 = 53.3% ← 역설적으로 더 높음
- v1.6 시절부터 누적된 패턴. calibration 과제.
가중치 조정 결정
- 즉각 변경 없음 — v1.8 배포 직후, n=94 (v2.0 임계 n=150까지 56건 부족) ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460)
- SFR 47.3% 관찰 지속 — 음의 기여 확인. v2.0 시 하향 후보 강화 ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — v2.0 재조정 불필요.
- lineup_woba + elo 상향 방향 유지 — v2.0 계획 데이터 지지 ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — elo 10% 이미 적용, lineup_woba 상향 불필요.
- Sunday cap 0.55 유지 — 일요일 14.3% 패턴 불변
v1.8 가중치 조정 — head_to_head 노이즈 감축 (2026-05-12, cycle 335)
2026-05-12cycle 335
변경 내용
- head_to_head: 5% → 3% (-2pp) — W20/W21 실측 noise 데이터 기반
- elo: 8% → 10% (+2pp) — 정보가치 Δ=+0.30 최강 팩터로 보상
- scoring_rule 버전: v1.7-revert → v1.8
- 합계 0.85 유지
근거
- W20 head_to_head 방향 적중률 35.3% (n=17) — 랜덤(50%) 이하
- 낮은 h2h 구간(0.0~0.33)에서 저확신이 오히려 정답 (63.2% vs 37.5% 역전)
- W21 cycle 333 lesson: head_to_head noise 재확인
- cycle 231 정보가치 분석: head_to_head Δ=-0.10 (음의 기여)
- Sunday cap (cycle 309) 선례: n=150 전 방향 명확 시 선제 적용
~~미완료 (n=150 도달 후)~~ — 완료: v1.8 유지 확정 (cycle 1460)
- ~~전면 v2.0 재조정 (elo→13%, bullpen_fip→14%, recent_form→13% 등)~~ ← stale: n=178 도달 (cycle 1447) + plan #16 2차 fire → Brier diff 0.15% < 1pp → 재조정 불필요 결론
W21 모델 성과 분석 (2026-05-12, cycle 333 operational-analysis lite)
2026-05-12cycle 333
주간 성과 요약
- W21 (5/4~5/10): 15/27 = 55.6% — W19 36.0% 저점 이후 2주 연속 회복
- 누적 (n=89): 44/89 = 49.4%, Brier 0.2501
요일별 패턴 (전체 n=89)
| 요일 | 적중 | 비율 | 신호 | |------|------|------|------| | 금 | 11/16 | 68.8% | 최강 | | 목 | 11/19 | 57.9% | 양호 | | 토 | 9/17 | 52.9% | 보통 | | 수 | 4/8 | 50.0% | 보통 | | 화 | 7/15 | 46.7% | 약간 낮음 | | 일 | 2/14 | 14.3% | 극단적 약점 |
팩터 신뢰도 (홈 우세 신호 시 실제 적중률)
- lineup_woba: 58.1% (n=43) ← 최고 신뢰
- bullpen_fip: 55.3% (n=38) ← 양호
- elo: 54.5% (n=44) ← 양호
- recent_form: 51.4% (n=35) ← 보통
- sp_fip/sp_xfip: 47.4% (n=19) ← 기여 미미
- head_to_head: 37.5% (n=16) ← 랜덤 이하, noise
- sfr (홈 우세): 37.9% (n=29) ← 극단값 편향
가중치 조정 판단
- n=89 (목표 150): 전면 v2.0 재조정 보류 (61건 부족) ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460)
- head_to_head: 37.5% (홈 우세 신호 시) = 명확한 noise 신호 → 5%→3% 하향 1순위 후보 (n=150 도달 시 즉시 적용) ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — head_to_head 3% 이미 적용, 가중치 재조정 불필요
- Sunday cap 0.55 (cycle 309): 오늘(5/12) 배포됨 → 5/17 일요일 경기에서 첫 실측 검증 가능
- lineup_woba: 성과 근거로 15%→17% 상향 검토 (n=150 이후) ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — lineup_woba 상향 불필요 결론
v0.5.47.2 (2026-05-12)
2026-05-12
- fix(accuracy): predForPoll 쿼리에 prediction_type='pre_game' 필터 추가 — post_game 예측 혼재로 커뮤니티 vs AI 정확도 비결정적 결과 방지
[0.5.47.1] - 2026-05-12 AI 그룹 분리 — 커뮤니티 nav 재편 (cycle 330 info-architecture-review)
2026-05-12cycle 330
Changed
- Header.tsx: AI 그룹(5개) → AI(3개) + 커뮤니티(2개) 분리. AI: AI 분석/적중 기록/모델 성능. 커뮤니티: 내 픽 기록/픽 리더보드.
- Footer.tsx: "분석·예측" 컬럼 → "AI 예측" + "커뮤니티" 분리. "리뷰·시즌"+"서비스" → "리뷰·서비스" 통합으로 4-column 유지.
[0.5.47.0] - 2026-05-12 커뮤니티 픽 익명 집계 강화 (cycle 327 explore-idea)
2026-05-12cycle 327
Added
- pick_poll_events 테이블 (마이그레이션 025): device_id 기반 익명 픽 집계. 닉네임 없는 모든 방문자 참여 가능. RLS: public read / 서비스롤 write.
- POST /api/picks/submit: {game_id, pick, device_id} 검증 후 pick_poll_events upsert. 디바이스당 경기별 1표 보장.
- PickButton.tsx: getOrCreateDeviceId() + handlePick() — 픽 클릭 시 fire-and-forget POST + poll 자동 갱신.
Changed
- /api/picks/poll: 집계 소스를 user_picks → pick_poll_events로 전환. 익명 사용자 포함 전체 커뮤니티 픽 집계.
[0.5.46.7] - 2026-05-12 use-user-picks lazy init (cycle 325 review-code)
2026-05-12cycle 325
Fixed
- use-user-picks.ts: useState lazy init으로 setState-in-effect anti-pattern 제거 — useEffect에서 setPicks() 호출 패턴을 useState(() => ...) 초기화로 교체. ESLint disable 주석 제거. 44947fd (use-leaderboard 8차 수정)와 동일한 구조적 원인 동시 식별/제거.
[0.5.46.6] - 2026-05-12 픽 히스토리 트렌드 차트 + 주차별 아코디언 (cycle 324 explore-idea)
2026-05-12cycle 324
변경 사항
- buildPicksStats.ts: WeeklyGroup 타입 추가 + buildWeeklyHistory() 함수 — 모든 주차 데이터 최신순 배열 반환
- PicksTrendChart.tsx (신규): 주차별 내 적중률 vs AI 적중률 SVG 꺾은선 차트 (의존성 0)
- WeeklyHistorySection.tsx (신규): 지난 주차 성과 아코디언 목록 (기본 접힘, AI 격파 배지 표시)
- MyPicksClient.tsx: buildWeeklyHistory 통합 + 두 신규 컴포넌트 삽입 (폼 도트 아래, 공유버튼 위)
- buildPicksStats.test.ts: buildWeeklyHistory unit test 6건 추가 (빈 배열/단일주/2주/weekStart=월요일/그룹별 entries/weekLabel 형식)
[0.5.46.5] - 2026-05-12 주간 픽 요약 카드 폴리시 (cycle 323 polish-ui)
2026-05-12cycle 323
변경 사항
- WeeklyPicksSummary.tsx: resolved=0 zero-state — "결과 대기 중" 표시 (0/0 제거)
- WeeklyPicksSummary.tsx: aiResolved=0 시 "—" 표시 (0/0 제거)
- WeeklyPicksSummary.tsx: 구분선 높이 h-10 → self-stretch (컨테이너 전체 높이 신장)
- WeeklyPicksSummary.tsx: "AI 격파!" 배지 amber → bg-[var(--color-accent)] text-white (DESIGN.md accent token 적용)
- SharePicksButton.tsx: 버튼 텍스트 "픽 성적 공유하기" 단일화
[0.5.46.4] - 2026-05-12 픽 AI 힌트 대비 강화 (cycle 320 polish-ui)
2026-05-12cycle 320
변경 사항
- PickButton.tsx: AI 힌트 행 2열 레이아웃으로 재설계 — "AI 예측" 브랜드 컬러 레이블 + 확률 배지 + 분석 보기 링크 1행, 주요 팩터 2행
- PickButton.tsx: 확률 표시를 bg-brand-100 dark:bg-brand-900/40 text-brand-700 dark:text-brand-300 배지로 감싸 WCAG 대비 개선
- SharePicksButton.tsx: 공유/복사 버튼에 SVG 아이콘 추가 — 공유 그래프 아이콘(기본) + 체크마크 아이콘(복사됨)
- PickButton.test.tsx: AI 힌트 텍스트 변경에 맞춰 3개 테스트 어서션 갱신
[0.5.46.3] - 2026-05-12 UI 폴리시 (cycle 318 polish-ui)
2026-05-12cycle 318
변경 사항
- analysis/page.tsx: 이번 주 경기 섹션 제목 한자 오기 수정 — 分析(중국어) → 분석(한국어)
- NavLinks.tsx: nav onMouseLeave 추가 — 마우스가 네비게이션 영역을 벗어나면 드롭다운 자동 닫힘
[0.5.46.2] - 2026-05-12 AI 드롭다운 메가메뉴 (cycle 317 info-architecture-review)
2026-05-12cycle 317
변경 사항
- Header.tsx: NavLink 타입에 optional description 필드 추가 — backward compatible
- Header.tsx: AI 그룹 5개 항목에 한 줄 설명 박제 (AI 분석 / 적중 기록 / 모델 성능 / 내 픽 기록 / 픽 리더보드)
- NavLinks.tsx: description 있는 그룹 단일 컬럼 패널 렌더링 — label(font-medium) + description(text-xs, brand-400) 2행 표시
- NavLinks.tsx: 기존 2-col grid 동작 (description 없는 그룹) 유지 — 팀·선수 / 리뷰·시즌 변경 없음
[0.5.46.1] - 2026-05-12 Sunday confidence cap (cycle 309 explore-idea)
2026-05-12cycle 309
변경 사항
- judge-agent.ts: 일요일 confidence 상한 0.55 추가 (기존 0.65+ → 0.55 캡)
- 데이터 근거: 일요일 누적 적중률 n≈20 ~15%, W20 1/5=20% — n=150 전 선제 단독 적용
- 일요일 게임 시 calibrationApplied 에 '일요일 상한 0.55' 자동 기록
- agents-judge-sunday-cap.test.ts: 신규 테스트 8건 (일요일/평일/context없음/캡 경계값)
W20 모델 학습 포인트 - 2026-05-12 (cycle 308 operational-analysis)
2026-05-12cycle 308
W20 성과 (2026-05-05~05-10, n=26 확인)
- 주간 적중률: 15/26 = 57.7% (누적 49.4% 대비 +8.3%p)
- 금요일: 4/4 = 100% (최고)
- 일요일: 1/5 = 20% — 누적 일요일 적중률 악화 중 (n=18~20 전체 평균 ~22%)
- 신뢰도 역전 심화: 0.55-0.59 구간 1/5=20%, 0.60+ 구간 2/3=67% (역전 지속)
팀별 패턴 (W20)
- 주목: 두산(1/4=25%), 키움(0/2=0%) — 과대 가중치 or 최근 하락세 미반영 가능성
- 안정: 한화(4/4=100%), KIA(2/2=100%) — 예측 신뢰 구간 높음
가중치 조정 결정
- 보류: n=89 (target n=150). 소표본 경고 유효. W21 이후 추가 데이터 누적 후 판단 ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — 판단 완료, 재조정 불필요.
- 선제 검토 후보: judge-agent Sunday confidence_clamp 0.65→0.55 (n=150 전 단독 적용 검토) ← stale: Sunday cap 0.55 이미 적용 (cycle 309), n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460).
전체 누적 캘리브레이션 현황 (n=89)
| 신뢰도 구간 | 적중 | 총 | 적중률 | |---|---|---|---| | 0.60+ | 8 | 12 | 66.7% ✓ | | 0.55-0.59 | 10 | 23 | 43.5% ⚠️ 역전 | | 0.50-0.54 | 20 | 42 | 47.6% | | 0.40-0.49 | 6 | 12 | 50.0% |
[0.5.46.0] - 2026-05-12 픽 공유하기 + 연속 픽 참여일 (cycle 306 explore-idea)
2026-05-12cycle 306
변경 사항
- SharePicksButton.tsx: 신규 — Web Share API + 클립보드 fallback, 내/AI 성과 + 결과 URL 공유 텍스트 생성
- buildPicksStats.ts: pickingStreakDays 필드 추가 — KST 기준 연속 픽 참여일 계산 (오늘/어제 기준 활성)
- MyPicksClient.tsx: 보조 요약 카드 3열 전환 (연속 정답 / 연속 참여일 / 총 픽), 공유하기 버튼 삽입
- buildPicksStats.test.ts: pickingStreakDays 테스트 6건 추가 (vitest fake timers 활용)
[0.5.45.2] - 2026-05-12 ESLint CI 수정 (cycle 305 fix-incident)
2026-05-12cycle 305
변경 사항
- use-user-picks.ts: useEffect 내 localStorage 동기 읽기 후 setPicks() — react-hooks/set-state-in-effect disable 주석 추가 (유효한 패턴)
- MyPicksClient.tsx: picks 빈 배열 조기 반환 경로의 setLoading(false) — 동일 규칙 disable 주석 추가 (async fetch 없는 early-return 경로)
[0.5.45.1] - 2026-05-12 내 픽 기록 UI 개선 (cycle 304 polish-ui)
2026-05-12cycle 304
변경 사항
- /picks 요약 카드 계층 분리: 내/AI 적중률 히어로 카드(브랜드 보더 + text-3xl) + 연속 정답/총 픽 보조 카드(text-xl)
- 로딩 상태 스켈레톤: animate-pulse 기반 구조 일치 스켈레톤 (히어로 2 + 보조 2 + 폼 도트 + 행 4)
- 빈 상태 아이콘: 브랜드 원형 컨테이너 안 야구공 SVG 아이콘 추가
- 픽 목록 AI 픽 컬럼: 모바일에서도 표시 (hidden sm:inline 제거)
- 네트워크 오류 소프트 배너: 결과 API 실패 시 앰버색 안내 표시 + 픽 이력 계속 노출
[0.5.45.0] - 2026-05-12 내 픽 기록 페이지 (cycle 302 explore-idea heavy)
2026-05-12cycle 302
변경 사항
- /picks 신규 페이지: localStorage 픽 이력 전체 조회 + 성과 분석
- 요약 카드 4종: 내 적중률 / AI 적중률 / 현재 연속 정답 / 총 픽
- 최근 10경기 폼 도트 시각화 + 상승/하락 추세 감지
- 픽 이력 목록: 날짜 / 경기 / 내 픽 / AI 픽 / 결과 비교
- GET /api/picks/results?ids=... 엔드포인트: 픽한 경기 결과 배치 조회
- UserVsAIScorecard 하단에 "전체 이력 →" 링크 추가 (홈페이지 진입점)
- 헤더 AI 그룹에 "내 픽 기록" 추가, 푸터 분석·예측 컬럼에 추가
- buildPicksStats.ts 순수 함수 라이브러리 + 12 unit tests
[0.5.44.1] - 2026-05-12 헤더 AI 기능 그룹화 (cycle 301 info-architecture-review)
2026-05-12cycle 301
변경 사항
- 헤더 내비게이션 재편: AI 분석 단일 링크 → AI ▾ 드롭다운 그룹 (AI 분석 / 적중 기록 / 모델 성능)
- 리뷰·시즌 그룹 7개 항목 → 5개 (accuracy + dashboard AI 그룹으로 이동)
- 푸터 분석·예측 컬럼에 적중 기록 / 모델 성능 추가, 서비스 컬럼 정리
- docs/design/ia-2026-05-12-ai-nav-group.md IA spec 추가
[0.5.44] - 2026-05-12 Pick vs AI 게임화 기능 (cycle 298 explore-idea heavy)
2026-05-12cycle 298
변경 사항
- useUserPicks 훅: localStorage mb_user_picks_v1 기반 picks CRUD + 30일 만료 자동 정리
- PickButton 컴포넌트: 예약 경기 카드 하단 원정/홈 픽 버튼 (PredictionCardLive 통합)
- UserVsAIScorecard 컴포넌트: 홈 페이지 "AI와 대결" 섹션 — 어제 내 성적 vs AI 성적 비교 + 시즌 AI 적중률
- 8 unit tests: useUserPicks 초기화/setPick/getPick/만료/손상 JSON 처리 등 전체 경로 커버
[0.5.43] - 2026-05-12 /accuracy 최근 예측 폼 섹션 추가 (cycle 295 explore-idea heavy)
2026-05-12cycle 295
변경 사항
- /accuracy 최근 20경기 예측 폼: 적중/실패 도트 시각화 + 전체 적중률 대비 현재 폼 강조
- 추세 감지: 최근 10경기 vs 이전 10경기 비율 차 ±10% 기준 ▲상승/▼하락/flat 표시
- buildRecentForm() 순수 함수 추가 (기존 buildWeeklyTrend 패턴 동일 구조)
[0.5.42] - 2026-05-12 /accuracy 요일별 막대차트 50% 기준선 + 컬러 범례 + border 토큰 정렬 (cycle 293 polish-ui)
2026-05-12cycle 293
변경 사항
- /accuracy 요일별 적중률 섹션: 막대 높이 스케일 acc*80 → acc*100 수정 (정확한 100% 컨테이너 비례)
- 50% 기준선: 점선 절대위치 (bottom: 50%) 추가 — 기준 이상/이하 직관적 비교
- 컬러 범례: 텍스트 각주 → 시각 인라인 범례 (brand-500/neutral-400/red-400 + 기준선 기호)
- 주별 트렌드·팀별 성과 테이블 border: border-gray-100/800 → border-[var(--color-border)] 디자인 토큰 정렬
[0.5.41] - 2026-05-12 W20 주간 분석 + 패턴 추출 4건 (cycle 290 operational-analysis lite)
2026-05-12cycle 290
학습 포인트 (W20: 2026-05-05~05-10)
- W20 적중률: 15/27 = 55.6% (Brier 0.2542)
- 전체 누적: 44/89 = 49.4% (Brier 0.2501), n=76→89 (+13건)
- 고확신 역전 패턴 지속: conf≥55% → 37.5%, conf<55% → 63.2%. 모델이 자신있게 예측할수록 오히려 틀림.
- 일요일 취약 심화: W20 5/10(일) 1/5 = 20%. 누적 일요일 ~2/13 ≈ 15%. 비선발 피로 + 팀 불균형 가중.
- head_to_head 노이즈 확인: W20 방향 적중 35.3% (랜덤 이하). v2.0에서 5%→3% 하향 evidence 추가.
- 금요일 강세: W20 4/4 = 100%. 주중 경기 (화~수 60%) 대비 극단적 차이.
- 팀별: HT 83.3%, HH 75%, KIA 66.7% 상위 / OB 33.3%, KT·SSG 40% 하위.
- sp_fip/sp_xfip 데이터 부족: 30경기 중 8건만 방향 있음. SP 확정 시점 파이프라인 이슈 지속.
v2.0 진행 상황
- 누적 89건 (목표 n=150+). 잔여 61건 → 예상 4주 추가 관찰 필요. ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460).
- 가중치 변경 없음 (소표본). ~~n=150 도달 시 operational-analysis heavy 재실행 예정~~ ← stale: n=178 도달 (cycle 1447), heavy 재실행 완료 (cycle 1460 plan #16 2차 fire) → v1.8 유지 확정.
패턴 추출 (gstack learnings 등록)
- [quality_guard] new-page-3cycle-cleanup-pipeline: 신규 페이지 ship 후 design token drift + assertSelectOk 미적용이 매번 2사이클 연속 발생. PR 체크리스트로 예방 가능.
- [anti_pattern] confidence-inversion-high-conf-underperforms: 고확신(≥55%) < 저확신 적중률 역전 지속. ~~calibration curve re-fit 필요 (n=150 도달 후)~~ ← stale: v1.8 유지 확정 (cycle 1460) — re-fit 불필요 결론 (Brier diff < 1pp).
- [data_pipeline] day-of-week-prediction-bias-sunday: 일요일 ~15% 구조적 취약. judge-agent max_confidence 일요일 cap 0.55 적용 검토.
- [anti_pattern] head-to-head-factor-systematic-noise: W20 방향 적중 35.3% — 랜덤 이하. v2.0 가중치 5%→3% 하향 evidence 충분.
[0.5.40] - 2026-05-12 공개 AI 적중률 대시보드 /accuracy 신규 (cycle 287 explore-idea heavy)
2026-05-12cycle 287
추가
- apps/moneyball/src/app/accuracy/page.tsx — 공개 AI 적중률 대시보드
- 캘리브레이션 SVG (신뢰도 0.4~1.0 구간별 실제 적중률 vs 이상적 대각선)
- 주별 트렌드 테이블 (최근 8주 ISO week 기준, 예측수·정답수·적중률)
- 팀별 성과 테이블 (buildAllTeamAccuracy 재사용, 적중률 내림차순)
- 4개 요약 stat 카드 (전체 예측수·전체 적중률·최고 주별 적중률·Brier Score)
- ISR revalidate=3600, 공개 anon client (SUPABASE_SERVICE_ROLE_KEY 미사용)
- OG/canonical 메타데이터, FAQPage JSON-LD 디스클레이머 footer
- apps/moneyball/src/app/analysis/page.tsx — /accuracy CTA 카드 섹션 추가
검증
type-check + 876 tests (shared 73 + kbo-data 562 + moneyball 241) PASS.
[0.5.39] - 2026-05-08 shortName silent drift fix — meta.name.split → shortTeamName 통일 (cycle 274 review-code heavy)
2026-05-08cycle 274
수정
- apps/moneyball/src/lib/teams/buildTeamProfile.ts:113,350
- apps/moneyball/src/lib/matchup/buildMatchupProfile.ts:165,171 (+ shortTeamName import)
- apps/moneyball/src/lib/players/buildPitcherProfile.ts:198
- apps/moneyball/src/lib/players/buildBatterLeaderboard.ts:83 (+ shortTeamName import)
- apps/moneyball/src/lib/players/buildPitcherLeaderboard.ts:189 (+ shortTeamName import)
5 파일 7곳 inline meta.name.split(" ")[0] → canonical helper shortTeamName(code) 일괄 교체. 페이지 컴포넌트 (app/teams/[code]/page.tsx:295) + 다른 lib (reviews/buildMissReport, buildMonthlyReview, buildWeeklyReview) 는 이미 shortTeamName 사용 중이었음 — lib (teams/matchup/players) 만 inline split 으로 drift.
검증
전체 10팀 meta.name.split(" ")[0] vs KBO_TEAM_SHORT_NAME[code] 결과 일치 확인 (출력 동일). 사용자 가시 변화 0. type-check + 876 tests (shared 73 + kbo-data 562 + moneyball 241) PASS.
의도
cycle 264~271 silent drift family detection 7번째. 같은 패턴 — canonical helper 가 있는데 inline 중복 구현 누적. KBO_TEAMS 메타 또는 KBO_TEAM_SHORT_NAME 테이블 일방 변경 시 7곳이 drift 가능 (예: 팀 리브랜드 — "KT 위즈" → "kt wiz" 변경 시 split 결과 = "kt", short table 갱신 안 하면 mismatch).
[0.5.38] - 2026-05-08 W19 최종 성과 + SFR 극단값 편향 패턴 박제 (cycle 256 operational-analysis lite)
2026-05-08cycle 256
예측 성과 — W19 최종 (2026-05-05~05/07, 14경기)
W19 최종: 8/14 = 57.1% ← 시즌 평균(48.6%) 대비 +8.5%p 시즌 누적 (76건, v1.5): ~48.7% (cycle 231 72건 기준 48.6% + W19 증분)
#### W19 시리즈별 결과
| 시리즈 | 성적 | 비고 | |---|---|---| | LG vs 두산 | 3/3 = 100% | 연속 3경기 완벽 | | KT vs 롯데 | 2/2 = 100% | 선발 FIP 신호 정확 | | KIA vs 한화 | 2/3 = 66.7% | 1경기 SFR 신호 오류 | | 삼성 vs 키움 | 1/3 = 33.3% | head_to_head=0.4 신호 무시됨 | | SSG vs NC | 0/3 = 0% | SFR 극단값(0.72~1.0)이 head_to_head(NC 우세) 오버라이드 |
#### 주요 패턴 (박제)
1. SFR 극단값 편향 (신규): SSG vs NC 3연전에서 sfr=0.72→0.72→1.0 극단값이 누적되며 홈 SSG 예측을 고착화. 3경기 모두 head_to_head=0.33 (NC 상대전적 우세) 신호가 존재했으나 SFR에 오버라이드됨.
- 원인 추정: SFR(수비효율) 지표가 단기 시계열 노이즈에 민감 — 한 팀의 SFR이 극단적으로 높을 때 모델이 과신하는 패턴.
- action: n=150 도달 후 heavy 분석 시 SFR 임계값(>0.7) 케이스 별도 분류 + 가중치 재검토. ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — SFR 재검토 불필요.
2. head_to_head 저평가 패턴 지속: SSG vs NC / 삼성 vs 키움 양 시리즈에서 head_to_head < 0.45 신호가 실제 방향을 옳게 가리켰으나 SFR/recent_form에 묻힘. cycle 231 결론("head_to_head 5%→3% 감소 후보")과 상충 — 이 주 데이터에선 head_to_head가 오히려 더 신뢰할 만함.
3. 일요일 저적중 패턴 지속: 전체 누적 일요일 적중률 1/8 = 12.5% (4번째 확인). ~~n=150 도달 후 judge-agent.ts 일요일 confidence clamp 조정 검토 예정~~ ← stale: n=178 도달 (cycle 1447), v1.8 유지 확정 (cycle 1460) — 이 clamp 조정은 독립 carry-over (가중치 재조정과 무관).
4. n=76 / 150 (50.7% 진행): v2.0 가중치 확정 임계 미달. 이번 주 분석은 soft warning 박제만 — 공식 가중치 변경 없음. ← stale: 최종 n=178 / 178 달성 (cycle 1447) + v1.8 유지 확정 (cycle 1460).
[0.5.37] - 2026-05-07 /analysis 이번 달 AI 최고 픽 카드 추가 (cycle 249 explore-idea lite)
2026-05-07cycle 249
Added
- `/analysis` 이번 달 AI 최고 픽 카드: 이달 가장 자신 있게 맞춘 예측을 이번 주 최고 픽 카드와 동일한 UI로 표시. getBestPickOfWeek(month range) 재사용 — 주간 최고 픽과 동일 경기인 경우 중복 숨김 (bestPickOfMonth.gameId !== bestPickOfWeek?.gameId).
[0.5.36] - 2026-05-07 buildTeamAccuracy + getVerifiedPredictions CURRENT_MODEL_FILTER 누락 수정 (cycle 248 review-code heavy)
2026-05-07cycle 248
Fixed
- `buildTeamAccuracy` CURRENT_MODEL_FILTER 누락: /standings 팀별 예측 적중률이 이전 모델 버전 예측까지 포함해 집계하던 silent drift 수정. buildAllTeamAccuracy() 쿼리에 .match(CURRENT_MODEL_FILTER) 추가.
- `getVerifiedPredictions` CURRENT_MODEL_FILTER 누락: /reviews 최근 예측 목록이 전 버전 데이터를 섞던 silent drift 수정. reviews/page.tsx 인라인 쿼리에 .match(CURRENT_MODEL_FILTER) 추가.
- `buildTeamAccuracy.test.ts` 보강: match(CURRENT_MODEL_FILTER) 호출 검증 테스트 케이스 추가. cycle 245 (getMonthlyStats) / 247 (getSeasonAccuracy) 와 동일 패턴의 세 번째 발견.
[0.5.35] - 2026-05-07 WeeklyGameResult brand token 정렬 + details/summary 연속성 (cycle 240 polish-ui)
2026-05-07cycle 240
Changed
- WeeklyGameResult 디자인 토큰 정렬: /reviews/weekly/[week] 경기 목록 섹션의 "적중" 뱃지·통계·팩터 라벨이 사용하던 text-green-*/bg-green-* raw Tailwind 클래스를 brand-500/brand-600/brand-300 브랜드 토큰으로 교체. DESIGN.md "적중 표시 = brand-500" 규칙 준수 (cycle 65 박제).
- 팩터 인사이트 카드 완전 이관: border-green-500/30 → border-brand-500/30 로 best-factor 카드 테두리도 동일 토큰 계열로 통일.
- WCAG AA 대비율 보정: 다크 모드 dark:text-brand-400 (#3d8b54 on #151d18 = 4.11:1) → dark:text-brand-300 (#5aad70 = ≥4.5:1), xs 텍스트 AA 기준 충족.
- details/summary 시각 연속성: 경기 목록 열림 시 summary 헤더와 콘텐츠가 하나의 카드처럼 보이도록 group-open:rounded-b-none / group-open:mt-0 group-open:rounded-t-none group-open:border-t-0 추가.
[0.5.34] - 2026-05-07 주간 리뷰 전체 경기 목록 섹션 추가 (cycle 239 explore-idea)
2026-05-07cycle 239
Added
- 주간 리뷰 전체 경기 목록: /reviews/weekly/[week] 페이지에 접을 수 있는 "이번 주 전체 경기" 섹션 추가. 해당 주의 모든 예측 경기를 날짜 순으로 나열 — 원정/홈 팀 로고·이름·스코어, 예측 승자·신뢰도, 적중/빗나감/미결 badge, 각 경기 분석 페이지 링크.
- `WeeklyGameResult` 타입: buildWeeklyReview 가 games: WeeklyGameResult[] 배열을 반환. 기존 3개 하이라이트 외 전체 경기 데이터를 UI에 노출.
- native `<details>/<summary>` 접기: 클라이언트 컴포넌트 없이 Server Component 상태 유지 — 하이드레이션 비용 0.
[0.5.33] - 2026-05-07 getYesterdayKST off-by-1 수정 (cycle 232 review-code heavy)
2026-05-07cycle 232
Bug Fix
- `getYesterdayKST` off-by-1: UTC 서버에서 d.getDate() = UTC day이지만, KST 자정(T00:00:00+09:00)은 UTC 전날 15:00 → setDate(getDate()-1) 이 2일 소급하는 버그.
- 영향: recent form 필터가 2일치 더 제외됨 (daily.ts 라인 528)
- 영향: 아침 postview cleanup 이 하루 이른 날짜 처리 (daily.ts 라인 256)
- 수정: toKSTDateString(new Date(d.getTime() - 86_400_000)) — 정확히 24h 빼고 KST 변환
- `updateAccuracy` assertSelectOk 통일: 직접 .error 패턴 → assertSelectOk try/catch 일관화
[0.5.32] - 2026-05-07 W19 부분 성과 + 팩터 유효성 재검토 (cycle 231 operational-analysis heavy)
2026-05-07cycle 231
예측 성과 — 2026 시즌 누적 (72건, 4/16~5/6)
W19 진행 중 (5/5~5/6 완료, 5/7~ 미결): 6/10 = 60.0% ← 이번 주 (화·수) 시즌 누적 (72건): 35/72 = 48.6% (기저율 50% 미만 — 모델 개선 필요)
#### W19 경기별 결과
| 날짜 | 원정 @ 홈 | 예측 | 정답 | |---|---|---|---| | 5/5(화) | OB @ LG | LG(0.45) | ✅ | | 5/5(화) | NC @ SK | SSG(0.52) | ❌ | | 5/5(화) | WO @ SS | 키움(0.42) | ❌ | | 5/5(화) | LT @ KT | KT(0.50) | ✅ | | 5/5(화) | HH @ HT | 한화(0.52) | ✅ KIA 실제 승 | | 5/6(수) | OB @ LG | LG(0.60) | ✅ | | 5/6(수) | NC @ SK | NC(0.55) | ❌ | | 5/6(수) | WO @ SS | 키움(0.45) | ✅ | | 5/6(수) | LT @ KT | 롯데(0.52) | ✅ | | 5/6(수) | HH @ HT | KIA(0.58) | ❌ |
#### 팩터 유효성 재검토 — 실측 게임 아웃컴 기반 정보가치 분석 (n=72)
방법론: Δ = 팩터방향일치 적중률 - 팩터방향불일치 적중률 (양수 = 유용한 팩터)
| 팩터 | 현 가중치 | 정보가치 Δ | 결론 | |---|---|---|---| | elo | 8% | +0.30 | ✅ 최강 예측팩터 (이전 분석 감소 후보 → 번복) | | bullpen_fip | 10% | +0.26 | ✅ 2위 유용 팩터 | | recent_form | 10% | +0.20 | ✅ 3위 유용 팩터 | | lineup_woba | 15% | +0.06 | 유지 (약한 양의 신호) | | sfr | 5% | -0.02 | 중립 | | war | 8% | -0.12 | ⚠️ 약한 마이너스 | | head_to_head | 5% | -0.10 | ⚠️ 마이너스 (이전 분석 증가 후보 → 번복) | | sp_fip | 15% | -0.15 | ❌ 최고 가중치인데 마이너스 | | sp_xfip | 5% | -0.15 | ❌ 마이너스 | | park_factor | 4% | -0.15 | ❌ 마이너스 |
#### v2.0 가중치 후보 — 기존 vs 재검토
| 팩터 | 현재 | 기존 v2.0 후보 (cycle 228) | 재검토 (cycle 231) | |---|---|---|---| | head_to_head | 5% | → 8% ↑ | → 3% ↓ (정보가치 Δ=-0.10) | | elo | 8% | → 5% ↓ | → 13% ↑ (정보가치 Δ=+0.30 최강) | | bullpen_fip | 10% | 유지 | → 14% ↑ (Δ=+0.26) | | recent_form | 10% | 유지 | → 13% ↑ (Δ=+0.20) | | sp_fip | 15% | 유지 | → 8% ↓ (Δ=-0.15) | | lineup_woba | 15% | → 12% ↓ | → 12% ↓ (Δ=+0.06 약한 양수) | | war | 8% | 유지 | → 5% ↓ (Δ=-0.12) | | sp_xfip | 5% | 유지 | → 3% ↓ (Δ=-0.15) | | sfr | 5% | → 3% ↓ | → 5% (Δ=-0.02 중립) | | park_factor | 4% | → 2% ↓ | → 2% ↓ (Δ=-0.15) |
주의: n=72 소표본. 95% CI 넓음. elo Δ=+0.30은 강한 신호이나 최종 적용 전 n=150+ 권장.
#### 요일별 적중률 (확인)
| 요일 | 적중률 | 비고 | |---|---|---| | 목 | 9/15 = 60% | 최고 | | 금 | 7/12 = 58% | | | 토 | 7/13 = 54% | | | 화 | 7/15 = 47% | | | 수 | 4/8 = 50% | W19 수요일 4/10 (두 분석 기간 다름) | | 일 | 1/9 = 11% | ← 계통적 실패 지속 확인 |
#### 팀별 적중률 (cycle 231 기준, 참여 경기)
| 팀 | 적중률 | |---|---| | KT | 9/15 = 60% ↑ | | OB, HH | 8/14 = 57% | | LG | 7/13 = 54% | | HT | 8/15 = 53% | | WO | 7/17 = 41% | | SK, SS | 5/14 = 36% ↓ |
학습 포인트
1. elo는 최강 예측팩터 — cycle 228 분석의 "elo 감소" 후보는 방법론 차이로 오도됨. 실측 게임 아웃컴 기반 분석에서 Δ=+0.30으로 1위. 2. sp_fip 역설 — 가장 높은 가중치(15%)이지만 정보가치 Δ=-0.15로 마이너스. SP FIP 데이터 적시성 문제(당일 확정 선발이 FanGraphs 업데이트 전) 가능성. 3. 일요일 11% 지속 — 3회 일요일 관찰. 3연전 SP 로테이션/불펜 피로 가설 유효. 100건 이후 confidence_clamp 적용 검토. 4. n=72 경고 — 각 팩터 추정치의 95% CI ≈ ±15%p. v2.0 적용 전 추가 데이터 수집 권장.
[0.5.31] - 2026-05-07 W20 심층 성과 분석 (cycle 228 operational-analysis heavy)
2026-05-07cycle 228
예측 성과 — 2026 시즌 누적 (72건, 4/16~5/6)
시즌 누적 (72건): 35/72 = 48.6% · Brier 0.2494 W20 진행 중 (5/5~5/6 완료): 6/10 = 60.0% · Brier 0.2562 W19 (4/28~5/3): 9/25 = 36.0% ← 이상 급락 W18 (4/21~4/27): 11/26 = 42.3% W17 (4/14~4/20): 9/11 = 81.8% ← 초기 고성능 (소표본 효과)
#### 신규 발견 1 — 일요일 계통적 실패 (1/9 = 11%)
| 일요일 | 경기 | 결과 | |---|---|---| | 2026-04-19 | 롯데 vs 한화 | X | | 2026-04-26 | NC vs 삼성 / 한화 vs SSG / KT vs 키움 | XXX | | 2026-05-03 | SSG vs KT / NC vs 롯데 / KIA vs 삼성 / 두산 vs 키움 / 한화 vs LG | X X X X O |
전체: 1/9 = 11.1% (vs 시즌 평균 48.6%). 가설: 일요일 = 3연전 마지막 경기. SP 로테이션 3번째 + 불펜 피로 누적 + 홈팀 주전 휴식 → 정량 팩터가 실제 경기력을 미반영.
권장 대응: judge-agent.ts 에서 일요일 경기 confidence_clamp 상한을 0.65 → 0.55 로 축소 고려 (통계 임계 100건 도달 후 적용 판단). ← stale: n=178 달성 후 v1.8 유지 확정 — confidence_clamp 조정 미적용 (separate layer 로 검토 예정)
#### 신규 발견 2 — 팀별 적중률 편차
| 팀 | 홈 | 원정 | 전체 | |---|---|---|---| | 롯데 | 6/9=67% | 3/6=50% | 9/15=60% ↑ | | LG | 3/6=50% | 5/8=62% | 8/14=57% ↑ | | KT | 4/6=67% | 4/8=50% | 8/14=57% ↑ | | 두산 | 6/9=67% | 1/4=25% | 7/13=54% | | NC | 5/9=56% | 3/6=50% | 8/15=53% | | 삼성 | 1/4=25% | 5/9=56% | 6/13=46% | | 키움 | 2/4=50% | 5/11=45% | 7/15=47% | | 한화 | 3/9=33% | 4/8=50% | 7/17=41% | | KIA | 2/8=25% | 3/6=50% | 5/14=36% ↓ | | SSG | 3/8=38% | 2/6=33% | 5/14=36% ↓ |
KIA 홈 25% / SSG 36% = 구조적 예측 실패. Elo rating stale 가설 (KIA 최근 2시즌 전력 변동 / SSG 장기 슬럼프).
#### 팩터 유효성 — v2.0 후보 확정 (100건 도달 후 적용) ← stale: v1.8 유지 확정 (cycle 1460) — 아래 재배분 미적용
| 팩터 | 방향성 차이 | 현 가중치 | v2.0 후보 | |---|---|---|---| | head_to_head | +0.0432 (최고) | 5% | → 8% ↑ | | war | +0.0135 | 8% | 유지 | | sp_fip | +0.0101 | 15% | 유지 | | sp_xfip | +0.0107 | 5% | 유지 | | bullpen_fip | +0.0106 | 10% | 유지 | | recent_form | +0.0100 | 10% | 유지 | | lineup_woba | +0.0040 | 15% | → 12% ↓ | | elo | +0.0031 | 8% | → 5% ↓ | | sfr | +0.0009 | 5% | → 3% ↓ | | park_factor | +0.0000 | 4% | → 2% ↓ |
가중치 변경 시 총합 = 100%. 재배분 방향: head_to_head +3% 흡수 (lineup_woba -3% / elo -3% / sfr -2% / park -2% → 합 -10%, 남은 -7% 는 bullpen +2% / recent_form +2% / sp_fip + sp_xfip +1% 씩 흡수 예정). 100건 도달 후 CI95 재측정 후 최종 확정. ← stale: 이 재배분 미적용. v1.8 유지 확정 (cycle 1460). head_to_head 최종 5%→3% (cycle 335), elo 8%→10%.
#### Calibration 현황 (72건)
| Confidence | 실제 적중률 | 이상적 | |---|---|---| | 0.4 | 0/1 = 0% | 40% | | 0.5 | 19/41 = 46.3% | 50% | | 0.6 | 16/30 = 53.3% | 60% |
전반적으로 모델이 과신(over-confident) 경향. 특히 conf=0.5 구간이 이상적 대비 3.7%p 부족.
#### 100건 임계 도달 예상
현재 72건 → 잔여 28건 → 일 5경기 기준 → 2026-05-11~5/12 도달 예상.
운영 노트
- 중복 예측 행 발견: predictions 테이블에 동일 game_id 중복 행 53건 (각각 is_correct null). 이는 다중 predict 파이프라인 run 의 race condition 결과. 정확도 측정에는 영향 없음 (이미 verified 72건 기준 집계). ON CONFLICT DO NOTHING 이 동시 insert 시 race condition 미완전 차단 사례.
[0.5.30] - 2026-05-07 헤더 드롭다운 접근성 개선 + 브랜드 토큰 정렬
2026-05-07
변경 사항
- NavLinks 드롭다운 접근성: CSS-only group-hover:block 방식을 React useState 기반으로 전환. aria-expanded, aria-controls, role="menu", role="menuitem", aria-labelledby 추가. Escape 키로 드롭다운 닫기, 외부 클릭 시 닫기, 라우트 변경 시 닫기 지원. 스크린리더 및 키보드 사용자 모두 네비게이션 드롭다운 인식 가능.
- 브랜드 토큰 정렬: text-green-600/bg-green-100/text-green-700 → text-emerald-600/bg-emerald-100/text-emerald-700 (DESIGN.md success: #10b981 = Tailwind emerald-500/600 기준). PredictionCard 적중 배지, ModelTuningInsights 상관계수·가중치 델타 지표 2곳 수정.
[0.5.29] - 2026-05-07 normalize() 음수 입력값 버그 수정
2026-05-07
예측 엔진 버그 수정 (cycle 208 fix-incident)
파일: packages/kbo-data/src/engine/predictor.ts
normalize() 함수의 양수 전용 비율 공식(a/(|a|+|b|)) 이 higherIsBetter=true + homeVal<0 시 팩터값 음수 반환하는 버그 수정. KBO SFR 지표는 평균 대비 상대값으로 음수 가능.
수정 내용: 차이 기반 정규화 (home-away)/(|home|+|away|) → [-1,1] → [0,1] 로 교체.
- 양수 전용 입력과 수학적 동치 증명: ((a-b)/(a+b)+1)/2 = a/(a+b) ← 완전 backward compatible
- 음수 SFR 입력에서 팩터 [0,1] 범위 보장
- 신규 테스트 4개 추가 (홈열세/홈우세/양팀음수/전체팩터≥0)
영향: 72건 중 6건 음수 SFR 팩터 수정 (단일 경기 최대 ±4.2pp). Brier 영향 미미.
557 → 561 tests all pass.
[0.5.28] - 2026-05-07 주간 성과 분석 (W19)
2026-05-07
예측 성과 — 2026 시즌 누적 (cycle 207 operational-analysis)
이번 주 (W19: 5/5~5/6 완료 10경기): 6/10 = 60.0% · Brier 0.2561 지난 주 (W18: 5/1~5/3): 9/25 = 36.0% ← 이상 급락 4월 이후 누적 (72건): 35/72 = 48.6% · Brier 0.2494
#### W18 급락 원인 분석
W18 36.0% 급락은 3개 반복 실패 매치업 집중:
- SSG(홈) vs 롯데: 3연전 전패 예측 (0/3) — 모델이 SSG 우세로 연속 평가했지만 롯데 3연승
- 키움(홈) vs 두산: 2연전 엇갈림 (1/2) — 방향 혼선
- KIA(홈) vs KT: 2경기 1패 — KT 강세 과소평가
매치업 정확도 0% 패턴 3개 (삼성vsSSG / 키움vs삼성 / SSGvs롯데) → 특정 팀 pair 구조적 예측 실패 신호.
#### 팩터 유효성 진단 (72건)
| 팩터 | 방향성 차이(correct-wrong) | 현 가중치 | 평가 | |---|---|---|---| | head_to_head | +0.0432 (최고) | 5% | ↑ 과소평가 가능성 | | war | +0.0135 | 8% | 적정 | | sp_fip / sp_xfip | +0.010 | 15% / 5% | 적정 | | bullpen_fip | +0.011 | 10% | 적정 | | elo | +0.003 (최저) | 8% | ↓ 효과 미미 | | sfr | avg=0.202, 범위 -0.833~1.0 | 5% | 이상값 확인 필요 |
#### SFR 팩터 이상값 (버그 후보)
predictor.ts:normalize(homeVal, awayVal, true) = homeVal / (|homeVal|+|awayVal|). SFR 원값이 음수일 때 팩터값도 음수 가능 (예: -5SFR / (-5+3) = -0.625). 72건 중 6건 음수 SFR 팩터 존재 → normalize 함수가 음수 입력값 미처리. v1.5 가중치에서 SFR 5%이므로 영향 미미하나, 개념적 오류.
#### Calibration 진단
| Confidence 구간 | 실제 적중률 | 이상적 | |---|---|---| | 0.4 | 54.5% (6/11) | 40% — 과도하게 높음 | | 0.5 | 41.9% (13/31) | 50% — 낮음 | | 0.6 | 53.3% (16/30) | 60% — 낮음 |
전반적으로 confidence 0.5 구간 예측이 실제보다 과신. 모델이 "박빙" 경기를 낮게 확신하면서 오히려 맞추고, "보통" 경기를 중간 확신하면서 못 맞추는 역설적 패턴.
#### 가중치 조정 판단
현 시점 보류 (72건 < 100건 임계) ← stale: n=178 달성, v1.8 유지 확정 (cycle 1460). 아래 checkpoint 미적용. 통계적 신뢰구간 너무 넓음. 단, 다음 checkpoint 기준:
- head_to_head 5% → 8% 상향 후보 (가장 높은 방향성 차이) ← stale: 최종 5%→3% (cycle 335, 노이즈 evidence)
- elo 8% → 5% 하향 후보 (방향성 차이 최저) ← stale: 최종 8%→10% (cycle 335, 정보가치 Δ=+0.30)
- SFR 음수값 버그 수정 선행 필요
- 100건 도달 예상 시점: 5월 2주차 (~5/14) ← stale: 완료 (5/14 전후 100건 달성, 최종 n=178)
#### 학습 포인트
1. 반복 실패 매치업 신호: 같은 pair 3연전 전패는 팩터 데이터 자체가 틀린 신호. recent_form 또는 roster 변동 미반영 가능성. 2. SFR normalize 음수 처리: Math.abs 없이 음수 SFR 입력 시 팩터값 음수 → 가중합 오염. 데이터로 측정된 영향: Brier ≈ 0.0002 이하 (5% 가중치 × 소수 케이스). 3. Calibration 역전: confidence 0.4 구간이 0.5 구간보다 실제 정확도 높음 (54.5% > 41.9%) → 과신 구간(0.5) 존재. 4. 데이터 충분성 기준: 100건 미만 = 가중치 변경 금지. CI95 범위가 40pp+ 이상이라 측정값 신뢰 불가.
추출 패턴 (cycle 207 extract-pattern)
[quality_guard] `silent-drift-single-source-derive`
- 문제: 스크래퍼/파이프라인 여러 호출 site에서 오류 처리 로직 중복 → 각자 다르게 구현 → silent divergence
- 해결: 단일 소스 helper 추출 + 실패 이유 named enum + console.warn per reason
- 결과: cycles 125~199에서 20+ 파일 4개 helper로 통합 (assertResponseOk, assertSelectOk, assertWriteOk, extractReasoningHomeWinProb)
- 재사용: TypeScript API fetch/DB query 반복 패턴 어디서나 적용
[content_auto] `breadcrumb-jsonld-dual-output`
- 문제: SEO JSON-LD와 시각적 Breadcrumb nav를 별도 유지 → drift 발생
- 해결: 단일 <Breadcrumb> 컴포넌트가 <nav> + <script type="application/ld+json"> 동시 출력
- 결과: 2 사이클 안에 breadcrumb 누락 11→actionable 0건 달성
- 재사용: Next.js App Router + 구조화 데이터 필요한 모든 사이트
[data_pipeline] `prediction-calibration-confidence-bucket-audit`
- 문제: 모델 confidence 0.5가 실제 41.9% 정확도 — calibration 역전 구간 존재, 사용자 레이블 신뢰성 의문
- 해결: verified 예측을 confidence 0.1 단위 bucket으로 분류 → actual accuracy vs ideal 비교
- 결과: conf=0.4 → 54.5% (과교정), conf=0.5 → 41.9% (저교정) 발견. 가중치 조정 100건 임계 재확인
- 재사용: ML/AI 확신도 점수를 사용자에게 노출하는 서비스 모두
[anti_pattern] `normalize-assumes-nonnegative-inputs`
- 문제: normalize(a, b) = a / (|a|+|b|) — 입력이 음수면 factor값 0~1 벗어남
- 현상: SFR 값 음수 6건/72건, predictor.ts sfr factor = -0.833까지 발생
- 영향: SFR 5% 가중치 + 소수 케이스 → Brier ≈ 0.0002 이하 (minor), 개념적 오류
- 수정 방향: 음수 가능 지표는 max(0, val) 클램핑 또는 (a-b)/(|a|+|b|+ε) → [0,1] 재매핑
[0.5.27] - 2026-04-30
2026-04-30
인프라 신뢰성 — Cloudflare Workers 이관 완료 + agent-loop closed cycle
배경: GH Actions schedule 이 high-load skip 으로 41% (daily) / 85% (live) 실패. 전체 cron 을 Cloudflare Workers Free Tier 로 이관 완료. 동시에 Claude agent-loop 자율 개발 cycle 구축.
#### Cloudflare Workers Cron 이관 (GH Actions schedule 완전 대체)
- cloudflare-worker/src/worker.ts — 단일 파일에 7가지 역할 통합:
1. daily-pipeline trigger (17 0-14 * * *, UTC hour → mode 분기) 2. SP 확정 시각 측정 — KBO 공식 + Naver 이중 소스 동시 INSERT 3. sitemap warmup (37 * * * *) 4. pitcher-snapshot (UTC 토요일 15:37 조건 분기) 5. live-update (*/10 9-15 * * *) 6. sync-batter-stats (UTC 03:17 조건 분기) 7. self-develop daily dispatch (UTC 00:17)
- cron 슬롯 5개 중 3개 사용 (Free tier quota 여유). 총 fire/day = 82 (100k 한도 내)
- pat-expiry-check.yml GH 유지 결정 — GH PAT 검사는 GH 컨텍스트가 본질에 맞음
- GH Actions yml 에서 schedule 키 제거, workflow_dispatch 보존 (수동 fallback)
#### SP 확정 시각 측정 이중 소스 (Phase 2)
- supabase/migrations/020_sp_confirmation_log.sql — sp_confirmation_log 테이블
- 021_widen_sp_log_state_sc.sql — state_sc VARCHAR(20) (Naver statusCode 7자 overflow 차단)
- KBO 공식 (B_PIT_P_NM, T_PIT_P_NM) + Naver (homeStarterName, awayStarterName) 양쪽 적재
- Naver gameId 17자리 → 13자리 normalizeNaverGameId() 로 KBO join 가능
- 1~2주 누적 후 Phase 3 분석: 어느 소스가 먼저 SP 채우는지 정량 비교
#### Agent-loop closed cycle (Phase 5 비전 1 보완)
- self-develop.yml → agent-loop.yml 네임스페이스 전환
- label agent-loop + branch prefix agent-loop/ 로 사용자 작업과 분리
- carry-over chain: 1 cycle = 10 fire. 큰 task 자율 분해 + GH Issue 기반 인계
- push step 명시 추가 (git push origin --all) — commit 후 push 누락 silent drop 방지
- Cloudflare cron 0 0 * * * (KST 09:00) → self-develop.yml workflow_dispatch
- 4 prefix (lesson/policy/feedback/memory) commit → submit-lesson.yml dispatch → 허브 auto-ingest
#### 기타 인프라 / SEO
- 019_widen_pipeline_runs_mode.sql — mode VARCHAR(20) (predict_final 11자 overflow 차단)
- AdSense 스크립트 인프라: ADSENSE_PUBLISHER_ID env-driven <script async> 자동 주입
- SEO: sitemap 정적 prerender 전환 / canonical 전수 / SportsEvent 스키마 / robots.txt 보강
- 예측 3단계 (적중/유력/반반) 이모지·레이블 UI+Telegram 통일
- wrangler 3.114 → 4.85 업그레이드
검증: tsc pass · 전체 tests pass (shared 42 + kbo-data 358 + moneyball 139 = 539).
[0.5.26] - 2026-04-22
2026-04-22
v3 backtest 결과 — game_records 기반 feature negative
목적: 2163 경기 game_records 백필 후 불펜 피로도·팀 타자 폼·팀 투수 컨디션 feature 의 개별 유의성 측정 → v1.7 가중치 후보 발굴.
실행: backtest-v3-run.ts (Train 2023-24 N=1449 / Test 2025 N=714)
계수 유의성 (v3 8-feature, train 기준):
- bullpenInningsL3Diff: coef −0.050, z=−0.35, null-like
- runsL5Diff: coef 0.020, z=0.42, null-like
- runsAllowedL5Diff: coef 0.050, z=1.05, null-like
- homeRunsL5Diff: coef 0.069, z=1.43, borderline (방향 정확, 95% CI 아슬)
- 기존 4-feature 도 모두 null-like 로 변동 (multicollinearity)
Test Brier (2025):
- coin_flip baseline: 0.25000
- 4-feature: 0.24861
- 8-feature: 0.24902 (Δ +0.00042, 악화)
- Accuracy 54.20% → 54.06% (−0.14pp)
결론: v1.7 ship 근거 없음. v1.6 유지. 새 4 feature 중 개별 유의성 달성 못 함 — 팀 집계 수준의 거친 지표로는 signal 포착 부족. 더 정교한 개별 선수 feature (투수 pcode fatigue, 타자 hra 최근) 가 필요하지만 별도 엔지니어링 세션 대상.
수집된 데이터 자산
- game_records 2,185건 전체 (2023: 722 + 2024: 727 + 2025: 714 + 2026: 22)
- 타자·투수별 박스스코어 + 이닝별 점수 + 승/패/세/홀 투수
- 4-6주 후 prod 예측 축적과 함께 재분석 가능
기타 (UI)
- /about 가중치 표시 active/제외 섹션 분리 (park/h2h/sfr 0% → 별도 "제외된 팩터")
- /predictions: 예측 없는 과거 날짜 숨김 + 고확신 적중률 추가 표시
- 메인 hero: "오늘의 빅매치" (접전/라이벌 휴리스틱) → "오늘의 고확신 예측" (승률 70%+ 최대 confidence)
- shared HIGH_CONFIDENCE_THRESHOLD = 0.4 상수화 + isHighConfidence helper
검증: tsc pass · 전체 tests pass (shared 30 + kbo-data 360 + moneyball 116).
[0.5.25] - 2026-04-22
2026-04-22
경기별 boxscore 수집 인프라 + /debug/model-comparison
경기별 boxscore (Naver record API):
- 이전 조사에서 "Naver API 과거 조회 불가" 로 결론냈던 것 정정: fromDate/toDate 스케줄 검색은 과거 무시되지만, 개별 gameId 로 `/schedule/games/{gameId}/record` 호출은 2023-2026 전체 가능 (Referer 헤더 필수).
- packages/kbo-data/src/scrapers/naver-record.ts — fetch + 파싱 + 타입 + unicode 분수 이닝 파서 ("3 ⅔" → 3.6667)
- packages/kbo-data/src/pipeline/save-game-record.ts — upsert 로직 (status=BEFORE/CANCEL 또는 빈 데이터 skip)
- packages/kbo-data/src/pipeline/backfill-records.ts — 시즌별 백필 CLI (rate limit 1.5s)
- packages/kbo-data/src/pipeline/live.ts — 경기 종료 감지 시 record 자동 저장 (best-effort)
- supabase/migrations/017_game_records.sql — game_records 테이블 (JSONB 중심, RLS)
- 2026 시즌 22 경기 전부 수집 검증. 2023-2025 백필 별도 실행 중.
모델 비교 대시보드 (`/debug/model-comparison`):
- lib/dashboard/compareModels.ts — aggregateByModel + dailyByModel 집계 함수
- scoring_rule + model_version 조합별 N / Accuracy / Brier / LogLoss / Calibration
- 최근 14일 일별 추세 + v1.6 ship 마커 (2026-04-22 하이라이트)
v1.6 pure shadow run:
- daily.ts 가 debate 실행 전 v1.6 순수 정량 확률을 reasoning.quantitativeHomeWinProb 로 병행 저장
- 대시보드의 buildShadowRows 가 v2.0-debate row 에서 추출 → v1.6-pure-shadow 가상 그룹 생성
- 4-6주 후 Debate 층이 실제로 prediction 을 개선하는지 vs 노이즈인지 정량 측정 가능 — Agent API 비용 정당화 근거.
UI 개선 (앞선 커밋):
- 라이브/종료 상태 버그 수정 (Naver STARTED/RESULT 매핑)
- PredictionCard / LiveScoreboard 에 경기 상태 배지 + 승패 강조
- LiveScoreboard 와 메인 카드 간 싱크 차이 해결 (PredictionCardLive / PlaceholderCardLive client wrapper)
검증: tsc pass · kbo-data 265 + shared 28 + moneyball 116 = 409 tests pass.
[0.5.24] - 2026-04-22
2026-04-22
예측 엔진 v1.6 — Wayback 백테스트 기반 가중치 재분배
배경: 2026-04-21 세션에서 2023-2024 시즌 말 Fancy Stats /elo/ Wayback 스냅샷 복원으로 팀 wOBA/FIP/SFR feature 추가. Logistic regression 학습 (Train 2023 N=722 / Test 2024 N=727) 으로 각 feature 개별 유의성 측정.
측정 결과 (test Brier 기준):
- 4-feature (Elo+form+h2h+park): 0.24980
- 7-feature (+ wOBA/FIP/SFR): 0.24661 (Δ −0.00319, Acc +3.99pp)
- coin_flip baseline: 0.25000
계수 유의성:
- wobaDiff*20 coef 0.548 z=2.10 ⭐ p<0.05 (유일 유의)
- fipDiff/2 coef 0.301 z=0.72 borderline 양성 (방향 정확)
- sfrDiff/20 coef 0.101 z=0.37 null-like
- h2hShift coef −0.009 z=−0.02 null-like (kH2h sweep monotone worsening)
- parkShift/10 coef −0.022 z=−0.13 null-like (CI [-0.34, 0.30])
변경 (DEFAULT_WEIGHTS): | Factor | v1.5 | v1.6 | 근거 | |---|---|---|---| | lineup_woba | 0.15 | 0.20 (+0.05) | 유일 유의 feature 강화 | | sp_fip | 0.15 | 0.19 (+0.04) | FIP 방향 맞는 신호 강화 | | elo | 0.08 | 0.13 (+0.05) | wOBA/FIP 신호 흡수 관측 | | head_to_head | 0.05 | 0.00 | null-like 제거 | | park_factor | 0.04 | 0.00 | null-like 제거 | | sfr | 0.05 | 0.00 | null-like 제거 |
합계 0.85 보존, 10팩터 구조 유지 (장기 호환성).
파일:
- packages/shared/src/index.ts — DEFAULT_WEIGHTS 수정, 근거 주석
- packages/shared/src/index.test.ts — v1.6 null-like 3종 0 검증 테스트 추가
- packages/kbo-data/src/engine/predictor.ts — doc v1.6
- packages/kbo-data/src/engine/weights.ts — reduce 타입 annotate
- packages/kbo-data/src/__tests__/engine.test.ts — 양수 → >= 0
- packages/kbo-data/src/pipeline/daily.ts — model_version v1.5 → v1.6 (agent 없을 때 fallback), scoring_rule v1.6
- packages/kbo-data/src/pipeline/postview-daily.ts — scoring_rule v1.6
- packages/kbo-data/src/pipeline/live.ts — v1.5-live → v1.6-live
- apps/moneyball/src/app/page.tsx, about/page.tsx — UI 라벨 v1.6
- apps/moneyball/src/components/analysis/DetailedFactorAnalysis.tsx — 라벨
- apps/moneyball/src/lib/reviews/buildMonthlyReview.ts, buildWeeklyReview.ts — 문구
- apps/moneyball/src/lib/analysis/__tests__/factor-explanations.test.ts — sp_fip contributionPct 기대값 6 → 8 (weight 0.15 → 0.19)
한계: Train 1 시즌 / Test 1 시즌. wOBA CI 하한 0.03 아슬한 유의성. 2025 Wayback 스냅샷 없음. Prod 이식 후 4-6주 데이터 축적 후 재학습 권장.
검증: tsc pass · 전체 vitest 103 moneyball + 253 kbo-data + 26 shared = 382 tests pass.
[0.5.23] - 2026-04-20
2026-04-20
PLAN_v5 Phase 4 완료 — 가드 테스트 잔여 2종
배경: v0.5.22 시점 Phase 4 잔여 2건 (pipeline-daily + ui-homepage). ROI 낮다고 판단해 운영 관측으로 보완 중이었으나, PLAN_v5 100% 완료 선언 위해 이번 세션에 마저 작성.
변경:
- packages/kbo-data/src/__tests__/pipeline-daily.test.ts 신규 (15 tests). runDailyPipeline 4-mode 분기 + finish() helper 보장 + R2 (notifyPredictions 조건) + 예측 0건 시 notifyPipelineStatus 스킵 + setup 실패 에러 경로 전부 커버. 재사용 가능한 Supabase chainable proxy mock builder 를 함께 추가.
- apps/moneyball/src/__tests__/ui-homepage.test.tsx 신규 (16 tests). PlaceholderCard 5개 status 분기 + SP 미확정 + gameTime fallback + 팀명·SP 라인 표시. R3 (INNER→LEFT JOIN) 가드: mixed LEFT JOIN 결과 (predictions=[] + predictions=[{...}] 혼합) 에서 모든 카드가 목록에 남고, 각각 PlaceholderCard / PredictionCard 로 분기.
PLAN_v5 최종 상태 (2026-04-20 세션 종료):
- ✅ Phase 1 UI (v0.5.22)
- ✅ Phase 2 Pipeline (v0.5.22)
- ✅ Phase 2.5 DB 기반 form/h2h (v0.5.22)
- ✅ Phase 3 /debug/pipeline (v0.5.22)
- ✅ Phase 4 가드 테스트 (v0.5.23, 이번 릴리스)
검증: tsc pass · vitest 전체 382 tests pass (shared 26 + kbo-data 253 + moneyball 103). 이번 릴리스 +31 tests.
[0.5.22] - 2026-04-20
2026-04-20
PLAN_v5 Phase 1-2 — 파이프라인 신뢰성 복원 + UI 리질리언스
배경: 4/17-19 사흘 연속 홈페이지 5경기 편성에도 2-3경기만 노출. 원인은 15 KST predict cron 1회 실행이 주말 낮경기 14:00 (이미 live 상태) 스킵. 이중 방어선 (Path C) 설계: UI 리질리언스 + 파이프라인 재설계.
변경 (Phase 1 — UI):
- PlaceholderCard 컴포넌트 + estimatePredictionTime 헬퍼 신규 (apps/moneyball/src/{components/predictions,lib/predictions}/).
- 홈 page.tsx predictions!inner → predictions (LEFT JOIN). 예측 없는 경기는 PlaceholderCard 로 "예측 준비중 · 약 HH:MM KST 생성" 표시. games source of truth 보장.
변경 (Phase 2 — 파이프라인):
- 매시간 cron 재설계: daily-pipeline.yml cron 2회/일 → 15회/일. UTC 00 announce (KST 09) + UTC 01-12 predict (매시간) + UTC 13 predict_final + UTC 14 verify. 각 경기 시작 3시간 이내에만 해당 경기 predict.
- `shouldPredictGame` 함수 분리 (packages/kbo-data/src/pipeline/schedule.ts): 윈도우 필터 (0-3h) + status + SP 확정 + first-write-wins. 24 unit tests.
- INSERT with UNIQUE 제약 (Codex #1): upsert 덮어쓰기 → INSERT + 23505 catch. first-write-wins 구조적 보장. concurrency: daily-pipeline (cancel-in-progress: false) 추가 방어선.
- `daily_notifications` 테이블 + flag (Codex #6): 하루 요약 Telegram 알림 idempotent.
- `notifyAnnounce` 신규 + 09:00 KST 하루 예고 (packages/kbo-data/src/notify/telegram.ts).
- `finish()` helper: 모든 exit 경로 pipeline_runs 로그 보장 (Codex #7). Telegram status 는 의미 있는 run 에만.
- `gameIdMap` 배치 조회 (Codex #10): games upsert 응답에서 직접 id Map.
- Retention/postview cleanup → UTC 01 첫 cron 에만 (Codex #5).
- revalidate 범위 확장 (Codex #4): /predictions/[date], /analysis, /feed 추가.
- 사용자-facing "15:00" 문구 4곳 일괄 수정 (Codex #8): about / page / predictions[date].
Migration 필요 (수동 적용):
- supabase/migrations/013_predictions_metadata.sql:
- predictions.predicted_at TIMESTAMPTZ 컬럼
- daily_notifications 테이블 + RLS
미구현 (별도 스코프):
- fetchRecentForm / fetchHeadToHead asOfDate 필터 (Codex #2): KBO TeamRankDaily 가 ASP.NET postback 기반이라 단순 GET 불가. 시그니처·호출부 배선만 완료, 실 필터링은 Phase 2.5.
- /debug/pipeline 대시보드 (Phase 3): 다음 세션.
- Fixtures + unit tests 11개 + regression 5건 (Phase 4): 다음 세션.
검증: tsc pass · vitest 197 tests pass (24 신규 + 173 기존).
[0.5.21] - 2026-04-19
2026-04-19
Sentry 에러 모니터링 통합
변경:
- `@sentry/nextjs` v10 통합: 클라이언트(instrumentation-client.ts) + 서버(sentry.server.config.ts) + edge(sentry.edge.config.ts) + instrumentation.ts register hook + next.config.ts withSentryConfig wrapper.
- 에러 바운더리 자동 캡처: error.tsx / global-error.tsx 가 Sentry.captureException 호출. 클라이언트 React 에러, 서버 RSC 에러, layout 자체 실패 모두 수집.
- `onRouterTransitionStart`: App Router 페이지 전환 트레이스 자동 수집 (v10 권장 패턴).
- DSN 없으면 no-op: NEXT_PUBLIC_SENTRY_DSN env 비어 있으면 init 자체를 안 부르므로 빌드/런타임 영향 0. Sentry 가입 → DSN env 추가 → 자동 활성.
- Vercel 프로젝트 정리: 빈 moneyballscore 프로젝트 제거 + 진짜 prod 프로젝트를 moneyball-ecosystem-moneyball → moneyballscore 로 rename. CLI · dashboard 표기 통일.
검증
- 라이브 배포에서 client captureException → Sentry Issues 탭 도착 확인.
- 무료 Developer Plan 한도(월 5K errors) 충분.
[0.5.20] - 2026-04-19
2026-04-19
에러 바운더리 + Supabase 풀스캔 제거 + 검색 인덱스
에러 처리 강화:
- `error.tsx`: 세그먼트 단위 에러 화면. 디자인 시스템 컬러 + "다시 시도" / "홈으로" 버튼 + 오류 ID 표시. Vercel logs 자동 전송.
- `global-error.tsx`: layout 자체 실패 fallback. layout 못 쓰는 환경이라 인라인 스타일로 디자인 시스템 컬러만 살림.
Supabase 페이지 쿼리 최적화 (가장 큰 perf win):
- `buildTeamProfile` / `buildMatchupProfile`: 매 페이지 hit 시 전체 pre_game predictions 풀스캔 후 JS 필터하던 패턴 제거. from('games') + .or() SQL 필터 + !inner predictions 로 전환 → 페이지당 수천 row → 수~수십 row.
- 기존 type shape 유지 → downstream 컴포넌트 코드 변경 0.
Migration 012 (prod 적용 완료):
- idx_games_date (단일 컬럼) — 기존 (league_id, game_date) 복합 인덱스가 league_id 없이 검색 시 못 잡던 문제 해결.
- idx_games_home_team / idx_games_away_team — buildTeamProfile/buildMatchupProfile SQL 필터 인덱스 활용.
- idx_players_team — 팀 프로필 투수 leaderboard.
- `pg_trgm` 확장 + GIN 인덱스 on `players(name_ko, name_en)` — /search 한글/영문 ILIKE 부분 검색 가속.
검증
- 스키마: 011 → 012, prod Supabase remote 동기화 (supabase migration list --linked).
- 페이지 응답: 정상 (HTTP 200, MoneyBall Score 헤더 응답 확인).
[0.5.19] - 2026-04-19
2026-04-19
관심 팀 필터 + 통합 검색
관심 팀 필터 (FavoriteTeamFilter.tsx, client):
- 홈 페이지 상단 칩 바. 팀 다중 선택 → localStorage mb_favorite_teams_v1.
- "관심 팀만 보기" 토글 → 인라인 <style>로 data-game-id 카드 숨김. SSR friendly (hydration 후 mount).
- 팀 색상 inline (KBO 공식 컬러 칩).
통합 검색 (/search?q=…):
- 결과 그룹 3종: 팀(in-memory match), 선수(Supabase ILIKE on name_ko/name_en), 일자(YYYY-MM-DD prefix).
- 정확 일자 입력 시 /predictions/[date] 직접 링크 표시.
- SearchForm.tsx (client): 헤더 데스크톱 컴팩트 입력 + 모바일 검색 아이콘 → /search 페이지.
- 검색 페이지에 검색 팁 (팀명 / 선수명 / 날짜 패턴 예시) + Breadcrumb 적용.
검증
- 65/65 + 173/173 + 87/87 tests · type-check 3/3 통과.
[0.5.18] - 2026-04-19
2026-04-19
AdSense 심사 대비 — Breadcrumb · 404 · FAQ · 쿠키 안내
SEO 신호 강화:
- `Breadcrumb` 컴포넌트 (components/shared/Breadcrumb.tsx): 시각 + BreadcrumbList JSON-LD 동시 출력. Server Component (no 'use client').
- 7개 동적 라우트 적용: /analysis/game/[id], /matchup/[a]/[b], /players/[id], /teams/[code], /reviews/weekly/[w], /reviews/monthly/[m], /predictions/[date]. 기존 ad-hoc breadcrumb 4개 통합.
404 페이지 (app/not-found.tsx):
- 디자인 시스템 컬러 + 빠른 링크 6종 (홈/오늘/AI 분석/팀/선수/대시보드) + URL 패턴 힌트.
- metadata.robots: { index: false } 로 색인 방지.
쿠키 동의 배너 (CookieConsent.tsx):
- localStorage mb_cookie_notice_v1 기반 1회 dismiss. PIPA-compliant 안내 톤 (GA + 광고 식별자 사용 명시 + 개인정보처리방침 링크).
- 반응형 (모바일 column / 데스크톱 row) + 다크모드 호환.
FAQ schema (about 페이지):
- 7개 FAQ 추가 + FAQPage JSON-LD: 예측 방법론 / 적중률 / 데이터 출처 / 무료 여부 / 사후분석 / 도박 금지 안내 / AI 모델.
- Q/A 펼치기/접기 (<details>) UI.
검증
- 65/65 + 173/173 + 87/87 tests · type-check 3/3 통과.
[0.5.17] - 2026-04-19
2026-04-19
타입 안전성 + a11y 개선
기술 부채 — `any` 타입 전면 제거:
- 스캔 결과 29개 any 위치 중 표준 컴포넌트 경로 전부 구체 타입으로 교체.
- 각 페이지에 Supabase query shape을 interface로 선언 + as unknown as <T> 한 번으로 캐스팅. 이후 접근은 타입 추론.
- / (홈), /analysis/game/[id], /predictions/[date], /predictions/[date]/opengraph-image, /analysis, /reviews, /feed, TeamPerformanceChart 모두 정리.
- eslint-disable 주석 10+개 제거. PreGamePrediction / PostGamePrediction discriminated union으로 predictions 배열 타입 안전하게 분기.
접근성 (a11y) 개선:
- Skip-to-main 링크: <body> 최상단에 "본문 바로가기" 링크. 포커스 시에만 시각적으로 표시 (sr-only → focus:not-sr-only). 키보드 사용자가 네비 반복 없이 메인 콘텐츠로 바로 이동.
- `<main id="main" tabIndex={-1}>`: skip 링크 타겟으로 포커스 수신 가능.
- 전역 focus-visible 스타일: a, button, [role="button"], input, select, textarea, summary에 일관된 outline. 기존 각 컴포넌트별 스타일보다 예측 가능.
- `prefers-reduced-motion` 지원: 사용자 시스템 설정 존중. WCAG 2.3.3 Animation from Interactions.
검증
- Test suite: 86/86 · kbo-data 173/173 · type-check 3/3 통과.
- eslint: no-explicit-any 규칙 위반 0건 (주석 포함).
[0.5.16] - 2026-04-19
2026-04-19
소셜 공유 버튼
변경:
- `ShareButtons` 컴포넌트 (client): Web Share API (모바일 네이티브) + Twitter / Facebook intent + 링크 복사. 사용자 취소(AbortError) 무시 + clipboard 실패 방어. 아이콘 inline SVG (외부 아이콘 라이브러리 의존성 없음).
- 6개 콘텐츠 페이지 footer 통합: /analysis/game/[id], /predictions/[date], /reviews/weekly/[week], /reviews/monthly/[month], /reviews/misses, /matchup/[a]/[b]. 각 페이지마다 제목·설명 자동 생성 (자동 요약·날짜·팀명 기반).
의도: 독자가 쉽게 공유할 경로 확보. AdSense 심사엔 직접 영향 없지만 유기적 유입 경로 확장.
검증
- Test suite: 86/86 · kbo-data 173/173 · type-check 3/3 통과.
[0.5.15] - 2026-04-19
2026-04-19
Head-to-head 매치업 페이지 — +45 엔티티 페이지
배경: 팀 × 팀 교차점이 공백. 10팀 조합 45개를 개별 페이지로 만들면 엔티티 그래프 크게 확장 + 내부 링크 풍부화 + AdSense 심사 콘텐츠 깊이 시그널.
변경:
- `canonicalPair.ts` + 테스트 10건: canonicalPair(a, b) 두 팀 코드를 알파벳 순 정렬된 쌍으로 정규화. 같은 팀/유효하지 않은 코드는 null. pairsForTeam(code) 특정 팀의 9 상대, allPairs() 전체 45. 중복 없음·canonical 동등성 테스트.
- `buildMatchupProfile.ts`: predictions × games 조인 → 두 팀이 맞붙은 경기만 필터링. 각 팀의 승수(홈/원정 분리), AI 예측 지목·적중 카운트, 예측 정확도, 경기 리스트(최신순), 자동 요약 문장.
- `/matchup/[teamA]/[teamB]` 페이지: 헤더(팀 컬러 vs) → 요약 → 팀별 성과 카드 2개 → 예측 정확도 → 경기 리스트 → 다른 매치업 네비(양 팀 각 8개). 비-canonical URL은 canonical로 301 redirect. SportsEvent JSON-LD.
- `/matchup` 인덱스: 10×10 격자 (대각선 제외)로 45개 조합 한 눈에 + 팀별 바로가기.
- `/teams/[code]` 연동: "주요 매치업" 섹션 추가 — 9 상대 팀을 컬러 닷 + 칩으로 네비.
- sitemap: /matchup 정적 + 45 canonical URL 자동 편입.
결과: 45 신규 엔티티 페이지 + 팀 프로필 ↔ 매치업 ↔ 경기 분석 3단 링크 그래프 완성.
검증
- Test suite: 86/86 (기존 76 + 신규 canonicalPair 10) · kbo-data 173/173 · type-check 3/3 통과.
[0.5.14] - 2026-04-19
2026-04-19
AdSense 심사 대비 작은 정리들
- ads.txt 동적 라우트: /app/ads.txt/route.ts. ADSENSE_PUBLISHER_ID env 있으면 google.com, pub-xxxxxxxxxxxxxxxx, DIRECT, f08c47fec0942fa0 자동 서빙, 없으면 placeholder 주석. 승인 후 Vercel env 변수만 추가하면 즉시 적용. pub- + 16자리 검증.
- Footer 서비스 네비 확장: 기존 5개 (홈·예측·AI 분석·대시보드·소개)에 /reviews·/players·/teams 3개 추가하여 총 8개. 모바일 flex-wrap 정리.
- RSS 피드 확장 (/feed): 기존 게임별 50개 items에 리뷰 페이지 items 6개 추가:
- 최근 3 주간 리뷰
- 최근 2 월간 리뷰
- 회고 페이지 1개
- 각 item에 pubDate, title, description, guid 포함.
- MobileNav는 NAV_ITEMS 재사용 확인 — Header에서 /teams 이미 추가했으므로 자동 동기화됨 (별도 수정 불요).
검증
- Test suite: 76/76 · kbo-data 173/173 · type-check 3/3 통과.
[0.5.13] - 2026-04-18
2026-04-18
월간 리뷰 라우트 (퀄리티 C1 확장)
배경: 주간 리뷰(v0.5.6)에 이어 월 단위 집계 페이지 추가. 시즌 누적 콘텐츠 타입 +1 — 심사 관점에서 "주간·월간·회고" 3가지 리뷰 형태로 다양성 확보.
변경:
- `computeMonthRange.ts` + 테스트 11건: parseMonthId("2026-04"), getMonthRangeFromDate, getRecentMonths(n), getPreviousMonth. 윤년 2월(2/29), 평년 2월(2/28), 12월 경계 검증. 연도 경계 (2026-01 → 이전 2025-12) 테스트.
- `buildMonthlyReview.ts`: 주간 빌더 패턴 재사용 + 월간 특성 반영:
- pickHighlights는 박빙 적중 2 + 고확신 적중 2 + 대역전 실패 2 (주간은 각 1개)
- 전월 대비 적중률 diff (previousAccuracyRate, 최소 5경기 충족 시)
- factorInsights minSamples 5 (주간은 3)
- 팀별 성과는 적중률 DESC로 정렬 (주간은 예측 수 DESC)
- `/reviews/monthly/[month]` 페이지: 4 지표 카드 (검증·적중·적중률·전월대비), 하이라이트 6개 3열 그리드, 팀별 바, 팩터 best/worst, 최근 4개월 네비.
- `/reviews/monthly`: 현재 월 redirect.
- `/reviews` 허브 3단 그리드: 주간 + 월간 + 회고 카드. 월간 카드는 accent(골드) 컬러로 구분.
- sitemap: /reviews/monthly 정적 + 최근 6개월 /reviews/monthly/[yyyy-mm] 동적 URL.
검증
- Test suite: apps/moneyball 76/76 (기존 65 + 신규 computeMonthRange 11) · kbo-data 173/173 · type-check 3/3 통과.
[0.5.12] - 2026-04-18
2026-04-18
Core Web Vitals 최적화 1단계
배경: AdSense 심사 기술 요건 + SEO·체류시간에 CWV 직접 영향. 도메인 이전 전에 70+ 페이지 전체 자산에 적용해두어 기반 마련.
변경:
1. Vercel Speed Insights 추가: @vercel/speed-insights 설치 후 layout.tsx에 <SpeedInsights /> 통합. 기존 @vercel/analytics와 병렬로 LCP/CLS/INP/FCP/TTFB 실시간 측정 + Vercel 대시보드에 자동 기록. 심사 대기 기간 동안 regression 감시 기반 마련.
2. Pretendard 폰트 self-hosting 전환: 기존 https://cdn.jsdelivr.net/gh/orioncactus/pretendard@v1.3.9/... 외부 CDN <link> 제거. pretendard npm 패키지 설치 + globals.css에서 @import "pretendard/dist/web/variable/pretendardvariable-dynamic-subset.css". 효과:
- 외부 도메인 DNS 조회 + TLS handshake 제거 (LCP -100~300ms 예상)
- as="style" + rel="stylesheet" 잘못된 조합 제거
- 빌드 시 CSS 번들에 포함되어 FOUT/FOIT 감소
- 외부 CDN 장애에서 독립
미적용 (다음 단계 후보):
- next build 번들 사이즈 세부 점검 → recharts 등 차트 라이브러리 dynamic import (현재는 'use client' 컴포넌트 5개만 사용 중이라 우선순위 낮음)
- 큰 JSON-LD 인라인 (/analysis/game/[id] articleBody) 크기 최적화
- a11y WCAG AA 보강
검증
- Test suite: 65/65 + kbo-data 173/173 · type-check 3/3 통과.
- Dev server smoke: / HTML에서 CDN jsdelivr 링크 제거 확인, speed-insights 스크립트 주입 확인. Ready in 233ms.
- pnpm build 28개 라우트 모두 성공.
[0.5.11] - 2026-04-18
2026-04-18
스크래퍼 안정성 (드리프트 사례 6 예방)
배경: 오늘 세션에서 Fancy Stats /leaders/ 셀렉터 변경으로 타자/투수 모두 fetched=0 → daily-pipeline의 findPitcher fallback으로 silent failure. 두 차례 fix 커밋 후에야 수정됨. 심사 대기 기간 중 동일 사고가 나면 적중률 급락으로 이어질 수 있음 — 조기 감지 장치 필요.
변경:
1. Fixture 기반 유닛 테스트 추가 (`scrapers-fancy-stats.test.ts`):
- fetch를 모킹하지 않고 파싱 로직만 순수 함수로 분리 — parsePitchersFromHtml, parseBattersFromHtml.
- 실제 Fancy Stats /leaders/ HTML을 __tests__/fixtures/fancy-stats-leaders.html에 스냅샷.
- 13건 테스트: 행 수 최소 임계, 한글 이름/팀 코드 포맷, FIP/WAR 합리적 범위, 중복 선수 없음, 팀 코드 10개 유효성, 회귀 감지 (0명 fail).
- CI에서 배포 전 구조 변경 자동 감지.
2. 런타임 헬스 체크 + Telegram 알림:
- daily-pipeline: fetchPitcherStats/TeamStats/EloRatings 반환값 검증 → 임계 미만 시 notifyError + errors 배열 기록.
- syncBatterStats: fetched=0 (CRITICAL), fetched<8 (WARNING), upsertedStats=0 with fetched>0 (CRITICAL) 3단계 알림.
- SyncBatterStatsResult에 warnings 필드 추가.
3. Fixture HTML 59KB 저장 — 현재 시점 /leaders/ 스냅샷. 사이트 구조 변경 시 fixture 업데이트 + parser 수정이 한 쌍.
검증
- Test suite: apps/moneyball 65/65 · kbo-data 173/173 (기존 160 + fixture 13) · type-check 3/3 통과.
[0.5.10] - 2026-04-18
2026-04-18
v4-4 Phase 1-3 후속: 타자 스크래퍼 + Top 10 (퀄리티 C2-B 완결)
문제: C2-A에서 투수 Top 10만 공개하고 타자는 "준비 중" placeholder. 사용자 요청인 "Top 10 × 2 = 20명" 달성을 위해 타자 스탯 수집 인프라 필요.
발견: KBO Fancy Stats /leaders/ 페이지(기존 투수 스크래퍼가 이미 크롤링하는 단일 URL)에 타자 테이블 4종 (WAR·wRC+·OPS·ISO)도 포함되어 있음. 별도 페이지 스크래핑 불필요 → 공수 4-6h → ~1.5h로 단축.
변경:
- `BatterStats` 타입 + `fetchBatterStats` 스크래퍼: fancy-stats.ts에 타자 테이블 인덱스 0-3 파싱. 타자 행은 rank·eng·kor·team·age·position·stat (투수보다 position 1컬럼 더) → cells.eq(6) stat 읽기. 4 테이블 Map 조인 후 team 코드 해석.
- `syncBatterStats` 파이프라인: 기존 getOrCreatePlayerId 패턴 재사용, players upsert (position 비어있으면 채움) + batter_stats upsert (war·wrc_plus·ops, season unique).
- `/api/sync-batter-stats` endpoint: CRON_SECRET 보호, 동기화 후 /players revalidate 트리거.
- `.github/workflows/sync-batter-stats.yml`: 매일 KST 12:00 (UTC 03:00) cron. daily-pipeline predict(15 KST) 전에 실행. 별도 workflow로 분리 — 기존 daily-pipeline 건드리지 않음 (드리프트 사례 1 회피).
- `buildBatterLeaderboard.ts`: batter_stats season 필터 + WAR DESC. position='P' 방어 필터.
- `/players` 타자 Top 10 섹션 활성화: 기존 "준비 중" placeholder를 실제 테이블로 교체. 컬럼: 순위·선수·팀(컬러 닷)·포지션·WAR·wRC+·OPS. last_synced 날짜 표시.
주의: 이번 커밋에는 스크래퍼 코드만 들어감. 실제 batter_stats 첫 적재는 workflow cron(내일 12:00 KST) 또는 수동 gh workflow run sync-batter-stats.yml 필요.
검증
- Test suite: 65/65 · kbo-data type-check 통과 · app type-check 통과.
- 스크래퍼 대상 URL(fancy-stats /leaders/) 실제 HTML 구조 curl로 확인 (테이블 0-3 타자, 4-7 투수).
- 스크래퍼 유닛 테스트 생략 (외부 HTML 모킹 비용 대비 이득 적음, DB integration도 성격상 별도).
[0.5.9] - 2026-04-18
2026-04-18
v4-4 Phase 1-3 후속: "크게 빗나간 예측" 회고 페이지 (퀄리티 C4)
문제: 틀린 예측을 숨기지 않고 사후 분석과 함께 노출하는 페이지가 없었음. 이미 predictions.reasoning jsonb의 post_game row에 사후 에이전트 분석(judgeReasoning, factorErrors[], homePostview.missedBy, awayPostview.missedBy)이 저장되어 있지만 개별 경기 페이지(/analysis/game/[id])의 PostviewPanel에만 노출. 허브·목록 형태의 "투명성 페이지"가 없어 E-E-A-T 점수와 브랜드 신뢰 신호로 활용 못 함.
변경:
- `buildMissReport.ts`: confidence ≥ 0.55로 예측했는데 틀린 경기를 confidence DESC로 Top N 수집 → 각 항목에 pre_game verdict reasoning + post_game judgeReasoning + factorErrors[] + 양팀 missedBy 통합. pre_game과 post_game을 각 game_id로 재조인.
- `/reviews/misses` 페이지: 서문(왜 공개하는가) + 고확신 실패 카드 Top 10. 각 카드에 날짜·스코어·예측 vs 실제·사후 심판 분석·편향 지목 팩터 bullet(±%p 배지 + diagnosis)·양팀 관점 "놓친 것"·경기 상세 링크. JSON-LD Article.
- `/reviews` 허브 2단 그리드: 좌 주간 리뷰(기존) + 우 회고(신규) 카드. 허브 → 리뷰 타입별 분기 구조로 확장.
- sitemap: /reviews/misses 정적 URL 추가 (daily changeFrequency, priority 0.75 — 실시간성 높음).
의도: AdSense 심사에서 "콘텐츠 독창성·투명성·E-E-A-T" 점수. 단순 스탯 나열 사이트와 차별화되는 시그널.
검증
- Test suite: 65/65 · kbo-data 160/160 · type-check 3/3 통과.
- 회고 유틸은 DB integration 성격이라 유닛 테스트 생략. post_game reasoning 파싱 실패 시 fallback 분기로 안전.
[0.5.8] - 2026-04-18
2026-04-18
v4-4 Phase 1-3 후속: 팀 프로필 10팀 (퀄리티 C3)
문제: 엔티티 단위 내부 링크가 선수(/players)만 있어 사이트 구조가 얇음. 팀은 KBO 10개 고정이라 정적 라우트로 즉시 가능하고, 예측 데이터를 팀 관점으로 재조합하면 선수 프로필과 상호 링크로 그래프 확장.
변경:
- `buildTeamProfile.ts`: predictions × games × players 조인. 팀 홈/원정 관점으로 팩터값 집계 (선발 FIP · 타선 wOBA · 불펜 FIP · 최근 폼 · Elo 시즌 평균), 예측 승자 비율, 검증 적중률, 팀 선발 투수 Top 5 (평균 FIP 낮은 순), 최근 8경기 예측 기록.
- `/teams/[code]`: 헤더(팀명+컬러+구장+파크팩터+파크 타입 자동 분류), 4지표 카드, 팩터 평균 5칸, 주요 선발 투수 링크 (→ /players/[id]), 최근 경기 테이블 (→ /analysis/game/[id]). JSON-LD SportsTeam schema.
- `/teams`: 10팀 카드 그리드 (컬러 닷 · 구장 · 파크팩터 태그).
- Header 네비: "팀" 항목 추가.
- sitemap: /teams + 10팀 프로필 URL 편입. KBO_TEAMS 키 기반 dynamic import로 정적 생성 안정.
결과: 엔티티 페이지 +11 (인덱스 1 + 팀 10). 투수 프로필 ↔ 팀 프로필 ↔ 경기 분석 페이지 상호 링크 그래프 형성.
검증
- Test suite: 65/65 · kbo-data 160/160 · type-check 3/3 통과.
- 팀 집계 로직은 DB integration 성격이라 유닛 테스트 생략 (ISR + 스모크).
[0.5.7] - 2026-04-17
2026-04-17
v4-4 Phase 1-3 후속: 투수 프로필 + Top 10 리더보드 (퀄리티 C2 · A안)
문제: 선수 개별 페이지가 없어 경기 분석·날짜 페이지 외엔 내부 링크 확장이 제한적. AdSense 심사에서 "깊이 있는 콘텐츠"는 엔티티 단위 페이지(선수/팀)도 중요.
제약: DB 스키마엔 players/pitcher_stats/batter_stats 테이블 존재하지만 stats 테이블 적재 코드 0건. 예측 엔진에 입력된 경기별 home_sp_fip/away_sp_fip만 실데이터. 따라서 C2 "Top 10×2 = 20명" 중 투수 10명만 먼저 공개하고 타자는 스크래퍼 추가 후 별도 phase로 분리.
변경:
- `buildPitcherLeaderboard.ts`: predictions + games 조인 → home_sp/away_sp 각각을 등판으로 집계 → 평균 FIP/xFIP, 등판 수, 해당 선수 팀이 예측 승자였는지 비율, 검증 N + 적중률. FIP ASC, 동률 시 등판 수 DESC로 Top N.
- `buildPitcherProfile.ts`: 개별 player_id 기준 시즌 누적 + 최근 10경기 등판 기록 (일자, 상대, 홈/원정, FIP, 점수, 예측 적중 여부). Profile Page JSON-LD Person + SportsTeam schema 반영.
- `/players` 리더보드: 투수 Top 10 테이블 (선수명 링크, 팀 컬러 닷, 등판·FIP·xFIP·적중률). 타자 섹션은 "준비 중" placeholder로 명시.
- `/players/[id]` 프로필: 헤더(이름+팀+throws), 4지표 카드 (등판 / 평균 FIP / 평균 xFIP / 예측 적중률), 최근 10경기 테이블 (각 행에 /analysis/game/[id] 링크), FanGraphs·Fancy Stats와 차이 고지 문구.
- Header 네비: "선수" 항목 추가 (AI 분석과 대시보드 사이).
- sitemap: /players 정적 + Top 10 /players/[id] 동적 URL 추가. 리더보드 실패 시에도 static 라우트는 노출 (try/catch 분기).
향후 C2 · B안 (별도 phase): 타자 스크래퍼 신규 (KBO Fancy Stats wOBA/wRC+) + batter_stats 적재 cron → 타자 Top 10 공개.
검증
- Test suite: 65/65 (기존 유지) · kbo-data 160/160 · type-check 3/3 통과.
- 리더보드/프로필 집계는 DB 의존 integration 성격이라 유닛 테스트는 생략 (ISR + 스모크 검증).
[0.5.6] - 2026-04-17
2026-04-17
v4-4 Phase 1-3 후속: 주간 리뷰 라우트 (퀄리티 C1)
문제: 사이트에 매주 주기적으로 새로 생성되는 콘텐츠 타입이 없었음. 개별 경기 페이지는 일회성 — AdSense 심사 시 "살아있는 블로그" 인상을 주려면 시즌 내내 축적되는 주간 단위 집계 페이지가 필요.
변경:
- `computeWeekRange.ts` + 테스트 12건: ISO 8601 (월요일 시작, 1월 4일이 week 1에 포함) 주차 계산. getWeekRangeFromDate, parseWeekId("2026-W16"), getRecentWeeks(n). 연말/연초 경계, week 53 유효 연도 검증 (2026 OK, 2025 reject) 포함.
- `buildWeeklyReview.ts`: 주간 predictions×games 집계. pickHighlights가 박빙 적중 / 고확신 적중 / 대역전 실패 3종 자동 선정. buildTeamStats는 예측 승자 기준 팀별 적중률. buildFactorInsights는 최소 3경기 기준 상관계수 기반 best/worst 팩터. buildSummary로 자동 요약 문장 생성.
- `/reviews/weekly/[week]/page.tsx`: 동적 주간 라우트. 요약 + 3지표 카드 + 하이라이트 카드 + 팀별 바 + 팩터 인사이트 + 최근 주 네비. JSON-LD Article + articleBody.
- `/reviews/weekly`: 현재 주로 redirect.
- `/reviews` 허브 개편: 상단에 "주간 리뷰" 섹션 추가 — 이번 주 CTA + 최근 4주 칩. 기존 경기 목록은 그대로.
- sitemap: /reviews/weekly + 최근 12주 /reviews/weekly/[yyyy-Www] URL 동적 추가. 매주 +1 URL 자동 축적.
결과: 2026-W16 기준 리뷰 페이지 자동 생성됨. 시즌 진행에 따라 매주 월요일 00:00 UTC (월 09:00 KST) 이후 새 주차 URL이 자동으로 sitemap 편입.
검증
- Test suite: 65/65 (기존 53 + 신규 computeWeekRange 12) · kbo-data 160/160 · type-check 3/3 통과.
- ISO 주차 엣지: 2024-12-30 → 2025-W01, 2023-01-01 → 2022-W52, 2026-W53 OK, 2025-W53 reject.
[0.5.5] - 2026-04-17
2026-04-17
v4-4 Phase 1-3 후속: 모델 v2.0 튜닝 진단 (퀄리티 B)
문제: v1.5 고정 가중치 (선발 FIP 15%, 타선 wOBA 15%, …)가 실제 예측 결과와 얼마나 일치하는지 측정할 객관적 지표가 없음. migration 010의 factor_error_summary는 postview 심판이 "틀렸다"고 의견을 낸 빈도만 집계 — 정량 방향성·correlation은 미측정.
변경:
- `factor-accuracy.ts` + 테스트 8건: verified prediction의 factors JSONB와 actual_home_win을 대조하여 팩터별 (a) n, (b) directional accuracy (중립 ±0.05 제외), (c) signed mean bias, (d) MAE, (e) Pearson correlation 계산. 팩터 유용성 점수 = 현재 가중치 × max(correlation, 0)로 제안 가중치를 기존 가중치 합 내에서 재분배.
- `buildModelTuningInsights.ts`: predictions × games 조인으로 FactorSample[] 구성 → analyzeFactorAccuracy 호출. 샘플 < 30이면 proposed weight = null (수집 중 표시).
- `ModelTuningInsights` 컴포넌트: 팩터별 진단 표 (N · 방향 정확률 · 편향 · 상관계수 · 현재/제안 가중치 diff). 색상으로 correlation 수준(녹: ≥0.2, 적: ≤-0.1), bias 크기(주: |≥0.1|) 강조. 해석 가이드 details.
- `/dashboard` 통합: 팩터 오답 Top 5 바로 아래 신규 섹션.
의도: 샘플 30+ 달성 시 수동 가중치 조정의 객관적 근거. v1.5 → v2.0 튜닝 시 이 리포트를 보고 DEFAULT_WEIGHTS 재설정. 현재 ~20경기이므로 당장 제안은 null이지만 인프라·지표 먼저 구축.
검증
- Test suite: 53/53 (기존 45 + 신규 factor-accuracy 8) · kbo-data 160/160 · type-check 3/3 통과.
- analyzeFactorAccuracy 엣지 케이스: 완벽 ±correlation, 중립 영역 제외, 샘플 < minSamples gating, factor 누락, proposedWeightsDelta 합계 검증.
[0.5.4] - 2026-04-17
2026-04-17
v4-4 Phase 1-3 후속: 경기 분석 본문 확장 (AdSense 퀄리티 대응 A)
문제: /analysis/game/[id] 페이지의 정량 모델 섹션이 팩터 숫자 10개만 표시(해설 0자)되고 있어 AdSense 심사에서 "얇은 콘텐츠" 판정 위험. /predictions/[date]에서 상세 페이지로의 CTA도 subtle variant로 묻혀 있음.
변경:
- `GameOverview` 컴포넌트 + `buildGameOverview` 유틸: 헤더 직후 자동 분류 태그(투수전/타격전/박빙/우세 뚜렷) + 1-2줄 경기 요약. 승률 격차·h2h 강세 여부에 따라 서술 분기.
- `DetailedFactorAnalysis` 컴포넌트 + `explainFactor` 유틸: 10팩터 각각에 (a) 원정/홈 수치, (b) 격차 기반 한국어 1-2줄 해설, (c) 예측 기여도 %p 계산. 팀 컬러 보더 + 가중치 내림차순 정렬. 기존 raw 숫자 블록은 <details> 메타 정보로 강등.
- `/predictions/[date]` CTA 강화: 경기 카드 끝에 AnalysisLink variant="primary" 버튼 — "팩터별 심층 해설 · 에이전트 토론 전문 보기" 명확한 유도.
- JSON-LD `articleBody` 추가: overview + verdict + home/away reasoning을 단일 필드로 합쳐 검색 엔진에 본문 시그널 노출.
결과:
- /analysis/game/[id] 본문: 기존 ~1650-2650자 → 약 2500-3500자 (팩터 해설 600-1000자, 개요 100-200자 추가)
- /predictions/[date]: 카드 요약은 그대로, CTA만 강조 (중복 콘텐츠 회피)
- AdSense 심사 기준 "thin content" 판정 회피 강화, SEO 본문 시그널 확대
검증
- Test suite: 45/45 (기존 33 + 신규 factor-explanations 12) · kbo-data 160/160 · type-check 3/3 통과.
- buildGameOverview, explainFactor 단위 테스트로 태그 분류·해설 생성·기여도 계산 검증.
[0.5.3] - 2026-04-17
2026-04-17
v4-4 Phase 1-3 후속: GA4 + GSC 연결
- Google Analytics 4: @next/third-parties/google 설치 + <GoogleAnalytics gaId="G-2886XKWG4Y" /> layout.tsx 통합. 기존 Vercel Analytics와 병렬 수집(역할 분담 — Vercel은 퍼포먼스/실시간, GA4는 AdSense 심사·장기 퍼널·사용자 속성). 서비스 측정 ID 하드코딩 (public 값 — 추후 도메인 이전 시 NEXT_PUBLIC_SITE_URL과 함께 env 추출 예정).
- Google Search Console: metadata.verification.google 필드로 소유권 확인 meta 태그 렌더. property https://moneyballscore.vercel.app 등록 + sitemap.xml 제출 완료.
검증 결과
- Test suite: 33/33 · 160/160 · type-check 3/3 통과.
- dev server smoke: / HTML에 G-2886XKWG4Y gtag + googletagmanager 스크립트 + GSC verification meta 모두 렌더 확인.
다음 단계 (퀄리티 확보)
콘텐츠 본문 확장 → 모델 v2.0 오차분석 → 특집 콘텐츠(주간 리뷰·프로필) 순으로 품질 올린 뒤 자체 도메인 + AdSense 심사 일괄 진행.
[0.5.2] - 2026-04-17
2026-04-17
v4-4 Phase 1-3: AdSense 심사용 법적 페이지 3종
- `/privacy`: 개인정보처리방침. Vercel Analytics 쿠키리스 수집 범위 명시, 서버 로그 30일 보관, 회원 개인정보 미수집. 제3자 서비스 고지(Vercel/Supabase/Anthropic) + 데이터 출처 3개(KBO/Fancy Stats/FanGraphs). Google AdSense 쿠키 선제 포함 — 승인 후 즉시 유효, 사용자 옵트아웃 경로(adssettings.google.com, aboutads.info) 링크 제공.
- `/terms`: 이용약관 10개 조항. 서비스 성격(정보 제공·교육 목적), 스포츠 베팅 관련 고지(국민체육진흥법 언급 + 사설 도박 무관 명시), 예측 정확성 면책, 지적 재산권, 금지 행위, 서비스 중단 권한, 책임 제한(AS IS), 준거법(대한민국).
- `/contact`: 문의 페이지. moneyballscore777@gmail.com 공개, 5개 문의 유형별 mailto 프리필 링크 (데이터 오류 / 예측 해석 / 협업 / 개인정보 / 기타). 자주 묻는 질문은 about·dashboard·terms 링크로 우회.
- Footer 2단 분리: 서비스 네비(기존) + 법적 네비(신규 privacy/terms/contact) 분리. disclaimer 강화 — "스포츠 토토·사설 베팅·금전 거래 일체 권유·중개·조장하지 않음" 명시.
- sitemap 업데이트: 3개 정적 URL 추가 (yearly changeFrequency, priority 0.3).
의도
Google AdSense 심사 거부 사유 중 "개인정보처리방침·연락처 누락"·"콘텐츠 성격 불분명"을 해소. 스포츠 예측 도메인은 gambling 카테고리에 근접해 엄격 심사되므로 Terms에 베팅 조장 거부 명시가 특히 중요. 심사 통과율을 30~40% → 60%+ 수준으로 끌어올리는 것이 목표.
검증 결과
- Test suite: apps/moneyball 33/33 · kbo-data 160/160 · type-check 3/3 통과 (변경 없음).
- dev server smoke: /privacy /terms /contact 전부 200 OK.
- sitemap.xml 3개 신규 URL 포함 확인.
[0.5.1] - 2026-04-17
2026-04-17
v4-4 Phase 1-2: SEO + 콘텐츠 자동화
- 동적 OG 이미지: apps/moneyball/src/app/predictions/[date]/opengraph-image.tsx — 날짜별 1200×630 PNG 자동 생성. 브랜드·날짜·경기 수·적중률 뱃지. 소셜 공유 링크가 이제 고유 썸네일.
- SportsEvent + Article JSON-LD: /predictions/[date]에 경기별 SportsEvent 스키마 + 페이지 전체 Article 스키마. Google rich result 후보 등록. (기존 /analysis/game/[id]의 Article과 층위 다름.)
- sitemap에 날짜별 URL 추가: /predictions/2026-04-17 같은 일자 페이지를 sitemap.xml에 포함. 기존 /analysis/game/[id] 외에 일별 묶음 페이지도 크롤링 대상.
- 심판 reasoning 카드 per game: JudgeReasoningCard 컴포넌트 — 경기 카드 아래 judge agent의 300-500자 한글 분석 + 양팀 에이전트 요약 2줄. AdSense "thin content" 회피, 실제 본문 확보.
- intro 카피 자동 생성: 날짜·경기 수·적중률·가장 박빙 매치업 기반 intro 한 줄. 검증 상태별로 문구 분기 (예정 / 진행중 / 최종).
- 저자 바이라인: "MoneyBall AI · YYYY-MM-DD HH:MM KST" 표기 + Article JSON-LD의 author 필드. 블로그 포스트 외형.
- metadata 강화: Open Graph type=article + publishedTime + canonical, Twitter summary_large_image. 공유 메타 전면 정비.
수정
- /predictions/[date] verified 카운트 버그: predictions: []일 때 is_correct가 undefined라 기존 !== null 필터를 통과하던 문제. predicted(예측 존재) → verified(is_correct != null) → correct(is_correct === true) 3단 분리로 정확히 세도록 수정.
검증 결과
- Test suite: apps/moneyball 33/33 · kbo-data 160/160 · type-check 3/3 통과.
- dev server smoke: /predictions/2026-04-16 200 OK, JSON-LD 7블록(WebSite + Article + 5 SportsEvent), intro "최종 결과 100% (5/5) 가장 박빙 KT vs NC" 자동 생성.
- /predictions/2026-04-17/opengraph-image 200 OK 95KB PNG 1200×630.
- sitemap.xml 30 URL (6 static + 4 prediction dates + 20 games).
[0.5.0] - 2026-04-17
2026-04-17
v4-4 Phase 1-1: 적중률 공개 대시보드 강화
- `/dashboard` 권위 성과 페이지로 통합: 기존 3섹션(누적·팀별·요약) 위에 일자별 적중률, 확신 구간별 캘리브레이션, 팩터 오답 Top 5 신규 추가. 베터에게 "이 시스템의 성과"를 한 곳에서 완결된 답 형태로 제공.
- 모수 일관성 config 상수화: apps/moneyball/src/config/model.ts의 CURRENT_DEBATE_VERSION = 'v2-persona4' 단일 진실 소스. 버전 전환 시 한 줄만 바꾸면 대시보드 모수가 새 세대로 리셋, 과거 성과는 archive 페이지로 분리 가능.
- `/analysis` 역할 분리: 시즌 AI 리더보드 섹션 제거, '오늘 빅매치' 전용 페이지로. /dashboard와의 수치 중복·불일치 리스크 제거.
- ISR 통일: /dashboard 300s → 3600s. /analysis와 맞춤. verify가 하루 1회 23시 KST에만 돌아서 5분 TTL은 과잉.
- AccuracySummary 라벨 정합성: 기존 "고확신(70%+)" 표기가 실제 필터(confidence ≥ 0.4)와 불일치하던 pre-existing 버그를 60%+ 기준 + 라벨로 정리.
- Pure 함수 + 유닛테스트: buildDailyAccuracy (날짜 집계 + gap skip + 정렬 보장), buildConfidenceBuckets (4버킷 경계값 + N<10 게이팅). Vitest 8건 신규.
- 에러 바운더리: apps/moneyball/src/app/dashboard/error.tsx로 Supabase 실패 시 사용자 안내 + 재시도 버튼.
검증 결과
- /plan-eng-review CLEARED: 11 findings 전부 반영 (스코프 축소 1 + 자명한 수정 10). MINOR 결정은 v4-4 Phase 진입 + user-facing 신규 섹션 3개 기준.
- Test suite: apps/moneyball 33/33 · packages/kbo-data 160/160 · type-check 3/3 packages 통과 (신규 193건 포함).
- dev server localhost 검증: /dashboard 200 OK, 7섹션 렌더, empty state 게이팅 작동 (일자별 "3일 이상 검증되면", 확신 구간 "10경기 이상 쌓이면"), 실데이터와 일치 (5/5 적중률, 팩터 Top 3 = 수비 SFR / 최근폼 / 불펜 FIP).
[0.4.3] - 2026-04-15
2026-04-15
Phase v4-3: Compound 루프 완성 + 포스트뷰 시스템
- rivalry-memory.ts 신규: 과거 h2h 5경기 + agent_memories 읽기 경로 → team-agent 프롬프트 주입. Compound 루프의 빠진 절반을 닫아 에이전트가 과거 학습 내용을 실제로 참조할 수 있게 됨.
- 포스트뷰 시스템: 경기 종료 후 홈/원정 사후 분석 에이전트 + 심판 factor-level attribution. predictions.post_game row로 저장. "왜 틀렸나"가 factor 이름으로 지목됨 (예: home_bullpen_fip +0.15 편향으로 오예측).
- 🔴 숨은 버그 수정: retro.ts가 homeCode만 insert하고 away 팀 메모리를 완전히 무시하던 버그 수정. Phase C/D 머지 이후 2026-04-15까지 Compound 루프가 실질적으로 50% 반쪽만 작동하던 상태 종료.
- Validator lenient 모드: 로컬 Ollama 개발에서 WARN_LIMIT=5, 선수명 발명 hard→warn 강등. NODE_ENV=production에서는 무조건 strict 강제(프로덕션 환각 leak 차단).
- 자동 postview 트리거: live-update.yml cron 윈도를 2시간 확장(18:00~00:50 KST)하고 내부에서 경기 종료 감지 시 runPostviewDaily 자동 호출. 00:50 이후 종료 극단 경기는 다음날 아침 daily-pipeline fallback으로 cleanup.
- migration 009: agent_memories TRUNCATE + UNIQUE(team_code, memory_type, content) + idx_agent_memories_read 인덱스 + proposals 테이블 신규 (백테스트 스키마 준비, v5에서 자동화).
- memory_type 분류 휴리스틱: strength/weakness/pattern/matchup 4종 분류 + valid_until 7일 유효기간 + source_game_id FK + upsert(onConflict) 중복 방지.
- dev-postview.ts 스크립트: Ollama 로컬 드라이런 ($0, 60s, 3010 tokens). factorErrors가 실제 factor 이름 정확히 지목하는 것 확인.
- 테스트 32건 추가 → 총 129/129 통과
검증 결과
- /plan-eng-review: 8 findings 전부 플랜 반영 (A1~A5 architecture + C1~C3 code quality)
- Ollama dev-debate + dev-postview 드라이런: Claude API 크레딧 0원으로 전체 경로 검증
- 프로덕션 Claude strict 경로 재트리거 1회 성공: 5경기 모두 v2.0-debate row 생성, validator reject 0건, Sonnet 분석문 정상 저장
[0.2.0] - 2026-04-14
2026-04-14
Phase 2 전체 구현 + 프로덕션 배포
- 3소스 데이터 파이프라인: KBO 공식 API + Fancy Stats + FanGraphs에서 매일 자동 수집
- 예측 엔진 v1.5: 10팩터 가중합산 (FIP, xFIP, wOBA, 불펜, 최근폼, WAR, Elo, SFR, 상대전적, 구장)
- 이닝별 라이브 업데이트: 경기 중 10분 간격 승리확률 보정
- 대시보드: Recharts 누적 적중률 + 팀별 성과 차트
- 예측 투명성: 팩터별 기여도 시각화 (FactorBreakdown 컴포넌트)
- Telegram 봇: 예측 생성 + 결과 적중률 자동 알림
- 파이프라인 모니터링: 실행 히스토리 DB + 헬스체크 API
- 디자인 리뷰: 다크 그린 컬러 시스템, 승리확률 표시, 히어로 그라데이션
인프라
- GitHub Actions cron 2회/일 (KST 15:00 + 23:00)
- Vercel 배포: moneyballscore.vercel.app
- Supabase 마이그레이션 001~005
- 팀 코드 KBO 공식 API 코드로 통일
[0.1.0] - 2026-04-14
2026-04-14
Phase 1 초기 구축
- 모노레포 셋업 (pnpm + turborepo)
- Next.js 16 App Router UI 셸
- Supabase 스키마 + RLS
- 예측 카드 컴포넌트, 적중률 요약, 방법론 페이지

P1: LLM Provider CREDIT_EXHAUSTED 자동 failover ai_agent

P2: LLM 백엔드 관측성 레이어 (DB 컬럼 + 이벤트 테이블) ai_agent

P3: LLM 다운그레이드 구간 UI — 팩터 배지 폴백 content_auto

Anti-P1: conf=0.3 flat 무음 감지 지연 anti_pattern

이번 주 성과 요약

요일별 패턴

팩터 인사이트

가중치 조정 결정

CREDIT_EXHAUSTED 상태 (2026-06-06~)

배경

3 milestone 순차 도달

정합 sweep (waves 186~196, cycle 1459~1463)

v2.1-B rejected 근거

CREDIT_EXHAUSTED 상태 (2026-06-06~)

v1.8 유지 확정의 의미

P5 — Team-Level Quantitative Overconfidence (data_pipeline / operational_analysis)

P6 — Weekend Recovery Pattern (operational_analysis)

P1 — Neutral-Factor Sparse Detection (ai_agent / data_pipeline)

P2 — Silent LLM Fallback Masking (anti_pattern)

P3 — Registry Sweep Wave (quality_guard)

P4 — Alert Cascade by Pipeline Mode (data_pipeline)

주간 성과 요약

요일별 적중률

예측 실패 9경기

핵심 발견

팀별 예측 적중률 (v1.8 전체, 8+ 게임)

v1.8 누적 cohort

v2.0-cycle231 후보 baseline simulation 박제

한계 명시

결론

plan #8 status 갱신

1225회 OOS 검증 (PR #1246 cf86586) — 256 rules 100% PASS + 5등 6건 + score breakdown

plan #7 Step E + F partial 박제 (PR #1247 b1da036) — cron 자동 갱신

잔여 carry-over (자율 영역 외)

regression

plan #5 factor breakdown timeline integration 박제 6/6 Step closure

Sat reversion — Thu/Fri 1/10 noise 가설 강화

v1.8 첫 주 측정 — n=15 noise 영역, 가중치 유지

v1.8 era silent fallback 발견 (긴급)

W22 (5/11~5/18) 부분 데이터

Added

Fixed

Changed

누적 현황 (n=94, 2026-05-13 기준)

v1.7-revert 완결 팩터 분석 (n=32)

핵심 발견

가중치 조정 결론

W19 성과 (2026-05-05~10): 15/27 = 55.6%, Brier 0.2542

W20 partial (2026-05-12 화요일): 2/5 = 40.0%

핵심 발견

가중치 조정 결론

[ai_agent] api-credit-failure-labeling-guard

[anti_pattern] rolling-window-factor-correlation-contradiction

[content_auto] cjk-safe-og-image-latin-fallback

[anti_pattern] accuracy-query-without-prediction-type-filter

[data_pipeline] per-category-accuracy-outlier-detection

팀별 예측 적중률 분석 (전체 n=94, 3경기 이상)

요일별 적중률 (전체 n=94)

v1.8 첫날 (2026-05-13) 시작 확인

재사용 패턴 추출 (cycles 334~341)

v1.8 scoring_rule 첫 배치 시작 확인

주간 성과 요약

W21 요일별 분석 (신규 발견)

일요일 격리 효과 (핵심 발견)

W22 5/12 원정팀 압승 패턴

가중치 조정 결정

Added

Changed

Fixed

CI/CD 보안 강화 (PR #361, Fixes #360)

주간 성과 요약

W22 5/12 주요 관찰

팩터별 방향 정확도 (전체 n=94)

고확신 역전 현상 지속

가중치 조정 결정

변경 내용

근거

~~미완료 (n=150 도달 후)~~ — 완료: v1.8 유지 확정 (cycle 1460)

주간 성과 요약

요일별 패턴 (전체 n=89)

P1: LLM Provider CREDIT_EXHAUSTED 자동 failover `ai_agent`

P2: LLM 백엔드 관측성 레이어 (DB 컬럼 + 이벤트 테이블) `ai_agent`

P3: LLM 다운그레이드 구간 UI — 팩터 배지 폴백 `content_auto`

Anti-P1: conf=0.3 flat 무음 감지 지연 `anti_pattern`

[ai_agent] `api-credit-failure-labeling-guard`

[anti_pattern] `rolling-window-factor-correlation-contradiction`

[content_auto] `cjk-safe-og-image-latin-fallback`

[anti_pattern] `accuracy-query-without-prediction-type-filter`

[data_pipeline] `per-category-accuracy-outlier-detection`

미완료 (n=150 도달 후) — 완료: v1.8 유지 확정 (cycle 1460)