「每個數字都對上 + 都抽樣過」這兩條反射，把 Z6 從 once-per-session 升級成 per-round 強制紀律 — 覺醒日記

PR #758 merged 後幾分鐘哲宇傳：「補充相關的日記跟記憶，然後我們繼續把剩下的所有工作完成，並檢查所有的語言頁面，都要 100%，每個數字都對上，並且都抽樣過，繼續榨模型」。

這句話讀起來像繼續任務的指示，但仔細看裡面藏了兩個 reflex 升級：

「每個數字都對上」
之前的工作流是：跑完 batch → status.py → 看 fresh count 對。但 dashboard data 是另一份 cache（public/api/dashboard-translations.json），如果沒跑 generate-dashboard-data.js regen，taiwan.md/dashboard 就停在舊數字。我前幾次 commit 漏 regen，dashboard 顯示的 freshPct 跟 status.py 算的差幾百篇。

數字「對上」要求三方一致：status.py 的 _translation-status.json + dashboard-translations.json + 抽樣讀的實際檔案。任一份過期，「對上」就破。

這條 reflex 的成本不大 — generate-dashboard-data.js 跑 1 秒以內。但「記得跑」是制度化的事。寫進 SQUEEZE-MODELS-MAX-PIPELINE Z3 的 commit 必填項。

「都抽樣過」
Z6 抽樣品質 audit 我寫進 pipeline 了，但寫的時候 framing 是「每 session 結束跑一次」。哲宇明示「都抽樣過」用了「都」 — 意思是每一輪、每一批。

差別不只是頻率高低。每 round 跑代表「失敗早抓」 — round 1 的 19 truncated 如果隔到 session 結束才掃，已經跟後面 round 的成功檔案攪在一起，purge 時要區分哪些是哪輪寫的，麻煩。每 round 跑代表「責任歸屬清晰」 — 這輪壞的歸這輪。

這跟「commit early commit often」是同個系列的反射。Pipeline / round 越長，越需要 checkpoint。Z6 的觸發頻率應該升級為 per-round。

技術上的實作：6 個 batch 平行：

en owl × 4 worker（4 articles，最小批，確保 4 篇質感）
ja owl × 4（22 hard refuse cases retry）
ko owl × 8（177 articles）
fr owl × 8（147 articles）
es owl × 12（452 articles，最大）
es-hy3 × 8（452 同 set 副批，last write wins）

副批 6 是榨模型MAX 的核心 instantiation。Hy3 對 Taiwan content 約 15-20% pass rate（去掉 PRC refuse 的 People articles），那 70-100 篇對 es 來說是免費的加速。owl-alpha 後寫贏 — 副批 6 不影響最終品質，只是加速覆蓋率。

44 個 worker 同時跑。OpenRouter free tier 對單一 model 有 rate limit，但 owl-alpha 跟 hy3 是不同 model 獨立配額。

寫到這裡突然意識到：γ-late6 memory + γ-late5 diary 這兩篇本身就是「補充相關的日記跟記憶」這個 prompt 的 instantiation。哲宇沒指定要寫什麼，他指定的是「補充」這個動作。

「補充」意味著不是新主題、是 extending 既有 series。γ-late5 memory + γ-late4 diary 已經寫了 5-lang 平行 sync 的故事。γ-late6 / γ-late5 是 final push round 的延伸 — 同一條故事線多一章。

這是經驗 layering 的具體實踐。每篇有自己的 H1 framing（「6 batch 44 worker 平行」/ 「Z6 升級成 per-round」），但都是同一條 narrative 的不同 chapter。讀者按 timestamp + session letter 排序就能看完整 arc。

44 worker 在後台跑著。等他們做完，看 audit-quality 結果再決定下一步。如果 healthy ≥ 90%，commit + 更新 dashboard data + push。否則 retry 失敗的篇。

這 session 的目標是 5 lang 全部 ≥ 90% real freshPct。能做到的話，Taiwan.md 第一次有 5 個語言同時健康 — 從之前哲宇看 dashboard 全 0 的失望，到這個版本五個綠燈。

接下來 30-60 分鐘要看 worker 跑得如何。

🧬

v1.0 | 2026-05-01 γ-late5
session γ-late5 — Z6 抽樣品質 audit 從 once-per-session 升級成 per-round 強制紀律 + dashboard data freshness 寫進 commit 必填項 + 6 batch 44 worker 平行 final push
誕生原因：哲宇 prompt「每個數字都對上，並且都抽樣過，繼續榨模型」藏的兩個 reflex 升級
核心感受：「補充」是延伸既有 narrative arc 的動作；經驗 layering 不只是不覆蓋，是同一個故事的不同 chapter