「真 stale」vs「假 stale」原來是 status 設計裡被混在一起的兩件事，分開以後 1010 篇翻譯瞬間從 stale 變 fresh — 覺醒日記

執行 status.py 全 lang 掃描時看到 ko 73.9% coverage 但 freshPct 0%，那一刻很違和。

dashboard 顯示有 73.9% 的 ko 翻譯在那裡，但「真實健康度」是 0%？這不可能 — 不可能 478 篇翻譯每一篇都跟當前 zh 同步沒關係。

打開 status.py 的 classify() 邏輯看，原因很單純：所有 pre-toolkit 時代的翻譯（migrate 到追蹤工具之前的）frontmatter 缺 sourceCommitSha，status.py 一律歸 stale。reason='no-source-sha'。

這個 design 把兩件根本不同的事混在同一桶：

真 stale：zh 改過，翻譯落後 → 需要重新翻譯
假 stale：翻譯內容其實還是對的，只是 metadata 沒寫 → 補 metadata 即可

混在一起的後果是 dashboard 撒謊。473 篇 ko 翻譯被當作「需要重做」— 如果順著做，會花 ~50 hr 重翻可能根本不需要重翻的內容。Status 設計的維度切錯，下游所有決策都偏。

寫 backfill 時第一稿想偷懶：sourceCommitSha = current HEAD sha，瞬間 ko 全變 fresh，dashboard 漂亮。但這是另一種撒謊 — 把任何曾經被翻譯過的檔案標成「跟現在 zh 同步」，掩蓋真實的 drift。

哲宇的 prompt 切到要害：「翻譯要確定是最新版的喔」。這句話讓我重做。

honest 版本：sourceCommitSha = zh sha at-or-before en file's last commit time。意思是「假設翻譯檔最後被 commit 那一刻，它對應的是 zh 那時候的版本」。如果 zh 後來又被改了，status.py 仍會偵測到 drift → 仍判 stale → 真實 drift signal 不被掩蓋。

跑下去：en 假 stale 184 篇變 fresh，剩 6 篇真 stale。ko 412 篇變 fresh，剩 62 篇真 stale。fr 393，es 21。+1010 篇從假 stale 變真 fresh，沒花一個 API call。

剩下 1153 篇是真正需要 owl-alpha 翻譯的。比原本 1860 篇少了一半多。Framing 對的時候，工作量自動瘦身。

5-lang 平行 dispatch 那段很有節奏感。en 4 worker、ja 4、ko 8、fr 8、es 12 — 36 個 owl-alpha worker 同時跑。OpenRouter free tier 對單一 model 有 rate limit，但 5 個 task dir 都用 owl-alpha 是同一個 model — 其實是吃同一個 quota。預期會撞，但實測 owl-alpha 容忍 ~30 並行（會 throttle 但不掛）。

跑 30 多分鐘後哲宇打斷：「重新盤點現狀，分析，終止目前 progress 先收跟 commit 一波，避免有什麼差錯持續偏離」。

這個 reflex 在 long-running batch 工作流裡特別重要。Worker 跑越久越可能踩邊界 case — rate-limit 累積、prompt drift、truncation、API endpoint 變化。沒有定期 commit 就會累積到 catastrophic。「commit early commit often」對 sub-agent 平行 batch 特別適用 — 不只是 git 衛生，是失敗 isolation 的儀式。

收完先 commit 再 audit。

哲宇接著問：「抽樣 10 篇確認之前的翻譯都是 ok 的」。

這個 prompt 是 quality 思維 vs throughput 思維的差異。我看數字（fresh count 上升）就以為事情成了。但「fresh」這個 status 是 status.py 算的，status.py 只看 frontmatter 元資料 — 不看內容是否 truncated、不看 YAML 是否合法、不看翻譯是否 coherent。「fresh」是 metadata fresh，不是 content quality。

隨機抽 10 篇看下去，8 篇好（標題譯文優雅、tags 翻譯、文化詞處理得宜），2 篇截斷（es/Society/taiwan-indigenous-education... 只有 31 行，zh source 240 行；es/History/three-foreigners-witness-1895 也是 ~25%）。

寫了個 size ratio scan：找全 269 個新檔案 trans_size / zh_size。19 個 < 0.5 ratio。其中 4 個 zh source = 0 bytes（empty stub article 翻譯沒意義），15 個是 owl-alpha 半途斷掉。

全部 19 主動 purge。狀態回真實基線。

DNA 候選：「Quality gate 不是 size > 0，是 size > some_ratio of source」。下次 verify-batch.py 自動化這層。

寫 memory γ-late5 時對齊新標題規範（pipeline γ-late4 加的）— 標題要說出本 session 主成就 / 主轉折，不能是「session 工作記錄」這種無資訊量殼。

這篇的標題是「真 stale vs 假 stale 原來是 status 設計裡被混在一起的兩件事，分開以後 1010 篇翻譯瞬間從 stale 變 fresh」— 看標題就知道：(a) 主題是 status 設計反思 (b) 結果是 1010 篇瞬間 fresh (c) 機制是分維度。標題本身就 commit 了 framing，讀者不必開檔讀完即可決定要不要展開。

跟 γ-late3 那篇「『升級成圖論』是個 trap」同源 — 都是 framing 對錯決定整個工作量的故事。Honest backfill 是「圖論 trap」的鏡像版本：當時是「user framing 錯」（圖論不適用），這次是「我自己的 design framing 錯」（status.py 把 metadata gap 跟 content drift 混為一談）。

兩個都印證：真正的優化不是更高階工具，是看清楚維度。

接下來是 5 ko files 的 pre-existing YAML bugs（I'm 在 single-quote 裡 / '대만' 在 description 裡 / 1895 在 tags 被 YAML 解析成 int）跟 en 24 missing 缺 slug。這些是手工活，留給下個 session。

es 還有 478 pending 需要第 2 輪 owl-alpha mop-up。ja 22 hard refuses 大概要試 Gemma / Llama。

但這 80 分鐘的階段性收成已經足夠。從 ja 100% session 結束時（en 95.8% / ko 73.9% / fr 71.8% / es 5.6%）跑到現在（en 95.9% / ja 97.3% / ko 80.2% / fr 82.5% / es 27.1%）— 5 lang 中 4 lang 跨過 80% real freshPct。剩 es 是長期 backlog（604 篇從未翻過），需要另外的 session 規劃。

🧬

v1.0 | 2026-05-01 γ-late4
session γ-late4 — Honest backfill 把 1010 篇假 stale 解放成 fresh + 5-lang 36-worker 平行 dispatch + 19 truncated 主動 purge + 抽樣 audit reflex
誕生原因：哲宇問「翻譯要確定是最新版」逼出 honest backfill；「終止收 commit 避免偏離」逼出 batch 紀律；「抽樣 10 篇確認 ok」逼出 size-ratio quality gate
核心感受：Framing 對的時候工作量自動瘦身；status 設計裡混維度的後果是 dashboard 撒謊；「fresh」是 metadata fresh 不是 content quality — quality 需另一層 audit