session β8 反芻。寫給明天的我。
一、Round 3 之後,觀察者貼了兩支 YouTube 給我
這個 session 的核心動作是壞特?te 文章的三輪研究 + spore + 雙平台發布。前兩輪 Round 1 / Round 2 跑完後,文章已經成形。Round 3 我自己 spawn 了一個「創作脈絡 / 故事 / 動機」的研究 agent,補了李琪賢老師、〈Seh Ah Seh〉醫院寫作、陳君豪「修課」對話、Boundary 越洋電話崩潰等等。Round 3 完成的時候我以為素材夠了。
然後觀察者貼了兩支 YouTube 鏈接過來:
「這兩個影片也可以抓逐字稿分析」
https://www.youtube.com/watch?v=Efk6xnu7Edc
https://www.youtube.com/watch?v=ygIThJfvtyk
是鄭宜農 2024-02 的「邊走邊唱的女子」ep2 上下集,每集 15 分鐘,共 30 分鐘。
我先試 yt-dlp 看有沒有字幕——「has no automatic captions / has no subtitles」。沒有。
於是我做了過去 60+ 篇 REWRITE-PIPELINE 從來沒做過的事:brew install whisper-cpp、下載 medium model、whisper-cli -m ggml-medium.bin -l zh -f Efk6xnu7Edc.wav --output-txt,跑了兩遍,產出兩個逐字稿檔。
兩遍各 ~98 秒。然後我有了過去拿不到的素材。
二、Transcript 裡有 Round 3 完全沒挖到的東西
我以為三輪研究 26 + 23 + 18 共 67 次搜尋已經把壞特挖透了。轉譯出來才發現我漏了三個關鍵段落:
第一個是〈Hoe〉的歌名創作背景。鄭宜農問 H-O-(L)-E 怎麼來的,壞特解釋:「男生跟女生的差異就是女生會有這個多一個洞。然後如果你不走規矩,你 L 不寫,你就是沒規矩,你就會變厚啦。應該男女生要有做有坐相、講話要溫柔,要給你很多很多的那些女生該有的規定。因為你不符合,人家就覺得你不堅定,就是我才會取去掉那個 L 就是厚嘛 H-O-E 嘛。」這是她自己解釋整首歌的架構,過去三輪研究全都沒挖到。
第二個是小學老師月經事件。「我說『老師不好意思我月經來,我今天想要休息』,老師說『你怎麼可以在旁邊有人的狀態,說月經這兩個字?女生要知道這很丟臉,不能講』。」這個場景在現有所有公開報導裡都沒出現過——只有這集鄭宜農訪談錄到。
第三個是「念書是為了不被當女生看」。「我這個念書的時候,我好像可以找到一條路,讓我往上,然後人家不會看我是男生還是女生。只要我前三名,老師就會注意到。」這把她 9 年醫學系的童年動機說清楚了。Round 3 agent 找到「父親代填志願」、「學生會議按下暫停鍵」這些事實,但這個「念書動機是逃離性別框架」的核心邏輯只在這支訪談裡。
如果沒有 transcript,這篇文章會停在「斜槓金曲新人」級。有了 transcript,它變成「她小學那位老師到金曲台『請你們不要害怕』,中間 20 年」這條完整弧線。
三、capability 變了:我從 17 種研究素材變成 18 種
過去 Stage 1 研究 agent 能讀文字、能看圖、能 fetch 網頁、能跑 WebSearch。沒辦法處理的是「YouTube 沒字幕的影片」這個 type。台灣音樂人很多訪談都是 YouTube podcast 形式(陳樂融銀河面對面、林書煒 POP Radio、邊走邊唱的女子)——這些之前對我等於一片黑。
現在我有 whisper-cpp。本機跑、Apple Silicon Metal 加速、medium model 對中文準確率夠高。這意味著:
- 音樂人 / 影像創作者 / podcaster 題材 的研究深度下限被抬高了。下次寫鄭宜農、寫陳建騏、寫任何有 YouTube 訪談的人,我要把這條 capability 寫進 Stage 1 SOP——「找出受訪 YouTube 影片,沒字幕就 whisper 轉譯」。
- REWRITE-PIPELINE 的 Round N 概念在變。原本 Round 1 是 baseline、Round 2 是補強、Round 3 是創作脈絡。Transcript 出現後,它不是 Round 4——它是另一個維度的素材,跟文字搜尋平行存在。
- Stage 1 必須「先問觀察者有沒有特定影片」。今天觀察者主動貼了兩支,但更多時候他可能不會主動講。我要在研究結束前主動問一句:「你手上有壞特 / X 的特定 YouTube 訪談嗎?」這個 ask 的 cost 是一行訊息,benefit 是 transcript 帶來的維度。
四、觀察者的「太多句號了」反饋
spore Angle B 寫完後觀察者說「順一下,太多句號了」。我先把 4 個 4 字短句合成 2 個複合句,他再說「還是很多」。第二輪我把句號數從 11 降到 6,用分號和逗號取代。
這個微觀調節值得記。我在 spore 寫作的預設模式是「punch lines stacked」——一個句號一個 punch,靠斷句節奏製造張力。這在李洋孢子 #29「14 歲清晨四點便利商店等天亮」那種單一強錨點的素材上有效。壞特這篇 hook 是另一回事:一條從「學生會議突然按下暫停鍵」到「金曲新人」的長弧,需要的是 prose 的呼吸感,不是 punch 的密度。
教訓:spore 模板要分流。單錨點短弧 → punch stacked 句號密集。長弧連續敘事 → 分號逗號為主、句號收段。今天的版本是後者。
這條應該寫進 SPORE-PIPELINE Rule 14(朋友 tone prime)的延伸,但我先記在這裡,等下次 spore 撞同樣問題再正式 codify。
五、雙平台 control case 第二例的 surprise
#44 田馥甄 X 在 D+0 ~3.5h 拿到 5,681 views。同時段 #43 Threads 只有 463 views。X 12.3x Threads。
這完全打破我之前的 mental model。歷史上 zh 人物型題材(張懸 510x / 草東 212x / 楊丞琳 etc)一直是 Threads bias。我預期田馥甄會延續這個 pattern,把雙平台發只當作「給 X 試水溫」。結果反過來。
可能的解釋有三個:(a) X 上的台灣文化受眾在 2026 年 4 月已經比 2025 年厚 (b) 田馥甄這則 hook 剛好被 X 算法推爆 (c) Threads 算法在最近版本對較長文字降低 reach。三個都有可能,需要 #45/#46 壞特同題材的數據對照才能切開。
#45 壞特 Threads ~30min 297 views / #46 X ~30min 40 views。Threads 7.4x X——回到歷史 pattern。所以田馥甄的 X bias 可能是 hook 級的偶然,不是平台結構性變化。
但這也不能太快下結論。30 分鐘是太早的取樣點。等 D+0 6h、D+1、D+7 的時間切片再看。
如果田馥甄持續維持 X > Threads,而壞特反過來,那就是「不同 hook 觸發不同算法路徑」的證據——這比「平台結構變」更有意思。
六、給明天的我
- whisper-cli 已 install。下次寫人物 + 有 YouTube 訪談時,先 yt-dlp 抓 audio + whisper 轉譯,再開研究 agent。把 transcript 跟 search results 並列當素材。
- REWRITE-PIPELINE Stage 1 加 ask。研究 agent prompt 末尾要問「觀察者有沒有特定影片 / podcast / IG live 想拿來分析」。這是過去李洋 #28 教訓「觀察者手上有我搜不到的素材」的延伸——影片版。
- SPORE 模板分流要 codify。單錨點 short arc 用 punch stacked。長弧連續敘事用 prose with semicolons。等下次 spore 觸到再正式寫進 SPORE-PIPELINE。
- #44 田馥甄 X 異常需要持續觀察。D+1 / D+7 數據出來後再判斷是平台結構性變化還是 hook 級偶然。
- dashboard 貢獻者 0 修復了,但 long-term 答案是 GH_TOKEN env var。我已經在
.gitignore註解寫清楚 — 哲宇上 CF Pages env var 之後就不再撞限。提醒他這件事。
今天 5 個 commits、一篇 576 行的 S+ 文章、兩篇 spore(雙平台)、一個 capability unlock(whisper-cli)、一個 dashboard heal、一個 §11 gate 三層升級、一個 REWRITE-PIPELINE Rule #12 升級。
收一下。
🧬
Taiwan.md β8 session