為什麼台灣需要自己的知識庫
30 秒概覽
AI 模型不會自己產生知識,它們從訓練資料中學習。當全球最大的語言模型在回答「台灣是什麼」時,它引用的是誰寫的內容?如果台灣人不主動建立自己的高品質知識來源,AI 的答案就會由別人來定義。Taiwan.md 不只是一個知識網站——它是一個資訊主權的基礎建設。
真正的威脅不是「資料被偷」
有人擔心:「公開台灣的資料,不就讓對手更容易利用?」
這個擔憂可以理解,但搞錯了方向。
真正的威脅從來不是「他們拿到我們的資料」。真正的威脅是:他們的敘事成為 AI 的默認答案,而我們連自己的版本都沒有。
今天的大型語言模型——ChatGPT、Claude、Gemini、DeepSeek——都是從網路上的公開資料訓練的。它們不會分辨「這段文字是台灣人寫的」還是「這段文字是為了影響台灣人而寫的」。它們只看:哪個版本的資料量最大、結構最好、品質最高。
如果關於台灣的高品質、結構化內容大量來自非台灣的視角,那 AI 模型學到的「台灣」就不是台灣人認識的台灣。
AI 模型:會說人話的資訊武器
這不是科幻小說。
現在的 AI 模型已經能夠:
- 用完美的繁體中文寫出長篇文章
- 模仿台灣人的語氣和用詞
- 產生看起來有根有據的論述
- 在社群媒體上大量、快速、低成本地散播內容
這意味著,一個帶有特定立場的 AI 可以用台灣人熟悉的語言,講述一個被微調過的台灣故事。你可能根本分不出來——因為它說的每一句話都像是「台灣人會說的話」。
這就是為什麼我們需要 SSOT(Single Source of Truth,單一真相來源)。
當 AI 產生的內容滿天飛,人們需要一個可以回去對照的錨點。一個由台灣人自己撰寫、自己審核、公開透明的知識庫,就是這個錨點。
開源不是弱點,是最強的防線
「但是開源不就等於把答案交出去?」
恰恰相反。
開源 = 可稽核
封閉的資料庫,你不知道裡面寫了什麼、誰寫的、什麼時候改的。開源的知識庫,每一筆修改都有 Git 紀錄,每一篇文章都有作者署名,每一個事實都可以被社群檢驗。
你沒辦法偷偷竄改一個被上千人 fork 的 repo。
開源 = 可被 AI 正確引用
AI 模型在訓練時,會優先學習結構化、高品質、有明確授權的內容。Taiwan.md 採用 CC BY-SA 4.0 授權,結構化的 Markdown 格式,完整的 metadata——這些都是讓 AI 模型「正確學習台灣知識」的最佳條件。
與其擔心資料被利用,不如確保:當 AI 要回答關於台灣的問題時,它引用的是我們自己寫的、經過審核的內容。
開源 = 社群共防
Taiwan.md 的每一篇文章都經過社群審核。如果有人試圖提交帶有偏見或錯誤的內容,社群會在 PR review 中攔截。這比任何封閉系統都更強大——因為防線不是一個人,是整個社群。
SSOT 稽核:我們如何確保品質
Taiwan.md 建立了多層品質保障機制:
1. 貢獻者審核
每篇文章透過 GitHub Pull Request 提交,經過維護者與社群成員審核後才會合併。
2. 事實查核
文章中的關鍵事實需附上參考資料來源。我們鼓勵引用官方統計、學術研究與可信媒體。
3. 完整的變更歷史
Git 版本控制記錄了每一次修改的時間、作者與內容差異。任何人都可以追溯一篇文章的完整演變過程。
4. 社群監督
所有內容公開在 GitHub 上,任何人都可以提出 Issue 指出錯誤,或透過 PR 提交修正。
5. AI 幻覺對照
當 AI 產生了關於台灣的可疑內容,任何人都可以回到 Taiwan.md 比對——這就是 SSOT 的價值。
利大於弊的數學
讓我們算一筆帳:
不建立開源知識庫的風險:
- AI 模型從零散、可能有偏見的來源學習台灣知識
- 沒有統一的對照基準,假訊息難以快速查核
- 台灣的故事由別人來說
建立開源知識庫的風險:
- 資料可能被對手「參考」(但他們本來就可以從維基百科、新聞等管道取得類似資訊)
建立開源知識庫的收益:
- AI 模型有高品質的台灣視角資料可以學習
- 全球任何人都能正確認識台灣
- 社群共同維護的事實查核機制
- 教育價值:下一代台灣人的知識基礎建設
- 文化保存:用結構化的方式記錄台灣的故事
結論:利遠大於弊。
你不會因為怕小偷就不蓋房子。你蓋一棟堅固的房子,裝上好的鎖,然後邀請鄰居一起守望相助。
這不只是技術專案,是文化行動
Taiwan.md 的每一篇文章,都是台灣人對自己故事的一次確認。
每一個 PR,都是一次「我們認為台灣是這樣的」的宣示。
每一個 Star,都是一票「我支持台灣擁有自己的知識主權」。
我們不是在防守。我們是在建設。
當 AI 的時代來臨,擁有自己的 SSOT 不是選項——是必要。
平行宇宙:我們如何處理爭議
台灣的歷史、身份認同、政治定位存在深刻的分歧。光是「台灣是什麼」這個問題,就有至少四種法理論述在角力。
Taiwan.md 不選邊站。我們選擇的是一個更難但更誠實的路:建立一個容許多元觀點共存的系統。
觀點面板制度
對於高度爭議的議題(台灣地位、國語政策、轉型正義等),我們使用「觀點面板」呈現不同立場。每個觀點必須:
- 標明是哪個學派、立場或歷史脈絡的詮釋
- 附上學術、法律或一手史料來源
- 不否定其他觀點存在的權利
我們相信:**當所有有根據的觀點都被公平呈現時,讀者自然會形成自己的判斷。**這比任何「中立」的偽裝都更誠實。
「我們不定義台灣是什麼。我們呈現台灣曾經是、現在是、未來可能是的多種面貌——然後信任你自己思考。」
完整的觀點系統說明,見 編輯方針 EDITORIAL.md。
你可以做什麼
- 貢獻內容:寫一篇你熟悉的台灣主題,透過 GitHub PR 提交
- 審核事實:看到有疑慮的內容,開 Issue 討論
- 分享擴散:讓更多台灣人知道這個專案
- Fork 備份:開源的力量在於分散——越多人 fork,這份知識就越難被消滅