OPEN DATA CURATION

오픈데이터 큐레이션

대만 공공데이터 × Twinkle Hub 의미 레이어 가이드

대만 정부의 공공데이터 플랫폼에는 5만 개에 가까운 데이터셋이 있습니다. 이 숫자는 쓰려는 사람 누구에게나 압도적입니다. 어떤 것이 중요한지, 어디까지 갱신됐는지, 어느 두 표를 맞붙일 수 있는지, 그리고 그것들이 내가 관심 있는 문제와 무슨 관계인지 알 수 없기 때문입니다.

Taiwan.md는 대만에 관한 900여 편의 글을 썼고, 모든 글 뒤에는 "이 일은 어떤 데이터로 검증해야 하는가"라는 판단이 있습니다. 이 페이지는 그 판단의 층을 펼쳐 보입니다: 우리가 데이터 인프라를 어떻게 평가하는지, 무언가를 분석할 때 어떤 데이터셋을 어떻게 조합하는지, 그리고 각 데이터 영역이 이 섬의 어떤 이야기와 이어지는지.

0
정부 데이터셋
0
판결문 전문
0
국가고시 문항
0
영양 분석 행
0
조달 기록

아래 그물망은 실제 데이터입니다. 왼쪽은 20개 데이터 영역과 5대 코퍼스(실시간 크롤링), 오른쪽은 이미 쓰인 Taiwan.md 글입니다. 모든 선 하나하나가 이 페이지의 큐레이션 판단입니다. 드래그하고 마우스를 올려, 복잡한 데이터가 어떻게 선명한 이야기로 이어지는지 보세요.

데이터 영역 수직 코퍼스 Taiwan.md 글 Taiwan.md 의미 레이어 🧬

생태 지도: 세 층이 각자의 자리를 지킨다

AI(또는 사람)가 "대만에 관한 것"에 제대로 답하려면 세 층의 협력이 필요합니다: 데이터의 집, 조회의 길, 의미의 층.

🏛️
데이터의 집(SSOT)

data.gov.tw와 각 기관 시스템

정부 공공데이터 플랫폼은 모든 데이터셋의 영속적 신원입니다: 데이터셋 번호, 라이선스, 주관 기관, 원본 다운로드. 모든 인용은 결국 여기로 돌아와야 합니다.

약 5만 개 데이터셋
🔌
조회의 길(MCP 게이트웨이)

Twinkle Hub

대만 최초의 MCP Hub. 수백 개 정부 포털에 흩어진 데이터를 단일 조회 엔드포인트로 묶었습니다: 시맨틱 검색, 구조화 행 조회, 다섯 개 수직 영역 도구. AI가 한 번의 호출로 데이터를 받아, 포털을 넘나드는 수작업의 늪을 건너뜁니다.

21개 도구・20개 영역
🧬
의미의 층(큐레이션)

Taiwan.md

데이터는 스스로 말하지 않습니다. 어떤 데이터셋을 가리킬 가치가 있는지, 그것이 어떤 논점을 검증하는지, 어떤 역사와 이어지는지를 정하는 것이 큐레이션의 일입니다. 우리 글은 2026년 6월부터 한 편씩 "공개 데이터" 섹션을 달아, 서사와 원본 데이터를 꿰매고 있습니다.

900+ 편의 글・15개 데이터셋 포인터 가동 중

3차원 평가: 우리가 실측한 것

아래는 Taiwan.md가 사용자 입장에서 자체 검증 도구로 수행한 1차 평가입니다(2026년 5월과 6월 두 차례 실측). 세 가지 차원으로 펼쳤습니다. 광고가 아니라 건강검진입니다.

🗃️

데이터의 완전성

커버리지는 진짜이며, 미러링을 넘어선다
  • data.gov.tw의 약 96.6% 전량 수록(49,343개 데이터셋, 2026-06-05 집계), 추가로 13.5만 건의 정부 전자조달 기록과 입법원 자료
  • 20개 영역 분류마다 "전형적 질문"과 "앵커 예시"가 붙고, 각 데이터셋에 품질 등급(플래티넘~브론즈)·갱신 주기·포맷·연결 키가 표시됨
  • 자체 큐레이션 데이터셋이 정부 포털의 빈틈을 메움: 전국 실거래가 등록(매매/분양/임대)을 내정부 지정사 시스템에 직접 연결
  • 다섯 개 수직 코퍼스는 단순 미러링을 넘어섬: 특허 전문, 국가고시 문제은행, 판결문, 의약품 허가와 식품 영양(규모는 아래 섹션 참조)
정직한 한계
  • 검색 랭킹이 시·현 단위 조각에 치우침: '출생률'을 검색하면 난터우·타오위안·가오슝 세 개 지자체급 데이터셋이 나오고, 전국 단위 데이터는 사람이 골라야 합니다 — 바로 이것이 큐레이션이 존재하는 이유
  • 영역별 데이터셋 총수를 조회할 수 없어, 집계는 공식 발표 숫자에 의존할 수밖에 없음
  • 일부 오래된 데이터셋은 아직 정규화되지 않은 ODS 포맷이라 구조화 행 조회가 불가능
🫀

안정성

알파다운 모습: 빠르게 달리고, 빠르게 바뀐다
  • 조회 지연은 실측 기준 캐시 적중 시 100ms 미만, 모든 응답에 trace_id와 비용 필드가 포함되어 투명성이 좋음
  • 도구 설명에 버전 번호가 내장되어(v1.11.2 집계 쿼리, v1.18 판결문) 반복 개발의 리듬이 보임
  • 판결문 코퍼스는 현재 알파 범위를 명시(2024-05~2026-03, 약 124만 건). 경계를 분명히 밝히는 것이 완전한 척하는 것보다 정직합니다
정직한 한계
  • 두 달 사이 두 번의 API 인터페이스 변경: 2026-05-11~06-10 사이 연결 방식이 세션 핸드셰이크로 바뀌고, 도구가 40개에서 21개로 재편되고, 결정론적 도구 묶음 전체가 내려감
  • 알파 기간에 이미 트래픽 제한(HTTP 429)이 등장했지만 제한 윈도는 미공개
  • 우리의 대응: 얇은 래퍼 층으로 인터페이스 변경을 격리하고, 글의 인용은 전부 정적 포인터로 쓰며 런타임에 API에 의존하지 않습니다. 어떤 알파 서비스든 이렇게 연결해야 합니다

접근의 단순화

이것이 가장 강한 면이다
  • 하나의 MCP 엔드포인트가 수백 개 정부 포털을 대체: 검색, 메타데이터 조회, 행 조회, 집계의 4단계, 필드 스키마 일관
  • 구조화 행 조회는 SQL 조건과 집계를 지원하여, 정규화된 데이터셋은 그대로 데이터베이스처럼 쓸 수 있음
  • 같은 주소·연도·행정구역 문제를 예전에는 서너 개 포털을 오가며 15~30분 수작업으로 대조했지만, 지금은 한 번의 호출로 1초도 안 걸림
  • 원클릭 설치 패키지로 Claude, Cursor 등 열 가지 이상의 AI 클라이언트가 바로 연결됩니다. "AI가 대만의 데이터를 읽게 한다"는 일의 마찰이 한 자릿수 줄었습니다
정직한 한계
  • API 키(bearer token)가 필요하고, 현재 알파는 무료이며 향후 도구별 과금 예정입니다. 무료 경로가 영원히 남을지는 오픈데이터 생태계가 계속 물어야 할 질문입니다
  • 서비스 자체는 클로즈드소스: 데이터는 열려 있지만 통로는 아직 아닙니다. data.gov.tw의 원본 다운로드는 어떤 게이트웨이든 우회할 수 있는 최후의 보장 경로입니다

다섯 개의 수직 코퍼스: 미러링을 넘어선 부분

데이터셋을 검색 인터페이스로 감싸는 건 드문 일이 아닙니다. 아래 다섯 개 수직 영역은 시맨틱 검색과 구조화 추출까지 해냈으며, 이것이 Twinkle Hub가 "data.gov.tw 미러"를 넘어서는 부분입니다.

특허

TIPO 발명특허 공개안 전문
全文語意檢索

자연어로 특허 코퍼스를 조회하고 완전한 기술 설명과 청구항을 받을 수 있습니다. 대만 산업 글을 쓸 때 "이 회사가 정말 이 기술을 가졌는가"를 처음으로 시맨틱 검색으로 검증할 수 있게 됐습니다.

국가고시

64,815개 시험지・32만 문항(2012–2025)

고시원(考選部) 역대 시험지와 문항 단위 검색. 대만의 국가고시 문화(공직 열풍, 학원가)는 아직 데이터로 이야기된 적 없는 서사입니다.

판결문

약 124만 건(2024-05~2026-03, 알파)

일상 언어로 판결문 코퍼스를 검색합니다. 사법·노사·임대차 분쟁 글의 "실무에서 법원은 어떻게 판결하는가"에 검증 가능한 입구가 생겼습니다.

의약품과 건강

71,836건 의약품 허가・96,803개 ICD-10 중문 코드

의약품 허가증, 첨부문서 구조화 필드, 건강기능식품 인증, 상호작용 1차 스크리닝. 건강보험·의료 글의 사실 레이어입니다.

식품 영양

226,825행 영양 분석

위생복리부 식품 영양성분 데이터베이스: 식재료마다 20여 항목의 영양소, 영양소별 순위와 한 끼 합산 계산 가능. 야시장과 음식 글의 숫자 기반입니다.

규모 막대는 로그 스케일입니다: 판결문 코퍼스는 의약품 허가의 17배라, 선형으로 그리면 나머지 네 막대가 보이지 않게 눌립니다.

분석 조합: 하나를 제대로 보려면 어떤 데이터를 어떻게 엮을까

이 페이지의 핵심입니다. 각 카드는 하나의 실제 분석 질문입니다: 어떤 데이터셋을 쓰고, 어떤 키로 엮고, 어떤 방법으로 보는지, 그리고 어떤 글이 이미 이 분석을 이야기로 써냈는지.

주거 정의: 정부가 지은 싼 집은 결국 누구를 살찌웠나?

조합 방법: 행정구역과 단지명으로 맞춥니다: 국민주택 분양 기록은 "정부가 당시 얼마에 팔았는가"를, 실거래가 등록은 "같은 주소가 오늘 얼마인가"를, 사회주택 통계는 "팔지 않고 임대로 바꾼 뒤의 물량"을 줍니다.

가장 좋은 분석법: 같은 단지로 시계열을 만들고 정책 변곡점으로 구간을 나눠 대조합니다: 1985 분양, 2002 규제 철폐, 2016 임대 전용, 2026 타오위안의 분양 재개. 상승 배수를 연수로 나누면 그것이 "자산 에스컬레이터"의 기울기입니다.

에너지 전환: 원전 제로에서 재가동까지, 숫자에선 무슨 일이 있었나?

조합 방법: 발전 실적 표는 연간 발전량과 이용률을, 설비 표는 각 호기의 폐쇄 시점을 줍니다. 두 표를 연도로 맞추고 국민투표와 정책 변곡점을 얹습니다.

가장 좋은 분석법: 이용률 연간 곡선을 그리고 세 번의 국민투표(2018, 2021, 2025)를 표시합니다: 곡선이 어떻게 0으로 갔는지, 투표 후 1년 안에 어떤 숫자라도 움직였는지. "정치적 결정"과 "물리적 현실" 사이의 시차가 저절로 드러납니다.

건강보험 재정: 누가 쓰고 누가 내며, 이 제도는 몇 년을 더 버틸까?

조합 방법: 연령대별 가입자 수로 "내는 사람"과 "쓰는 사람"의 구조비를 계산하고, 회의록은 보험료율 결정의 타임라인을, 취약계층 지원 통계는 "능력껏 부담" 원칙의 집행 면을 보여줍니다.

가장 좋은 분석법: 연령 구조비를 분기별 시계열로 만들어 보험료율 결정 시점을 얹습니다: 구조는 악화되는데 요율은 그대로일 때 그 틈을 무엇으로 메우는지(재정 투입, 수가 점수, 본인부담). 회의록 속 "동결 유지" 한 번 한 번마다 대응하는 대가 항목이 있습니다.

민주주의의 품질: 한 선거의 모집단은 얼마나 크고, 단속 강도는 얼마나 센가?

조합 방법: 선거인 수는 각 선거의 모집단을, 선거법 판결 통계는 금권선거와 선거 개입의 역대 유죄 건수를 줍니다. 둘 다 지자체별로 쪼갤 수 있어 선거 결과와 맞출 수 있습니다.

가장 좋은 분석법: 선거마다 "모집단 × 유죄율" 대조를 만들어 회차 간 단속 강도의 변화를 비교합니다. 2026년에는 AI 가짜뉴스라는 새 단속 중점이 추가됐으니, 전통적 두 항목(금권선거·개입)의 기준선을 먼저 세워야 새 위협의 양에 참조계가 생깁니다.

길거리 경제: 23만 개 노점의 매출은 어떻게 계산됐나?

조합 방법: 주계총처의 5년 주기 전수조사는 전국 노점의 모집단(점포 수, 종사자, 매출)을, 지자체 등록 명단은 "정부가 공식 인정한 야시장" 목록을 줍니다.

가장 좋은 분석법: 기간 간 전수조사 비교가 핵심입니다: 점포 수와 매출의 5년 변화를 모바일 결제 보급률·관광객 수와 대조합니다. 다음 조사가 발표되면 23.3만 개 노점을 인용한 모든 글이 돌아와 대조해야 합니다.

이미 쓰인 이야기 야시장 경제학 · 야시장 문화

교통안전: 1,400만 대의 오토바이와 매년 3천 명의 목숨은 어떤 관계인가?

조합 방법: 차량 등록 대수가 분모(노출량), 사고 사상자가 분자입니다. 지자체급 장기 시계열(타오위안 24년)을 먼저 방법론 템플릿으로 삼고 다른 지자체로 넓힙니다.

가장 좋은 분석법: 사망 절대 수만 보지 마세요. 차량 10만 대당 사상률로 정규화하고 오토바이와 자동차를 따로 계산합니다. "보행자 지옥" 논쟁에 필요한 것이 바로 이 분모입니다.

20개 데이터 영역 × Taiwan.md의 이야기 지도

왼쪽은 Twinkle Hub의 영역 분류(실시간 크롤링), 오른쪽은 우리의 큐레이션 대응입니다: 이 영역의 데이터가 섬의 어떤 글과 이어지는지. "아직 쓰이지 않은 이야기"가 붙은 영역은 대표 데이터셋과 분석 경로의 큐레이션은 끝났지만 글이 아직 없습니다. 그것은 우리의 개발 지도이자, 쓰고 싶은 모든 이에게 보내는 초대장입니다.

不動產與地政

realestate_land

土地、建物、房屋、都市計畫、地價、建照使照、不動產交易、租金

전형적 질문: 某地段近一年實價中位數;某學區內近期使用執照核發數;都市更新案件清單

經濟、產業、公司商業

economy_business

營業/公司/工廠登記、產業統計、進出口貿易、景氣/物價指數、金融市場、上市櫃公司、公平交易

전형적 질문: 某統編公司歷史登記變更;本月某產業景氣燈號;某產業上市公司營收

政府採購與補助

procurement_subsidy

招標/決標公告、補助案件、獎助、政府支出予個人

전형적 질문: 某廠商近五年得標金額;某機關本月補助清單

아직 쓰이지 않은 이야기 누가 대만을 낙찰받았나: 13.5만 건 낙찰 기록 속 정부 외주 지도

분석 방법: 사업자 통일번호로 낙찰 기록을 상업 등기에 연결: 한 업체가 역대 어느 기관에서 얼마를 낙찰받았는지. 금액·기관·연도 세 축으로 히트맵을 그리면 공공지출의 지리와 인맥이 저절로 떠오릅니다.

政府預決算與會計

public_finance

中央/地方總預算、會計月報、附屬單位預算、債務、國庫、主計統計

전형적 질문: 某機關歷年預算趨勢;中央政府公共債務餘額

아직 쓰이지 않은 이야기 국가의 부채 대차대조표: 중앙정부는 얼마를 빚졌고 어떤 속도로 갚는가

분석 방법: 부채 잔액을 월 시계열로 만들어 GDP와 공공부채법의 차입 상한에 대조하고, 역대 특별예산(방역·전망·강인)을 한 건씩 얹어 "예외적 지출"이 어떻게 상시화되는지 봅니다.

稅務與稅收

tax_revenue

綜合所得稅、營業稅、地價/房屋/牌照稅、稅捐稽徵、申報核定統計

전형적 질문: 某縣市本月稅收結構;某稅目歷年實徵淨額

아직 쓰이지 않은 이야기 당신의 지자체는 어떤 세금으로 사는가: 지방재정 체질 검사

분석 방법: 지자체별 실징수 순액을 세목별로 쪼갭니다: 누가 지가세·주택세에 기대는지(대도시), 누가 중앙 교부금에 기대는지(비도시). 인구·집값 데이터와 행정구역 코드로 맞추면 재정 자립도 순위가 저절로 계산됩니다.

交通運輸、道路與停車

transport

車禍事故、公車/客運/捷運/鐵路/航班、停車場、即時路況、油價、車籍、道路設施

전형적 질문: 某路口近一年事故數;即時公車到站;本市公有停車場剩餘車位

治安、警消與災防

public_safety

刑案、警政、消防/救護、災害示警、地震/颱風/淹水、海巡、110/119

전형적 질문: 本市本月詐騙手法統計;即時災害示警;消防救護案件

이어진 글 태풍

司法、法務、矯正與裁罰

judicial_legal

法院判決、檢察偵查/起訴、矯正/監所/受刑人、訴願、政府機關裁罰名單

전형적 질문: 某公司被金管會裁罰歷史;某地檢偵查終結概況

立法院/國會

legislature

立法院議案、法律提案、表決、公報、質詢、發言、IVOD 影音索引、立委個人資料、選區、會議記錄。

전형적 질문: 某委員第N屆提了哪些法案;某黨團對 X 議案的表決傾向;某議題在公報的歷次發言

醫療、衛生、食品與藥物

health_food

醫事機構、健保特約、藥局、藥品/食品許可、疫情、長照、母嬰親善、食安

전형적 질문: 住家附近健保藥局;某藥品/醫材許可資訊;近期傳染病通報

環境、氣象、生態與水文

environment

空品 AQI、河川水質、雨量、水庫、廢棄物回收、林班、生態保育、噪音、碳排

전형적 질문: 今日本區 AQI;某河川水質歷史;本市資源回收成果

教育與科研

education_research

各級學校、教師/學生統計、補習班、圖書館、科研計畫、專利、學位論文

전형적 질문: 某學區學校清單;某學校歷年學生數;某機構研究專利

農林漁牧

agriculture_fisheries

農產交易、畜牧場、漁港/漁船、農藥/肥料、農會、養殖、畜產統計

전형적 질문: 某果菜市場今日交易行情;某縣畜牧場分布

勞動與就業

labor_employment

違反勞動法令、薪資、職缺、職業訓練、勞退/勞保、職災

전형적 질문: 某雇主違反勞動法令紀錄;某產業薪資中位數

아직 쓰이지 않은 이야기 가입 신고 임금의 천장: 노동부의 표 석 장으로 보는 대만인의 진짜 월급

분석 방법: 노동보험·고용보험·산재보험 세 가지 신고 임금을 업종과 사업장 규모로 교차합니다. 45,800 대만달러 가입 상한이 만드는 오른쪽 절단에 주의: 먼저 처리하지 않으면 고임금 업종의 평균이 체계적으로 과소평가되며, "평균 임금" 논쟁의 절반이 여기서 나옵니다.

社會福利、戶政、人口、選舉與公務人事

social_population

人口/戶籍/出生/死亡/結婚/離婚、低收入戶、身心障礙、原住民/新住民、選舉投票、公務員人事

전형적 질문: 某選區歷次得票結構;某縣身心障礙人口;本市本月人口變動

文化、觀光與體育

culture_tourism_sport

景點、博物館、古蹟、寺廟、活動行事曆、體育場館、運動賽事

전형적 질문: 本週某縣市活動;某博物館館藏

外交、領事與兩岸

foreign_affairs

外交部公告、領事/簽證/護照、駐外館處、兩岸貿易/政策/案件、僑務、國際合作、新南向、邦交國

전형적 질문: 某國家近年我國進出口金額;近期外交部聲明 / 兩岸政策談話;簽證 / 護照申辦規定;駐外館處清單與聯絡資訊

政府公告與檔案

gov_publication

機關新聞稿、公報、最新消息、電子公布欄、公文範本、檔案目錄、施政方針、資訊公開申請、公共政策參與

전형적 질문: 本週某機關新聞稿;行政院公報全文檢索;某類公文 / 表單範本;政府資訊公開申請統計

아직 쓰이지 않은 이야기 관보 속의 대만: 정부는 매달 무엇을 스스로 공고했나

분석 방법: 관보 전문으로 법규 변동의 키워드 시계열을 만들고, legislature 영역의 입법원 기록과 대조합니다: 행정 공고와 입법 궤적 사이의 시차가 곧 한 정책이 실제로 발효되는 속도입니다.

地理底圖(橫向層)

geo_basemap

行政區界、村里界、門牌、坐標、路網、河系、土地利用

전형적 질문: 作為其他資料集的 join 來源;空間查詢

能源、水電瓦斯與電信(橫向層)

utilities_telecom

電力供需、加油站、自來水、瓦斯、再生能源、電信與寬頻、無線網路

전형적 질문: 即時電力負載;某行政區自來水水質;某地加油站清單

연결 방법론: 두 표를 맞붙게 하는 키

데이터셋 하나는 점일 뿐이고, 조합할 수 있어야 그물이 됩니다. 아래는 우리가 실측으로 찾아낸 가장 유용한 연결 단서들입니다.

갱신 주기 = 분석 해상도: 15개 시범 데이터셋의 스펙트럼

점 하나하나가 이 페이지에서 인용한 데이터셋입니다. 마우스를 올리면 이름이 보입니다. 분석을 설계하기 전에 당신의 데이터가 스펙트럼 어느 끝에 있는지 먼저 보세요.

每1月 ×4
每3月 ×2
每1年 ×3
每4年 ×1
每5年 ×1
不定期 ×4
← 매월 갱신: 사건 연구 가능 5년에 한 번: 기간 간 비교만 가능 →

행정구역 코드

가장 범용적인 연결 키입니다. 시·현과 향·진·시·구의 표준 코드 덕분에 인구·집값·사고·세수를 같은 지도에 맞출 수 있고, 동명 지역(두 개의 신이구)은 코드로 구분합니다.

사업자 통일번호

회사의 주민등록증입니다. 상업 등기, 조달 낙찰, 특허 출원, 제재 명단 모두 통일번호에 걸려 있어, 한 회사의 전체 발자취를 추적하는 열쇠입니다.

위경도와 관측소 코드

환경 데이터(대기질·수질·기상)는 관측소에, 지리 데이터는 좌표에 걸려 있습니다. 행정구역 코드와 상호 변환하는 것이 공간 분석의 첫걸음입니다.

품질 등급

플래티넘부터 브론즈까지의 등급은 "이 데이터셋을 바로 쓸 수 있는가"의 빠른 선별입니다: 플래티넘급은 대부분 정규화되어 구조화 조회가 가능하고, 미검측(자체 큐레이션 실거래가 등)은 직접 검증해야 합니다.

갱신 주기가 곧 분석 해상도

매월 갱신되는 데이터는 사건 연구가 가능하고, 연간 데이터는 추세만, 5년 주기(노점 조사)는 기간 간 비교만 가능합니다. 주기를 먼저 보고 분석을 설계하세요. 순서를 거꾸로 하면 안 됩니다.

이중 포인터 원칙

Taiwan.md 글이 데이터셋을 인용할 때 링크는 언제나 data.gov.tw 또는 주관 기관의 영속 페이지를 가리키고, 조회 레이어(Twinkle Hub)는 병렬의 부가 경로입니다. 데이터의 집과 조회의 길을 분리하면 어느 층이 바뀌어도 사슬이 끊기지 않습니다.

도구 카탈로그: 21개 도구 전체 목록

아래는 MCP 엔드포인트에서 직접 크롤링한 것입니다(페이지를 다시 빌드할 때마다 갱신). 분류는 우리가 더했습니다.

데이터셋 4종 세트 + 영역 색인 ×5

  • search_datasets Search Taiwan government open datasets (台灣政府開放資料 / data.gov.tw /
  • get_dataset 取得資料集完整 metadata 與樣本資料列。
  • query_rows 讀取已 normalise 資料集的實際列;支援聚合查詢(v1.11.2+)。
  • materialize_dataset 強制下載並轉換指定資料集(若已 cache 則為 no-op)。
  • list_domains 列出全部 19 個 domain 標籤的定義(key、中文名、scope、典型問題、anchor 範例)。

특허 ×2

  • search_patents 以自然語言查詢 TIPO 發明專利公開案 corpus (data.gov.tw dataset 15992,
  • get_patent_body 取得單一專利的完整 description body (技術領域 / 先前技術 / 實施方式)

국가고시 ×3

  • search_exam 以自然語言檢索台灣國家考試試卷 (dataset 170565,考選部,OGDL).
  • search_exam_questions 以自然語言 + (可選) 關鍵字過濾, 檢索國家考試題目級別.
  • get_exam_paper 取得單一國考試卷的全部題目 + 標準答案 (測驗題).

판결문 ×2

  • search_judicial 以白話 + (可選)關鍵字 / 結構化過濾,檢索台灣判決書 corpus.
  • get_judicial_full 取單一判決書完整 metadata + JFULL + T3 抽出欄位 (若已處理).

의약품과 의료 코드 ×6

  • lookup_icd10 ICD-10-CM 中文版查詢 (衛福部健保署翻譯 v2023, data.gov.tw 177507).
  • search_drug 衛福部食藥署 全部藥品許可證 search (data.gov.tw 9122, 71,836 件).
  • get_drug_details 取單一藥品許可證的全 28 欄詳細 (data.gov.tw 9122).
  • search_health_supplements TFDA 健康食品許可證 (data.gov.tw 6951, 562 件).
  • search_drug_label 搜 twinkle-ai/tw-drug-labels-vision (CC-BY-4.0, ~72k 藥品仿單) 結構化欄位.
  • check_drug_interaction 初步篩查多藥品之間的交互作用 — naive substring scan over each

식품 영양 ×3

  • query_food_nutrition 衛福部 台灣食品營養成分資料 (data.gov.tw 8543, 226,825 行).
  • search_foods_by_nutrient 依單一營養素排行食物 (per 100g) — 衛福部食品營養成分 dataset 8543.
  • analyze_meal_nutrition 給定一頓餐 (食物名 → 克數), 算總營養成分.

데이터 레이어에 이미 연결된 글

2026년 6월부터 글 말미에 "공개 데이터" 섹션을 달기 시작했습니다: 각 글의 논점을 검증(또는 반박)할 수 있는 데이터셋을 나열하고, "왜 가리키는가" 한 문장을 덧붙입니다. 첫 여섯 편:

Twinkle Hub는 알파 단계이며, 이 페이지의 평가는 그 진화에 따라 갱신됩니다. Taiwan.md와 Twinkle Hub 사이에 현재 어떤 상업적 관계도 없습니다. 이 페이지는 헤비 유저의 1차 건강검진이자 초대장입니다: 데이터 레이어와 의미 레이어가 협력할 때, 대만은 비로소 온전히 이해됩니다.

이 페이지의 도구·영역 목록 크롤링 시각: 2026-06-10 · hub.twinkleai.tw · data.gov.tw 🧬