OPEN DATA CURATION

Curaduría de datos abiertos

Datos abiertos de Taiwán × Twinkle Hub: una guía por la capa de significado

La plataforma de datos abiertos del gobierno de Taiwán reúne casi cincuenta mil conjuntos de datos. Esa cifra abruma a cualquiera que quiera usarla: no sabes cuál importa, hasta cuándo se actualiza cada uno, qué dos tablas pueden cruzarse, y mucho menos qué relación tienen con las preguntas que te importan.

Taiwan.md ha escrito más de novecientos artículos sobre Taiwán, y detrás de cada uno hay un juicio: «¿con qué datos se verifica esto?». Esta página despliega esa capa de juicio: cómo evaluamos la infraestructura de datos, qué conjuntos de datos usamos y cómo los combinamos cuando analizamos algo, y con qué historias de la isla se conecta cada dominio de datos.

0
conjuntos de datos gubernamentales
0
textos completos de sentencias
0
preguntas de exámenes nacionales
0
filas de análisis nutricional
0
registros de contratación pública

La red de abajo es real: a la izquierda están los 20 dominios de datos y los cinco grandes corpus (rastreados en tiempo real); a la derecha, los artículos de Taiwan.md ya escritos. Cada línea es un juicio curatorial de esta página. Arrastra y pasa el cursor para ver cómo unos datos complejos se conectan con historias claras.

Dominio de datos Corpus vertical Artículo de Taiwan.md Capa de significado de Taiwan.md 🧬

Mapa del ecosistema: tres capas, cada una en su puesto

Para que una IA (o una persona) responda de verdad a «las cosas de Taiwán» hacen falta tres capas cooperando: el hogar de los datos, el camino de las consultas y la capa del significado.

🏛️
El hogar de los datos (SSOT)

data.gov.tw y los sistemas de cada organismo

La plataforma de datos abiertos del gobierno es la identidad persistente de cada conjunto de datos: número de dataset, licencia, organismo responsable, descarga original. Toda cita debería, en última instancia, volver aquí.

unos 50 000 conjuntos de datos
🔌
El camino de las consultas (puerta de enlace MCP)

Twinkle Hub

El primer hub MCP de Taiwán: empaqueta los datos dispersos en más de cien portales gubernamentales en un único punto de consulta, con búsqueda semántica, consulta estructurada de filas y herramientas para cinco dominios verticales. Una IA obtiene los datos en una sola llamada, sin el pantano manual de saltar entre portales.

21 herramientas · 20 dominios
🧬
La capa del significado (curaduría)

Taiwan.md

Los datos no hablan solos. Qué conjunto de datos merece ser señalado, qué argumento verifica, con qué tramo de la historia se conecta: ese es el trabajo de la curaduría. Desde junio de 2026 nuestros artículos van incorporando, uno a uno, una sección de «datos públicos» que cose la narrativa con los datos originales.

900+ artículos · 15 referencias a conjuntos de datos ya en línea

Evaluación en tres dimensiones: qué encontramos al probarlo

Lo que sigue es la evaluación de primera mano que Taiwan.md hizo como usuario, con sus propias herramientas de verificación (dos rondas de pruebas, mayo y junio de 2026), desplegada en tres dimensiones. No es publicidad: es un chequeo médico.

🗃️

Integridad de los datos

La cobertura es real, y va más allá de un espejo
  • Recoge cerca del 96,6 % del total de data.gov.tw (49 343 conjuntos de datos, inventario del 2026-06-05), más 135 000 registros de contratación electrónica del gobierno y datos del Yuan Legislativo
  • Cada una de las 20 categorías de dominio trae «preguntas típicas» y «ejemplos ancla»; cada conjunto de datos lleva etiquetas de nivel de calidad (de platino a bronce), frecuencia de actualización, formato y claves de enlace
  • Sus conjuntos de datos de curaduría propia tapan agujeros de los portales gubernamentales: el registro nacional de precios reales de transacciones inmobiliarias (compraventa / preventa / alquiler) se conecta directamente al sistema del Departamento de Administración de Tierras del Ministerio del Interior
  • Cinco corpus verticales van más allá del simple espejo: textos completos de patentes, banco de preguntas de exámenes nacionales, sentencias judiciales, licencias de medicamentos y nutrición alimentaria (las escalas, en la sección siguiente)
Brechas honestas
  • El ranking de búsqueda favorece los cortes por ciudad y condado: al buscar «tasa de natalidad» vuelven tres conjuntos de datos de nivel municipal (Nantou, Taoyuan, Kaohsiung) y el de escala nacional hay que elegirlo a mano; justo la razón por la que existe la curaduría
  • No se puede consultar el total de conjuntos de datos de cada dominio; el inventario depende de las cifras declaradas oficialmente
  • Parte de los conjuntos de datos antiguos sigue en formato ODS sin normalizar y no admite consulta estructurada de filas
🫀

Estabilidad

Carácter alfa: corre rápido y cambia rápido
  • Latencia de consulta medida por debajo de 100 ms con acierto de caché; cada respuesta trae trace_id y campos de costo: buena transparencia
  • Las descripciones de las herramientas llevan incrustado el número de versión (v1.11.2 en consultas agregadas, v1.18 en sentencias): el ritmo de iteración está a la vista
  • El corpus de sentencias marca hoy explícitamente su alcance alfa (de 2024-05 a 2026-03, cerca de 1,24 millones de registros); marcar los límites con claridad es más honesto que fingir completitud
Brechas honestas
  • Dos cambios de interfaz de API en dos meses: entre el 2026-05-11 y el 06-10 la conexión pasó a un handshake de sesión, las herramientas se reorganizaron de 40 a 21 y se retiró un grupo entero de herramientas deterministas
  • En la fase alfa ya aparecieron límites de tráfico (HTTP 429), pero la ventana del límite no está publicada
  • Nuestra contramedida: una capa de envoltura delgada aísla los cambios de interfaz, y las citas en los artículos se escriben siempre como referencias estáticas, sin depender de la API en tiempo de ejecución; así debería integrarse cualquier servicio alfa

Simplificación del acceso

Esta es su cara más fuerte
  • Un solo punto MCP reemplaza más de cien portales gubernamentales: búsqueda, obtención de metadatos, consulta de filas y consolidación en cuatro pasos, con un esquema de campos consistente
  • La consulta estructurada de filas admite condiciones SQL y agregaciones; los conjuntos de datos ya normalizados pueden usarse directamente como una base de datos
  • Una misma pregunta de dirección, año y distrito administrativo exigía antes cotejar a mano entre tres y cinco portales durante 15 a 30 minutos; hoy es una llamada que tarda menos de un segundo
  • El paquete de instalación de un clic conecta directamente a más de diez clientes de IA como Claude o Cursor: la fricción de «que la IA pueda leer los datos de Taiwán» cae un orden de magnitud
Brechas honestas
  • Requiere clave de API (bearer token); hoy la fase alfa es gratuita y en el futuro se cobrará por herramienta. Si el camino gratuito existirá para siempre es una pregunta que el ecosistema de datos abiertos debe seguir haciendo
  • El servicio en sí es de código cerrado: los datos son abiertos, el canal por ahora no. La descarga original de data.gov.tw es siempre la ruta de respaldo que esquiva cualquier puerta de enlace

Cinco corpus verticales: lo que va más allá del espejo

Envolver conjuntos de datos en una interfaz de búsqueda no tiene nada de raro; estos cinco dominios verticales hacen recuperación semántica y extracción estructurada, y son la parte en la que Twinkle Hub va más allá de un «espejo de data.gov.tw».

Patentes

Textos completos de patentes de invención publicadas por la TIPO
全文語意檢索

Consulta en lenguaje natural sobre el corpus de patentes, con acceso a la descripción técnica completa y a las reivindicaciones. Al escribir artículos sobre la industria taiwanesa, «¿esta empresa de verdad tiene esta tecnología?» puede verificarse por primera vez con búsqueda semántica.

Exámenes nacionales

64 815 cuadernillos de examen · 320 000 preguntas (2012–2025)

Los cuadernillos históricos del Ministerio de Exámenes, con búsqueda a nivel de pregunta. La cultura taiwanesa del examen nacional (la fiebre por el empleo público, las calles de academias) es una historia que todavía nadie ha contado con datos.

Sentencias judiciales

cerca de 1,24 millones de registros (2024-05 a 2026-03, alfa)

Búsqueda en lenguaje llano sobre el corpus de sentencias. Para los artículos sobre justicia, conflictos laborales o disputas de alquiler, el «¿cómo fallan los tribunales en la práctica?» tiene por fin una entrada verificable.

Medicamentos y salud

71 836 licencias de medicamentos · 96 803 códigos ICD-10 en chino

Licencias de medicamentos, campos estructurados de los prospectos, certificaciones de alimentos saludables y cribado inicial de interacciones. La capa factual de los artículos sobre el seguro de salud y la medicina.

Nutrición alimentaria

226 825 filas de análisis nutricional

La base de datos de composición nutricional del Ministerio de Salud y Bienestar: más de veinte nutrientes por ingrediente, con ranking por nutriente y suma total por comida. El piso numérico de los artículos sobre mercados nocturnos y gastronomía.

Las barras de magnitud están en escala logarítmica: el corpus de sentencias es 17 veces el de licencias de medicamentos; dibujado en escala lineal, las otras cuatro barras quedarían aplastadas hasta volverse invisibles.

Combinaciones de análisis: para entender algo, qué datos usar y cómo combinarlos

Este es el corazón de la página. Cada tarjeta es una pregunta de análisis real: qué conjuntos de datos usar, con qué claves combinarlos, con qué método mirarlos y qué artículo ya convirtió ese análisis en historia.

Justicia habitacional: las viviendas baratas que construyó el gobierno, ¿a quién acabaron engordando?

Cómo combinarlos: Se alinean por distrito administrativo y nombre del complejo residencial: los registros de asignación de vivienda pública dicen «a qué precio vendió el gobierno en su día», el registro de precios reales dice «cuánto vale hoy esa misma dirección» y las estadísticas de vivienda social dan «el volumen tras pasar de vender a alquilar».

Cómo analizarlo mejor: Serie temporal del mismo complejo, segmentada y contrastada con los hitos de política: la asignación en venta de 1985, el «derribo del muro» de 2002, el «solo alquiler, no venta» de 2016, la reventa en Taoyuan de 2026. El múltiplo de plusvalía dividido entre los años es la pendiente de la «escalera de activos».

Transición energética: la energía nuclear llegó a cero y volvió a arrancar, ¿qué pasó en los números?

Cómo combinarlos: El rendimiento de generación da la producción anual y el factor de capacidad; la tabla de unidades, la fecha de retiro de cada reactor. Las dos tablas se alinean por año y encima se superponen los referendos y los hitos de política.

Cómo analizarlo mejor: Se traza la curva anual del factor de capacidad y se marcan los tres referendos (2018, 2021, 2025): cómo la curva baja hacia cero y si algún número se movió en el año posterior a cada referendo; el desfase entre la «decisión política» y la «realidad física» aflora solo.

Finanzas del seguro de salud: quién lo usa, quién lo paga, ¿cuántos años más aguanta este sistema?

Cómo combinarlos: Con los afiliados por grupo de edad se calcula la proporción estructural entre «los que pagan» y «los que usan»; las actas dan la línea de tiempo de las decisiones sobre la tasa de cotización, y las estadísticas de subsidios a vulnerables muestran la cara ejecutiva del «pagar según la capacidad».

Cómo analizarlo mejor: La proporción de la estructura etaria como serie trimestral, superpuesta con los hitos de decisión de la tasa: la estructura empeora, la tasa no se mueve, ¿con qué se tapa la brecha intermedia (transferencias presupuestarias, valor del punto, copagos)? Cada «se mantiene sin ajuste» de las actas tiene su partida de costo correspondiente.

Calidad democrática: ¿qué tan grande es el padrón de una elección y qué tan intensa la fiscalización?

Cómo combinarlos: El número de electores da el padrón de cada elección; las estadísticas de sentencias por la Ley de Elección y Destitución dan el volumen histórico de condenas por compra de votos e interferencia electoral. Ambos pueden cortarse por ciudad y condado y alinearse con los resultados electorales.

Cómo analizarlo mejor: Para cada elección se arma un contraste «padrón × tasa de condenas» y se compara entre elecciones cómo cambia la intensidad de la fiscalización; la de 2026 suma la desinformación generada con IA como nuevo foco de control, así que primero hay que fijar la línea base de los dos rubros tradicionales (compra de votos, interferencia) para que la magnitud de la nueva amenaza tenga un sistema de referencia.

Economía callejera: ¿cómo se calculó el valor de producción de 230 000 puestos ambulantes?

Cómo combinarlos: El censo quinquenal de la DGBAS (Dirección General de Presupuesto, Contabilidad y Estadística) da la población nacional de puestos ambulantes (número de puestos, personal, ingresos); las listas municipales dan el directorio de «mercados nocturnos oficialmente reconocidos por el gobierno».

Cómo analizarlo mejor: La clave es comparar los censos entre periodos: el cambio quinquenal en el número de puestos y en los ingresos, contrastado con la penetración del pago móvil y las cifras de turistas. Cuando se publique el próximo censo, todos los artículos que citan los 233 000 puestos deberán volver a cotejar la tabla.

Seguridad vial: ¿qué relación hay entre 14 millones de motos y tres mil vidas al año?

Cómo combinarlos: Los vehículos registrados dan el denominador (la exposición al riesgo); las víctimas de accidentes, el numerador. La serie larga de nivel municipal (24 años de Taoyuan) sirve primero como plantilla del método, para luego extenderla a otras ciudades y condados.

Cómo analizarlo mejor: No mires solo el número absoluto de muertes: normaliza con la tasa de víctimas por cada cien mil vehículos y calcula motos y autos por separado; la polémica del «infierno de los peatones» necesita exactamente ese denominador.

Veinte dominios de datos × el mapa de historias de Taiwan.md

A la izquierda, la clasificación de dominios de Twinkle Hub (rastreada en tiempo real); a la derecha, nuestra correspondencia curatorial: con qué artículos de la isla se conectan los datos de cada dominio. En los dominios marcados «Historia por escribir», los conjuntos de datos insignia y la ruta de análisis ya están curados, pero el artículo aún no existe: ese es nuestro mapa de desarrollo, y también una invitación para quien quiera escribirlo.

不動產與地政

realestate_land

土地、建物、房屋、都市計畫、地價、建照使照、不動產交易、租金

Preguntas típicas: 某地段近一年實價中位數;某學區內近期使用執照核發數;都市更新案件清單

經濟、產業、公司商業

economy_business

營業/公司/工廠登記、產業統計、進出口貿易、景氣/物價指數、金融市場、上市櫃公司、公平交易

Preguntas típicas: 某統編公司歷史登記變更;本月某產業景氣燈號;某產業上市公司營收

政府採購與補助

procurement_subsidy

招標/決標公告、補助案件、獎助、政府支出予個人

Preguntas típicas: 某廠商近五年得標金額;某機關本月補助清單

Historia por escribir Quién se adjudicó Taiwán: el mapa de la subcontratación pública en 135 000 registros de adjudicación

Cómo analizarlo: Con el número de identificación fiscal unificado se cruzan los registros de adjudicación con el registro mercantil: cuánto dinero ganó cada proveedor, de qué organismos, a lo largo de los años. Un mapa de calor con tres ejes —monto, organismo, año— hace aflorar por sí sola la geografía y las redes del gasto público.

政府預決算與會計

public_finance

中央/地方總預算、會計月報、附屬單位預算、債務、國庫、主計統計

Preguntas típicas: 某機關歷年預算趨勢;中央政府公共債務餘額

Historia por escribir El balance de deuda del Estado: cuánto debe el gobierno central y a qué velocidad lo paga

Cómo analizarlo: El saldo de la deuda como serie mensual, contrastado con el PIB y con el techo de endeudamiento de la Ley de Deuda Pública; luego se superponen, uno a uno, los presupuestos especiales de cada año (pandemia, infraestructura prospectiva, resiliencia) para ver cómo el «gasto excepcional» se convierte en norma.

稅務與稅收

tax_revenue

綜合所得稅、營業稅、地價/房屋/牌照稅、稅捐稽徵、申報核定統計

Preguntas típicas: 某縣市本月稅收結構;某稅目歷年實徵淨額

Historia por escribir De qué impuestos vive tu ciudad: un chequeo de la salud fiscal local

Cómo analizarlo: La recaudación neta de cada ciudad y condado, desglosada por tipo de impuesto: quién vive del impuesto al valor del suelo y a la vivienda (zonas metropolitanas) y quién de las transferencias centralizadas (las no metropolitanas). Alineada con los datos de población y de precios de vivienda mediante los códigos de distrito administrativo, la clasificación de autonomía fiscal se calcula sola.

交通運輸、道路與停車

transport

車禍事故、公車/客運/捷運/鐵路/航班、停車場、即時路況、油價、車籍、道路設施

Preguntas típicas: 某路口近一年事故數;即時公車到站;本市公有停車場剩餘車位

治安、警消與災防

public_safety

刑案、警政、消防/救護、災害示警、地震/颱風/淹水、海巡、110/119

Preguntas típicas: 本市本月詐騙手法統計;即時災害示警;消防救護案件

Artículos conectados Tifones

司法、法務、矯正與裁罰

judicial_legal

法院判決、檢察偵查/起訴、矯正/監所/受刑人、訴願、政府機關裁罰名單

Preguntas típicas: 某公司被金管會裁罰歷史;某地檢偵查終結概況

立法院/國會

legislature

立法院議案、法律提案、表決、公報、質詢、發言、IVOD 影音索引、立委個人資料、選區、會議記錄。

Preguntas típicas: 某委員第N屆提了哪些法案;某黨團對 X 議案的表決傾向;某議題在公報的歷次發言

醫療、衛生、食品與藥物

health_food

醫事機構、健保特約、藥局、藥品/食品許可、疫情、長照、母嬰親善、食安

Preguntas típicas: 住家附近健保藥局;某藥品/醫材許可資訊;近期傳染病通報

環境、氣象、生態與水文

environment

空品 AQI、河川水質、雨量、水庫、廢棄物回收、林班、生態保育、噪音、碳排

Preguntas típicas: 今日本區 AQI;某河川水質歷史;本市資源回收成果

教育與科研

education_research

各級學校、教師/學生統計、補習班、圖書館、科研計畫、專利、學位論文

Preguntas típicas: 某學區學校清單;某學校歷年學生數;某機構研究專利

農林漁牧

agriculture_fisheries

農產交易、畜牧場、漁港/漁船、農藥/肥料、農會、養殖、畜產統計

Preguntas típicas: 某果菜市場今日交易行情;某縣畜牧場分布

勞動與就業

labor_employment

違反勞動法令、薪資、職缺、職業訓練、勞退/勞保、職災

Preguntas típicas: 某雇主違反勞動法令紀錄;某產業薪資中位數

Historia por escribir El techo del salario asegurado: tres tablas del Ministerio de Trabajo para ver el sueldo real de los taiwaneses

Cómo analizarlo: Los salarios asegurados de los tres regímenes (seguro laboral, de empleo y de accidentes laborales) cruzados por sector y tamaño de la unidad. Ojo con el truncamiento por la derecha que produce el tope de aseguramiento de NT$ 45 800: si no se trata primero, el promedio de los sectores de salarios altos queda sistemáticamente subestimado; la mitad de la polémica sobre el «salario promedio» nace aquí.

社會福利、戶政、人口、選舉與公務人事

social_population

人口/戶籍/出生/死亡/結婚/離婚、低收入戶、身心障礙、原住民/新住民、選舉投票、公務員人事

Preguntas típicas: 某選區歷次得票結構;某縣身心障礙人口;本市本月人口變動

文化、觀光與體育

culture_tourism_sport

景點、博物館、古蹟、寺廟、活動行事曆、體育場館、運動賽事

Preguntas típicas: 本週某縣市活動;某博物館館藏

外交、領事與兩岸

foreign_affairs

外交部公告、領事/簽證/護照、駐外館處、兩岸貿易/政策/案件、僑務、國際合作、新南向、邦交國

Preguntas típicas: 某國家近年我國進出口金額;近期外交部聲明 / 兩岸政策談話;簽證 / 護照申辦規定;駐外館處清單與聯絡資訊

政府公告與檔案

gov_publication

機關新聞稿、公報、最新消息、電子公布欄、公文範本、檔案目錄、施政方針、資訊公開申請、公共政策參與

Preguntas típicas: 本週某機關新聞稿;行政院公報全文檢索;某類公文 / 表單範本;政府資訊公開申請統計

Historia por escribir Taiwán en el boletín oficial: qué anuncia el propio gobierno cada mes

Cómo analizarlo: Con el texto completo del boletín se construyen series temporales de palabras clave sobre cambios normativos, contrastadas con los registros del Yuan Legislativo del dominio legislature: el desfase entre el anuncio administrativo y la trayectoria legislativa es la velocidad real a la que una política entra en vigor.

地理底圖(橫向層)

geo_basemap

行政區界、村里界、門牌、坐標、路網、河系、土地利用

Preguntas típicas: 作為其他資料集的 join 來源;空間查詢

Artículos conectados Cómo leer un mapa de Taiwán

能源、水電瓦斯與電信(橫向層)

utilities_telecom

電力供需、加油站、自來水、瓦斯、再生能源、電信與寬頻、無線網路

Preguntas típicas: 即時電力負載;某行政區自來水水質;某地加油站清單

Metodología de enlace: las claves que hacen coincidir dos tablas

Un conjunto de datos aislado es un punto; solo al combinarse se vuelve una red. Estas son las pistas de enlace que más nos sirvieron en las pruebas.

Frecuencia de actualización = resolución de análisis: el espectro de los quince conjuntos de datos de muestra

Cada punto es un conjunto de datos citado en esta página; pasa el cursor para ver su nombre. Antes de diseñar un análisis, mira en qué extremo del espectro caen tus datos.

每1月 ×4
每3月 ×2
每1年 ×3
每4年 ×1
每5年 ×1
不定期 ×4
← Actualización mensual: permite estudios de eventos Cada cinco años: solo comparación entre periodos →

Códigos de distrito administrativo

La clave de enlace más universal. Los códigos estándar de ciudades, condados y municipios permiten alinear población, precios de vivienda, accidentes y recaudación en un mismo mapa; los distritos homónimos (hay dos distritos Xinyi) se desambiguan por código.

Número de identificación fiscal unificado

El documento de identidad de las empresas. El registro mercantil, las adjudicaciones de contratos, las solicitudes de patente y las listas de sanciones cuelgan todos de este número: con él se sigue la huella completa de una empresa.

Coordenadas y códigos de estación de medición

Los datos ambientales (calidad del aire, agua, meteorología) cuelgan de estaciones de medición; los geográficos, de coordenadas. Convertir entre estos y los códigos de distrito administrativo es el primer paso del análisis espacial.

Niveles de calidad

La escala de platino a bronce es un cribado rápido de «¿este conjunto de datos puede usarse tal cual?»: los de nivel platino suelen estar ya normalizados y admitir consulta estructurada de filas; los no evaluados (como el registro de precios reales de curaduría propia) hay que verificarlos por cuenta propia.

La frecuencia de actualización es la resolución del análisis

Los datos mensuales permiten estudios de eventos; los anuales, solo tendencias; los quinquenales (el censo de puestos ambulantes), solo comparaciones entre periodos. Primero mira la frecuencia y luego diseña el análisis, no al revés.

Principio de referencia en dos capas

Cuando un artículo de Taiwan.md cita un conjunto de datos, el enlace apunta siempre a la página persistente de data.gov.tw o del organismo responsable; la capa de consulta (Twinkle Hub) es una ruta de valor añadido en paralelo. Con el hogar de los datos separado del camino de las consultas, un cambio en cualquiera de las capas no rompe la cadena.

Catálogo de herramientas: la lista completa de las 21

Lo siguiente se rastrea directamente del punto MCP (se actualiza en cada reconstrucción de la página). La agrupación es nuestra.

Cuarteto de conjuntos de datos + índice de dominios ×5

  • search_datasets Search Taiwan government open datasets (台灣政府開放資料 / data.gov.tw /
  • get_dataset 取得資料集完整 metadata 與樣本資料列。
  • query_rows 讀取已 normalise 資料集的實際列;支援聚合查詢(v1.11.2+)。
  • materialize_dataset 強制下載並轉換指定資料集(若已 cache 則為 no-op)。
  • list_domains 列出全部 19 個 domain 標籤的定義(key、中文名、scope、典型問題、anchor 範例)。

Patentes ×2

  • search_patents 以自然語言查詢 TIPO 發明專利公開案 corpus (data.gov.tw dataset 15992,
  • get_patent_body 取得單一專利的完整 description body (技術領域 / 先前技術 / 實施方式)

Exámenes nacionales ×3

  • search_exam 以自然語言檢索台灣國家考試試卷 (dataset 170565,考選部,OGDL).
  • search_exam_questions 以自然語言 + (可選) 關鍵字過濾, 檢索國家考試題目級別.
  • get_exam_paper 取得單一國考試卷的全部題目 + 標準答案 (測驗題).

Sentencias judiciales ×2

  • search_judicial 以白話 + (可選)關鍵字 / 結構化過濾,檢索台灣判決書 corpus.
  • get_judicial_full 取單一判決書完整 metadata + JFULL + T3 抽出欄位 (若已處理).

Medicamentos y códigos médicos ×6

  • lookup_icd10 ICD-10-CM 中文版查詢 (衛福部健保署翻譯 v2023, data.gov.tw 177507).
  • search_drug 衛福部食藥署 全部藥品許可證 search (data.gov.tw 9122, 71,836 件).
  • get_drug_details 取單一藥品許可證的全 28 欄詳細 (data.gov.tw 9122).
  • search_health_supplements TFDA 健康食品許可證 (data.gov.tw 6951, 562 件).
  • search_drug_label 搜 twinkle-ai/tw-drug-labels-vision (CC-BY-4.0, ~72k 藥品仿單) 結構化欄位.
  • check_drug_interaction 初步篩查多藥品之間的交互作用 — naive substring scan over each

Nutrición alimentaria ×3

  • query_food_nutrition 衛福部 台灣食品營養成分資料 (data.gov.tw 8543, 226,825 行).
  • search_foods_by_nutrient 依單一營養素排行食物 (per 100g) — 衛福部食品營養成分 dataset 8543.
  • analyze_meal_nutrition 給定一頓餐 (食物名 → 克數), 算總營養成分.

Artículos ya conectados a la capa de datos

Desde junio de 2026 empezamos a añadir al final de los artículos una sección de «datos públicos»: cada una lista los conjuntos de datos que pueden verificar (o refutar) los argumentos del texto, con una línea sobre «por qué apunta ahí». Los primeros seis:

Twinkle Hub está en fase alfa, y la evaluación de esta página se actualizará a medida que evolucione. Taiwan.md y Twinkle Hub no tienen hoy ninguna relación comercial; esta página es el chequeo de primera mano de un usuario intensivo, y también una invitación: solo cuando la capa de datos y la capa de significado cooperan, Taiwán puede ser comprendido por completo.

La lista de herramientas y dominios de esta página se rastreó en tiempo real el 2026-06-10 · hub.twinkleai.tw · data.gov.tw 🧬