AI News NQ Analysis

數發部攜手中研院釋出研究語料 助攻多元AI應用

NQ 評分 86/100

AI 摘要(NQ 加工版)

數發部と中研院は、台湾主権AI訓練語料庫に研究語料を公開し、多様なAI応用を支援する。中研院は、学術研究、政策分析、歴史文化、科普テキストなど、620万詞元を超える高品質な正体中文語料を上架した。これらの語料は、農業、科技、金融改革の政策建議、人文社会、数理、生命科学の研究成果、科学知識の普及、台湾史、科研倫理など多岐にわたる。専門知識語料は、AIモデルの特定分野での理解能力と推論精度を高め、RAG知識庫構築や専門問答システム開発などに貢献する。語料庫は昨年末に開設以来、3000件以上のデータセット、12億詞元以上を蓄積しており、今後も台湾特色のテキストデータを拡大する予定である。

尚無 AI 分析資料。

常見問題

Q: 數位發展部於哪一年何時開始與中研院合作,釋出平台上具代表性的研究與科普文本資源?
A: 數位發展部於2025年12月與中央研究院合作,於台灣主權AI訓練語料庫平台上新增超過620萬詞元的研究與科普文本資源,提供AI模型訓練使用。
Q: 本次上架的語料庫中,包含哪些類型的文件,並分別提供了哪些具體內容與數量?
A: 本次上架的語料庫包括「政策建議書」─涵蓋農業、科技與金融改革等;「研究成果選輯」─橫跨人文社會、數理與生命科學;「研之有物」與「科普專欄」─以淺顯方式傳遞科學知識;「台灣史研究所之館藏選粹」─提供在地歷史文化記憶;以及「中研誠信電子報」─補充科研倫理資訊,總計超過620萬詞元。
Q: 數位發展部說明,專業領域知識語料能提升AI模型哪些具體能力與應用方向?
A: 數位發展部指出,專業領域語料能提升模型在特定情境的理解與推理能力,協助建置檢索增強生成(RAG)知識庫、發展專業問答系統、進行模型微調,並應用於摘要、分類與知識萃取等任務,促進具深度與專業性的AI應用發展。
Q: 截至目前,台灣主權AI訓練語料庫已上架多少筆資料集與累計多少詞元?未來有何計畫?
A: 自去年底上線以來,台灣主權AI訓練語料庫已累計上架逾3000筆資料集,超過12億詞元,未來將持續與各機關及學研單位合作,釋出更多具台灣特色與專業價值的文本資料,以厚植主權AI發展基礎。
Q: 本次釋出的語料中特別提到的「研之有物」與「科普專欄」有何特色,對AI模型學習有何貢獻?
A: 「研之有物」與「科普專欄」以生動、易懂的方式將艱深科學內容轉化為簡易敘述,提供AI模型多元語氣與知識轉譯的素材,增強模型在科學知識傳遞與一般大眾語言表達上的能力。