KRAFTON 發表 AI 模型品牌『Raon』
NQ 評分
100/100
AI 摘要(NQ 加工版)
KRAFTON 發表了新的 AI 模型品牌『Raon』,並公開了語音對應大型語言模型 (LLM)、即時語音對話、文字轉語音 (TTS) 和視覺編碼器等 4 款模型。這些模型在多個評估基準中展現全球頂尖性能,尤其視覺編碼器更是從零開始獨立學習。KRAFTON 旨在透過 AI 技術創造遊戲本質樂趣,並將持續強化其在全球 AI 技術領域的競爭力,引領技術創新。
尚無 AI 分析資料。
常見問題
- Q: KRAFTON股份有限公司於何時在全球平台 Hugging Face 上開源全新 AI 模型品牌『Raon』,包括哪些模型?
- A: KRAFTON股份有限公司於2026年在全球平台 Hugging Face 上開源了全新 AI 模型品牌『Raon』,共提供四款模型,分別為 Raon‑Speech、Raon‑SpeechChat、Raon‑OpenTTS 與 Raon‑VisionEncoder。
- Q: Raon‑Speech 具備多少參數,並在語音識別與合成等任務中取得何種排名?
- A: Raon‑Speech 具備 90 億個參數,在所有小於 10 億參數的公開語音語言模型中,於英語與韓語兩種語言的 7 項主要任務以及 40 個基準測試中,取得全球最高的平均排名表現。
- Q: Raon‑SpeechChat 採用了哪項即時雙向通訊技術,且在雙向模型基準測試中表現如何?
- A: Raon‑SpeechChat 採用 Full‑duplex(全雙工)即時雙向通訊技術,使使用者可在對話中自然打斷模型,這是韓國首款此類模型,在 3 種雙向模型評估基準的 13 項主要任務中,均獲得全球頂尖的平均排名。
- Q: Raon‑OpenTTS 的訓練資料來源為何,且在人類盲測中相較於使用非公開資料的模型表現如何?
- A: Raon‑OpenTTS 完全使用公開語音資料進行學習,且公開了完整的學習數據集,讓任何人可在相同環境下重現訓練;在人類盲測評估中,即使與使用非公開資料的全球研究 TTS 模型比較,也達到了頂級的性能水平。
- Q: Raon‑VisionEncoder 在視覺編碼任務上與 Google 的 SigLIP2 模型相比,有哪些優勢?
- A: Raon‑VisionEncoder 從零開始僅使用公開資料獨立學習,不依賴預訓練模型,在部分視覺識別任務中超越了 Google 的代表性模型 SigLIP2,且在其他任務中亦呈現超過 SigLIP2 90% 的效能,未來將應用於 KRAFTON 的「獨家 AI 基礎模型」專案。