訓練台版AI語言模型許永真：盼讓百工百業商用

中央社

（中央社記者江明晏台北30日電）國科會去年4月啟動TAIDE計畫，研發台版大型繁中AI語言模型，台大資工系教授許永真表示，TAIDE是透過中文資料，訓練以英文為母語的Llama模型，「像在教美國長大的ABC講中文」，目前已有初步成果，盼盡快讓台灣百工百業商用。

「2024年AI與資訊安全論壇」今天登場，台大資工系教授許永真以「台灣的AI與大型語言模型（LLM）」為題發表演說。

為因應國際大型語言模型常產生資訊偏誤，或不符台灣文化與價值觀的回應，國科會去年4月啟動TAIDE計畫，在Llama（Meta推出的語言模型）原型基礎上，由國內學界專家進一步發展及訓練調校。

許永真為台灣AI卓越中心副總召集人，參與TAIDE計畫，她今天在論壇中表示，AI有其資安風險，許多人都擔心「所思所想、機敏資料外流」，讓大家對AI又愛又怕，甚至有人透過AI模型學習，可攻擊世界上任何一個網站。

她援引哈佛法學教授雷席格所說，「我們正處於AI的『奧本海默時刻』，好壞永遠並存」。

許永真也說，雖然要擔心資料外流的問題，但更應該正視台灣失去數位話語權、失去自主發展大模型的機會，因此一年前就與專家團隊一同建議台灣應該建造自己的AI對話引擎，在國科會指導下，成功打造出TAIDE可信任AI對話引擎。

她分享，TAIDE是站在巨人肩膀上，選擇以英文為母語的Llama模型，再透過中文資料繼續訓練；許永真比喻「就像在教一個在美國長大的ABC學會講中文」，透過英文基礎教育、中文基礎教育、中學教育、高等教育等加強學習。

在算力有限的狀況下，TAIDE去年6月就成功完成第一階段展示，她表示，目標是成為可商用模型，讓台灣百工百業都來使用，其條件包括基礎模型必須可商用，也要有充足的可商用授權中文相關資料。

許永真分享，Meta去年7月推動可商用的Llama 2，並在今年4月19日公開釋出Llama 3新一代的大型語言模型，團隊僅用4天就完成模型訓練；接下來的挑戰是透過可商用中文資料訓練，目前已經有許多中文授權資料量，也歡迎各界交流資源。

她強調，TAIDE不是要去和各大語言模型抗衡匹敵，但希望能提供台灣中小企業，甚至不願意資料外流的金融業一個安全可靠的語言模型，也期待民間力量來把這個專案商轉，一起來共同壯大。（編輯：張均懋）1130430

新聞來源：中央社

訓練台版AI語言模型許永真：盼讓百工百業商用

延伸閱讀

新台幣午盤升1.7分暫收32.541元

台積電站回800元台股在20500點狹幅震盪

台積電擬退出董事會世界先進：強化治理、關係不變

睽違30年再公布　台灣貧富差距飆至近67倍

華新5月不銹鋼盤價續漲 300系每噸調5000元最多

立院三讀通過電子簽章法跨境貿易使用更具法律效力

陳泰銘：國巨營收獲利回歸成長模式續整併新事業

報稅季5/1登場財部教戰快速完稅新招

華碩資安長：大廠應帶頭樹立供應鏈資安管理制度

櫃買業績發表會5月登場穩懋大樹與茂達打頭陣

資安即國安郭水義：加緊建立AI驅動的資安防護

台股創高AI助攻 3月製造業景氣燈號轉亮綠燈

讀者迴響

新聞關鍵字

關注我們！

訓練台版AI語言模型 許永真：盼讓百工百業商用

延伸閱讀

新台幣午盤升1.7分 暫收32.541元

台積電站回800元 台股在20500點狹幅震盪

台積電擬退出董事會 世界先進：強化治理、關係不變

睽違30年再公布 台灣貧富差距飆至近67倍

華新5月不銹鋼盤價續漲 300系每噸調5000元最多

立院三讀通過電子簽章法 跨境貿易使用更具法律效力

陳泰銘：國巨營收獲利回歸成長模式 續整併新事業

報稅季5/1登場 財部教戰快速完稅新招

華碩資安長：大廠應帶頭樹立供應鏈資安管理制度

櫃買業績發表會5月登場 穩懋大樹與茂達打頭陣

資安即國安 郭水義：加緊建立AI驅動的資安防護

台股創高AI助攻 3月製造業景氣燈號轉亮綠燈

讀者迴響

新聞關鍵字

關注我們！

訓練台版AI語言模型許永真：盼讓百工百業商用

新台幣午盤升1.7分暫收32.541元

台積電站回800元台股在20500點狹幅震盪

台積電擬退出董事會世界先進：強化治理、關係不變

睽違30年再公布　台灣貧富差距飆至近67倍

立院三讀通過電子簽章法跨境貿易使用更具法律效力

陳泰銘：國巨營收獲利回歸成長模式續整併新事業

報稅季5/1登場財部教戰快速完稅新招

櫃買業績發表會5月登場穩懋大樹與茂達打頭陣

資安即國安郭水義：加緊建立AI驅動的資安防護