關於AI模型的地緣政治,程世嘉的想法是不要打去已經結束的仗,如何依據臺灣的中小企業體的體質,結合AI發展既有的商業模式才是關鍵,他說「台灣的企業環境和矽谷不同,而且企業以 B2B 居多,很多企業是看顧客需要些什麼,才回過頭來做產品。 B2B 的企業不需要發展超級大的基礎模型,不如找出妥善的垂直應用,將 AI 整合進入自己既有的商業模式,才是最有利的選擇。]」
「不要去打已經結束的戰爭最後,最重要的是,「AI模型微型化」的趨勢已經形成:AI模型愈縮愈小,效能卻沒有退化。各家技術大廠現在都拼命朝著這個方向優化,讓AI模型能夠直接被放在各種裝置裡面,甚至在離線的環境下也可以使用,藉此加速AI的普及。所以,除非AI的底層技術或架構出現嶄新的突破,否則這個趨勢會讓「重新訓練自己的基礎大語言模型」變得愈來愈沒有必要。
不要只是為了自己的面子,老是想重新發明輪子。
雲端趨勢剛起的時候,大家都說台灣一定要有自己的公有雲基礎設施,但西方已經有很多雲端服務平台如Google Cloud Platform、微軟Azure、亞馬遜的AWS,中國則有阿里雲,騰訊雲,還都發展得非常好,等於泡沫破了一次;幾年前,我們也說要有自己的元宇宙、區塊鏈基礎設施,如今泡沫再被打破。
這次來到基礎大語言模型的技術戰局,出於國家資源、產業資源、社會資源的考量,如同我一再強調的,我們應該借鏡前車之鑑,讓台灣企業在其他基礎大語言模型之上,趕緊各自帶開發展垂直應用,像國科會號召打造的生成式AI對話引擎TAIDE(Trustworthy AI Dialogue 20Engine),就是以Meta的開源大語言模型Llama為基礎,進行繁體中文的訓練、調校,最終形塑出的「台灣味大型語言模型」。
不要去打已經結束的戰爭,要站在別人的肩膀上,找出妥善的垂直應用,將AI整合進入自己既有的商業模式,才是對台灣最好的選擇。」
這點有點像社會學本土化的討論,我們不見得需要砍掉重練,但是需要弄清楚底層邏輯(哲學人類學預設與思想史脈絡),然後理解別人怎麼生成他們的理論,而我們怎麼生成適用於我們脈絡的理論來解釋與引導我們的社會發展。(也許吧?)
其他像是強調自然語言及相關人文學科的重要性,大概可能短期也不會扭轉大家對於資工專才一窩蜂的投入;而對於個殊專業的重視以利未來跨域結合,而不是現在跨域,最後變得不太知道怎麼搭載AI協作工作的想法,我認為也算是個提醒。
沒有留言:
發佈留言