11/07/24

艾思維:簡立峰演講生成式AI

 簡立峰於2024年3月15日演講內容的整理,分成各主題以條列方式簡要說明:

簡立峰在1991年與AI研究的起點

1991年,簡立峰撰寫了台灣第一篇關於人工智慧(AI)的論文,並發表於IEEE。

他認為現在才是真正的AI時代來臨。


PART I: 生成式AI及其衝擊

1,生成式AI的技術發展與現狀(2023-2024)

2023年:ChatGPT模型大小達40TB,相當於100座大學圖書館或近億本書的知識量。然而,繁體中文內容僅佔2%。

ChatGPT透過語意對應生成內容,但不保證準確性,存在效率問題。

2024年趨勢:生成式AI與人機協作日益增加,每日約5千萬人使用ChatGPT,總用戶數約2億人,但仍低於瀏覽器的50億用戶。


2,生成式AI在企業應用中的趨勢

資料應用:企業逐漸定期收集及輸入自有資料。

大型模型與小型模型:大型模型如Claude 3、Gemini Ultra、GPT-5在實驗數據應用上更精確,小型模型如Llama具備更靈活的應用潛力。

數據來源:公開數據達40TB,企業私有數據逐步成為AI訓練的來源。

跨介面多模態應用:涵蓋影音生成技術,如SORA。


3,七大企業的AI佈局

全球主要AI企業:微軟(含OpenAI)、蘋果、Google、Meta、亞馬遜、台積電、NVIDIA,共占全球市值的13%,掌控AI資訊流。


4,AI的核心要素

四大要素:資金、人才、數據與算力是AI發展的基石。


5,AI的能力與限制

擅長之處:AI在文字、語音、影像辨識,閱讀和語言理解上優於人類。

不足之處:AI在思考、數學、規劃和與真實世界的連結上仍較弱。


6,AI對內容產業的衝擊

可替代性高的內容:越易取得的網路資料越易被替代,AI將加速內容自動生成,影響原創內容開發者。

語言模型(LM)運作:語言模型透過機率預測生成文本,不斷迭代更新並進行比較。


7,AI應用面向

程式編寫:AI可協助自動化撰寫程式。

影音生成:5G邊緣AI支撐即時影音生成。

新操作介面:AI使語音成為主流操作介面。

新型程式語言:Prompt成為一種下指令的新語言,但結果可能因機率因素不準確或不即時。


8,AI帶來的風險

風險概況

不準確率達56%。

資訊安全問題佔53%。

法規問題佔46%,個人隱私佔39%,勞動市場影響佔34%。


9,AI對就業市場的衝擊

工作影響:3億人受影響,特別是知識型工作,如軟體開發、資料分析、行銷、客服和內容生成。


10,AI在教育上的應用

教學輔助:學生使用ChatGPT完成作業,老師也使用ChatGPT改作業。

口試模式:如斯坦福大學的口試系統,學生選擇面試老師,由學校抽取人員參與,增加互動評估。


PART II: 企業的AI轉型

1,AI在企業中的應用場景

典型應用:客服、行銷、程式開發和知識管理。

語言模型開發:企業建立專屬語言模型,進行數據收集和模型訓練。


2,AI數位轉型三大面向

1. 客戶接觸:AI技術支持更高效的客戶互動。

2. 員工賦能:提升員工的AI應用技能,促進工作效能。

3. 業務優化:AI助力日常作業的優化和產品創新。


3,AI賦能員工的具體應用

知識保留:保存員工工作記錄,特別是工程師的知識留存。

會議記錄管理:會議內容自動轉錄,便於修改和查詢。

行銷和廣告生成:AI輔助生成行銷廣告及測試資料。

人才匹配:AI比對履歷資料以推薦合適職位。

客服支援:AI加速客戶資料調取,提高客服效率。


4,AI在中小企業中的應用

中小企業應用案例:如犀動智能技術,運用於旅館自動化管理。

開放源碼與企業數據結合:開放源碼輔助企業內部資料訓練,提升AI應用效果。


PART III: QA 問答部分

1,AI未來的技術方向

Gemini模型:結合生成與搜尋功能,能更有效地找到資料。

通用型與小型模型的比較:通用模型封閉應用,而小型模型(7B)更適合開放應用。


2,AI相關法規與知識產權問題

歐盟法規:歐盟將AI資料分為五個安全等級,最高等級需嚴格審查。

日本動漫IP的AI訓練:日本將動漫IP的資料公開供AI免費訓練。

AI生成藝術的版權問題:AI生成的畫作經臨摹後不再享有版權。