AI將所有產業重做一遍

第C06版：閱讀時間

上一版下一版

放大+ 缩小- 默认o

AI將所有產業重做一遍

《AI應用革命》作者：何丹、靳毅、朝亮出版社：浙江大學出版日期：2025年9月

AI將所有產業重做一遍

在人工智能浪潮席捲全球的今天，市面上不乏探討大模型技術的著作，但大多止步於技術原理的科普或宏觀趨勢的預言。由浙江大學出版社出版的《AI應用革命》一書特別指出，AI要將所有產業重做一遍，書名直搗大家共同關心的問題，在人工智能的時代，有什麼行業已在變革，有什麼行業還有剩餘的核心競爭力。

本書開篇即以DeepSeekR1模型的橫空出世作為切入點，極具震撼力。書中引用了一組關鍵數據：DeepSeekR1的訓練成本僅為五百五十七點六萬美元，不足GPT-4的十分之一，卻已達到與國際頂級閉源模型相當的水平。這一實例不僅是一個技術奇蹟，更是本書核心論點的有力佐證——AI的高門檻正在被打破。作者敏銳地指出，DeepSeek採用開源策略，打破了算力壟斷，上線一個月便在全球一百四十個國家的AppStore榜單中奪冠，日活躍用戶突破三千萬，創下史上最快增長紀錄，這一現象級事件在書中被解讀為“AI應用革命”的序曲，當高性能模型變得低成本且開源，應用創新的爆發點便隨之到來。

對於非技術背景的讀者，本書最可貴之處在於將複雜的底層架構講得通俗易懂。書中詳細梳理了Transformer模型的核心在於自注意力機制。作者通過對比傳統的循環神經網絡(RNN)，形象地解釋了為何Transformer能“同時關注整個輸入序列”，從而捕捉元素間的關係。本書更為精彩的是對DeepSeek架構創新的解讀，書中用“大型諮詢公司”的比喻來闡釋混合專家模型(MoE)：想像在一家大型諮詢公司裡有多個專家，每個專家都擅長不同的領域，當客戶（輸入數據）來諮詢時，公司會根據需求動態分配最合適的專家。這種通過“門控機制”動態選擇專家模塊的方式，不僅減少了計算資源的浪費，還通過共享專家捕獲通用知識，路由專家專注特定任務，提升了泛化能力。配合多頭潛在注意力(MLA)機制對鍵值緩存的優化，模型在降低顯存佔用的同時提高了推理速度。這些技術細節的剖析，讓讀者明白創新的“高效”並非空話，而是源於架構的精妙設計。

那麼大模型是如何變得“聰明”且“安全”的？本書將其概括為三個階段：預訓練（讀書）、微調（做題）、對齊（調整價值觀）。書中提到，GPT-3的訓練數據量相當於普通人閱讀二千六百年，這種“吞下”數千萬本書的預訓練過程，讓模型在無數次猜詞練習中建立了對世界的理解。隨後的微調與人類反饋強化學習(RLHF)，則確保了模型輸出符合倫理和法律規範。這一部分的論述，幫助讀者建立了大模型全生命周期的認知框架，理解了模型不僅需要海量數據，也需要人類引導發展路徑。

在應用落地章節，本書避免了盲目吹捧單一模型，而是提出了“場景適配論”。正如書中引用的一位AI工程師的感悟：“選模型就像選汽車，追求速度選超跑，看重油耗就選混動，需要越野就挑SUV。”初創企業可能青睞DeepSeek的開源與低成本，跨國集團可能需要GPT-4的多語言支持，而科研機構或許更加依賴Gemini的跨模態分析。書中列羅了廣泛的應用場景，涵蓋科研、醫療、金融、法律、教育、工業、物流、政務等數十個領域，並指出智能助手、多模態搜索、代碼生成、社交Agent以及硬件結合是未來的熱點。這種多元發展表明，AI競爭中沒有絕對的贏家，只有最適合場景的解決方案。

最後，《AI應用革命》這本書提醒我們，技術是手段，應用是目的，商業可持續才是根本。無論是希望利用AI降本增效的企業管理者，還是尋求突破的開發者，都能從書中找到屬於自己的“革命”起點。

鄧偉強

放大+ 缩小- 默认o