010-88587556/9600/9800
大模型讓AGI落地應用成為(wèi)可能(néng)

“大模型發展過程中,實現大模型的核心基礎技(jì)術(shù)并未見(jiàn)颠覆性的創新,而是通(tōng)過長(cháng)期叠代演進逐步發展到(dào)目前水(shuǐ)平。”近日,北(běi)京航空航天大學計算(suàn)機(jī)系主任肖利民(mín)教授在采訪中表示,通(tōng)過“大算(suàn)力+大模型+大數據”的高(gāo)效組合,AI大模型逐步解決了需要大量标注樣本、跨領域自(zì)适應能(néng)力、多(duō)任務泛化能(néng)力等傳統AI落地難的問題,使得通(tōng)用人工(gōng)智能(néng)(AGI)實質性落地應用成為(wèi)可能(néng)。

談及AI大模型的關鍵技(jì)術(shù),肖利民(mín)說,以GPT為(wèi)代表的大模型,通(tōng)過基于Transformer結構的模型疊加和并行化,面向海量非标注數據的自(zì)監督學習、多(duō)任務學習/元學習/遷移學習,基于人類反饋的強化學習,基于跨媒體對齊的多(duō)模态翻譯和轉換等大模型核心創新技(jì)術(shù)的持續融合演進,使得大模型在跨領域多(duō)任務中表現出的智能(néng)化水(shuǐ)平有了質的變化。

大模型的發展和應用将賦能(néng)千行百業(yè),為(wèi)實體經濟中的企業(yè)提供更加智能(néng)化的技(jì)術(shù)和工(gōng)具,促進各行業(yè)和領域的創新發展,推動新産品、新服務、新業(yè)态的出現。肖利民(mín)表示,一(yī)方面,大模型可利用大量的數據進行分析和預測,幫助實體經濟中的企業(yè)做出更準确的決策。例如,通(tōng)過對市(shì)場趨勢、消費(fèi)者行為(wèi)、供應鏈等的分析和預測,企業(yè)可精準了解市(shì)場需求、更好優化産品和服務,提高(gāo)運營效率和競争力。另一(yī)方面,大模型可用于自(zì)動化和智能(néng)化系統,助力實體經濟中的企業(yè)提高(gāo)生(shēng)産效率和質量。例如,在制造業(yè)中,大模型可用于質量控制、設備運維、供應鏈優化等複雜(zá)任務,實現智能(néng)化生(shēng)産和運營。

入局大模型研發的門(mén)檻有多(duō)高(gāo),需要怎樣的算(suàn)力支持?大模型的研發和構建在模型訓練、大數據收集、大數據清洗、核心技(jì)術(shù)研發及關鍵人才招攬等諸多(duō)方面都需要付出高(gāo)昂的代價。肖利民(mín)表示,大模型訓練需要有高(gāo)算(suàn)力、大内存、高(gāo)互聯帶寬、高(gāo)運行效率的智能(néng)計算(suàn)平台。以GPT 3.0為(wèi)例,其模型參數總量達1750億個(gè),訓練樣本Tokens數達3000億個(gè),計算(suàn)量高(gāo)達314ZFLOPS,最大數據集45TB,參數和模型狀态存儲量超過2.1TB,如果要求訓練在30天内完成,以A100芯片為(wèi)例,訓練階段至少需要1558塊A100GPU,耗費(fèi)至少2337萬美元。

未來,不僅要關注大模型的研發和構建,更要注重大模型的精調和使用,以發揮大模型的實際效用。産業(yè)界越發關注大模型,但大模型并非多(duō)多(duō)益善,其研發、訓練需要持續的算(suàn)力、人才投入,通(tōng)常隻有大型龍頭企業(yè)或領軍企業(yè)才能(néng)負擔得起。基于通(tōng)用大模型,聚焦場景需求解決實際問題,打造精耕細作的行業(yè)大模型,打通(tōng)AI應用的“最後一(yī)公裡(lǐ)”,才能(néng)更好賦能(néng)實體經濟發展。(記者 吳雙)

注:本文轉載自(zì)人民(mín)郵電(diàn)報(bào),轉載目的在于傳遞更多(duō)信息,并不代表本網贊同其觀點和對其真實性負責,圖片來源網絡,如有侵權行為(wèi),請聯系我們,我們會(huì)及時删除