為幫助教師及時(shí)把握人工智能領(lǐng)域前沿發(fā)展趨勢,深化對大模型技術(shù)的系統(tǒng)認(rèn)知,提升教學(xué)內(nèi)容與產(chǎn)業(yè)實(shí)踐的貼合度,近日,人工智能與大數(shù)據(jù)學(xué)院組織各教研室教師,參加了由趙鑫教授主講的山東省人工智能通識教育系列講座第四期--大模型技術(shù)發(fā)展歷程與技術(shù)概覽。
講座聚焦大模型技術(shù)的演進(jìn)脈絡(luò)、核心邏輯與國產(chǎn)創(chuàng)新進(jìn)展。趙鑫教授從發(fā)展基礎(chǔ)與整體格局切入,系統(tǒng)梳理了自ChatGPT上線以來行業(yè)的核心脈絡(luò),并對比了中美在閉源與開源賽道上的差異化布局,指出中國在開源領(lǐng)域成果突出,DeepSeek、千問系列等國產(chǎn)模型已躋身國際高水平行列。
趙教授清晰拆解了語言模型從統(tǒng)計(jì)模型到神經(jīng)模型,再到預(yù)訓(xùn)練模型,最終演進(jìn)至百億、萬億參數(shù)規(guī)模的大語言模型的四代發(fā)展路徑,揭示了技術(shù)迭代的內(nèi)在邏輯與突破方向。在核心技術(shù)解析部分,他深入闡述了大模型“預(yù)訓(xùn)練”與“后訓(xùn)練”兩階段訓(xùn)練流程,以及數(shù)據(jù)工程體系的關(guān)鍵作用,強(qiáng)調(diào)了大模型研發(fā)作為一項(xiàng)系統(tǒng)工程,需要多領(lǐng)域協(xié)同與強(qiáng)大算力支持。
針對典型模型與國產(chǎn)進(jìn)展,趙教授重點(diǎn)分析了GPT系列的迭代升級路徑,并詳細(xì)介紹了國產(chǎn)代表DeepSeek的快速發(fā)展歷程:從2023年奠定基礎(chǔ),到2024年密集推出多代達(dá)到國際頂尖開源水平的模型,直至2025年初的r1模型在多項(xiàng)能力上追平國際頂尖閉源模型。他指出,國產(chǎn)模型的追趕速度不斷加快,未來有望實(shí)現(xiàn)超越。
趙教授在總結(jié)中強(qiáng)調(diào),大模型技術(shù)迭代速度極快,具有不可逆性,當(dāng)前正處于高水平發(fā)展階段,這為教師更新教學(xué)內(nèi)容指明了前沿方向。
此次專題學(xué)習(xí)為學(xué)院教師搭建了接觸人工智能前沿技術(shù)的有效平臺。未來,學(xué)院將持續(xù)聚焦行業(yè)技術(shù)前沿,組織更多針對性學(xué)習(xí)活動(dòng),助力教師緊跟產(chǎn)業(yè)步伐,為培養(yǎng)適應(yīng)智能制造發(fā)展需求的高素質(zhì)人才夯實(shí)教學(xué)基礎(chǔ)。
(通訊員:人工智能與大數(shù)據(jù)學(xué)院 于洋 馬建飛)