開欄語
1994年4月,中國全功能接入互聯(lián)網(wǎng),成為國際互聯(lián)網(wǎng)大家庭中的第77個成員。今年正是中國全功能接入互聯(lián)網(wǎng)的第30個年頭,也是“半甲子”的重要節(jié)點。
短短30年的發(fā)展歷程,大潮激蕩、風卷云涌,有太多“物”值得銘記。這三十年,中國互聯(lián)網(wǎng)從無到有,從小到大,從大到強,誕生了許多物件、應(yīng)用或平臺。上述物件或應(yīng)用等價值不只在商業(yè),它更是一種情懷,凝聚著人們生活與情感的長久記憶。
為此,新京報貝殼財經(jīng)聯(lián)合中國互聯(lián)網(wǎng)發(fā)展基金會中國正能量網(wǎng)絡(luò)傳播專項基金推出了《互聯(lián)網(wǎng)30年30物》專題。希望通過講述中國互聯(lián)網(wǎng)發(fā)展史上具有標志意義的物件、應(yīng)用或平臺的故事,勾勒中國互聯(lián)網(wǎng)三十年的演進歷程,透視其未來將走向何方。
30年前的一根網(wǎng)線,讓中國連通世界。如今,互聯(lián)網(wǎng)半甲子,中國繼“網(wǎng)”開來,方興未AI。
過去幾十年,中國的AI技術(shù)發(fā)展緊隨世界潮流,從語音識別技術(shù)商業(yè)化“破局”到計算機視覺技術(shù)廣泛用于人臉識別,從AI四小龍出現(xiàn),再到近兩年來大語言模型技術(shù)突飛猛進,國內(nèi)呈現(xiàn)“百模大戰(zhàn)”格局。截至現(xiàn)在,以最熱門的AI大語言模型技術(shù)來衡量,從大模型相關(guān)企業(yè)的排名、人工智能專利數(shù)量、大模型的能力測評分數(shù)來看,中國的技術(shù)實力或僅次于美國。
中國AI發(fā)展史:1997年起步 2000年中期開始飛速發(fā)展
人工智能本身在世界范圍內(nèi)也是一門新興學科,追溯歷史,我國從20世紀90年代末開始關(guān)注人工智能,一些頂尖大學和研究機構(gòu),如清華大學、北京大學和中國科學院,開始設(shè)立AI相關(guān)的研究項目和課程,培養(yǎng)了一批早期的AI研究人員。這一時期的研究主要集中在模式識別、機器學習、神經(jīng)網(wǎng)絡(luò)等基礎(chǔ)領(lǐng)域。
1997年,我國“863計劃”中首次將人工智能列為重點發(fā)展領(lǐng)域,提供了資金和政策支持,推動了AI技術(shù)的初步探索和研究。
2000年,隨著計算能力的提升和互聯(lián)網(wǎng)的普及,AI技術(shù)的發(fā)展進入了新的階段。這一時期,我國在自然語言處理、圖像識別、數(shù)據(jù)挖掘等領(lǐng)域取得了重要進展,并出現(xiàn)了一批具有代表性的公司,如1999年12月成立,專注于語音識別和合成技術(shù)的研究與應(yīng)用的科大訊飛,其憑借在語音識別技術(shù)上的突破,成為了中國AI技術(shù)應(yīng)用的先行者,并在教育、醫(yī)療等領(lǐng)域?qū)崿F(xiàn)了廣泛應(yīng)用。普通民眾也從可以自動將語音轉(zhuǎn)為文字的錄音軟件處第一次感受到了AI技術(shù)帶來的震撼。
2011年后,曠視科技和商湯科技等AI公司相繼成立,專注于計算機視覺技術(shù)的研究與開發(fā),中國也出現(xiàn)了以它們?yōu)榇淼摹癆I四小龍”。這些公司通過自主研發(fā)的圖像識別算法,推出了一系列應(yīng)用于安防、金融、零售等行業(yè)的產(chǎn)品和解決方案。
計算機視覺領(lǐng)域的AI技術(shù)進一步擴寬了AI應(yīng)用的領(lǐng)域,如火車站、機場可以代替人工,提高效率的人臉識別,正是拜AI技術(shù)所賜。
2012年,深度學習技術(shù)的突破也引發(fā)了全球范圍內(nèi)的AI熱潮。中國的科技公司迅速跟進,投入大量資源進行深度學習的研究和應(yīng)用。百度、阿里巴巴、騰訊等互聯(lián)網(wǎng)巨頭紛紛成立AI研究院,招募頂尖人才,推動技術(shù)創(chuàng)新。隨著深度學習的突破,AI技術(shù)在各個領(lǐng)域也取得了飛躍式發(fā)展,最終醞釀出了2022年底成功“破圈”,震撼世界的ChatGPT。
大語言模型異軍突起 中國“百模大戰(zhàn)”奮起直追
當前,最具代表性的AI技術(shù)當屬大語言模型,不過,這個由OpenAI發(fā)揚光大并震撼世界的技術(shù),其原理要追溯到2017年。
2017年,Google提出Transformer架構(gòu),奠定了大模型預訓練算法的基礎(chǔ)。隨后,OpenAI和Google分別發(fā)布了GPT-1和BERT大模型,推動了預訓練大模型在自然語言處理領(lǐng)域的應(yīng)用。
在此基礎(chǔ)上,2022年,OpenAI推出了ChatGPT,這才通過強大的自然語言交互與生成能力給了世界一個驚喜。也就在這一標志性事件之后,中國的各大企業(yè)也開始在大語言模型領(lǐng)域奮起直追。
2023年,國內(nèi)也涌現(xiàn)出眾多AI大模型,早在此之前就已經(jīng)號稱要“All in AI”的百度發(fā)布了首個國產(chǎn)大模型“文心一言”,緊隨其后的則是阿里云的“通義千問”,此后國內(nèi)大模型百花齊放,“訊飛星火”“智譜清言”“360智腦”等大模型競相發(fā)布,國內(nèi)大模型企業(yè)也正式進入了“百模大戰(zhàn)”階段,激烈的良性競爭下,我國AI大語言模型的技術(shù)實力也在逐漸攀升。
截至2024年,根據(jù)斯坦福大學發(fā)布的《2024年人工智能指數(shù)報告》,中國的大模型技術(shù)已躋身世界第二的位置。在政策層面,中國政府高度重視人工智能技術(shù)的發(fā)展,出臺了一系列扶持政策和措施,為人工智能的研究和應(yīng)用提供了良好的環(huán)境。同時,中國的科技巨頭和初創(chuàng)企業(yè)也積極投入到大模型技術(shù)的研發(fā)中,推動了中國在該領(lǐng)域的快速發(fā)展。
根據(jù)報告,全球大多數(shù)人工智能專利都來自中國,這一比例顯著超過其他國家。這一成果的取得,既體現(xiàn)了中國科研人員在人工智能領(lǐng)域的創(chuàng)新能力和實力,也反映了中國對知識產(chǎn)權(quán)保護的重視。
不過,目前中國AI大模型仍面臨諸多挑戰(zhàn)。首先,高質(zhì)量的訓練數(shù)據(jù)集稀缺,影響了大模型的發(fā)展速度和效果。其次,算力分散不足,難以滿足大模型訓練的需求。此外,領(lǐng)域數(shù)據(jù)稀缺,缺少現(xiàn)象級應(yīng)用等問題也制約了市場的進一步發(fā)展。
但挑戰(zhàn)與機遇并存。隨著技術(shù)的不斷突破和政策的支持,中國AI大模型市場將迎來更廣闊的發(fā)展空間。未來,AI大模型將在金融、醫(yī)療、教育、交通等多個領(lǐng)域發(fā)揮重要作用,推動產(chǎn)業(yè)變革和經(jīng)濟發(fā)展。同時,隨著AI技術(shù)的普及和應(yīng)用場景的拓展,普通人也將有更多機會通過學習和掌握AI工具,開啟新的職業(yè)生涯和創(chuàng)業(yè)之路。