互聯網大廠逐浪GPT,“大模型背后是云計算的競爭”
越是聰明的大語言模型,參數量必然越大,這意味著每一次計算都要消耗更多的算力。換句話說,AI每回答一次問題,背后的成本都是高昂的。
大模型競爭背后實際是云計算的競爭。中國前四大云計算廠商,阿里云、華為云、騰訊云和百度智能云合占市場總額的八成。
各行各業的開發者不必再 “重復造輪子”,只需在云上找到所需要的模型,這能降低中小企業的AI開發成本。
(本文首發于2023年4月27日《南方周末》)
責任編輯:張玥
4月底,如果你在首都國際機場出發,就會看到一個個云計算廠商的海報燈牌,走到登機口就能集齊四大云計算廠商的廣告。
2023年,火爆全球的ChatGPT仿佛是一個從天而降的指南針,給全球科技企業明確了一條能夠通往“人工智能”這片新大陸的航線。
從輸出文本、回答問題到協助辦公、寫詩作畫,大語言模型的驚艷表現激發了全球科技企業對人工智能更大的想象空間。在中國,誰能擁有類似ChatGPT的技術,就意味著誰將獲得未來人工智能時代的入場券。
IDC中國副總裁兼首席分析師武連峰曾表示,“大模型的背后蘊藏著一場人工智能落地模式的變革?!边@種變革體現在,依托生成式預訓練的大語言模型,人們與機器之間得以自在溝通,而機器也能“理解”人們語言中的意圖。
在即將過去的4月,每隔幾天就有一家公司公布其研發的大模型進展。
華為大盤古模型、阿里通義千問、騰訊混元大模型、360智腦大模型、商湯科技日日新……各家大企業紛紛秀自己人工智能的“肌肉”。美團、搜狗的前高管、元老相繼宣布投身大模型創業。
北京理工大學副教授、知名漢語分詞系統ICTCLAS創始人、大數據搜索與挖掘實驗室主任張華平告訴南方周末記者,大多數大模型未公布最新的詳細技術文檔或研究論文,無法從原理結構上斷定它們的差異,但大模型最終會服務于這些互聯網企業的核心業務,完善他們的業務生態,這些模型的差異也會最終體現在這些具體的業務中。
一位做過多家云廠商分銷商的受訪者對南方周末記者說,現在還看不出來哪家的大模型比較好。
4月底,如果你在首都國際機場出發,就會看到一個個云計算廠商的海報燈牌,走到登機口就能集齊四大云計算廠商的廣告,即阿里云、華為云、騰訊云和百度智能云。
據民生證券統計,目前中國已發布超過三十個大模型。投身大模型創業的出門問問創始人、CEO李志飛則預計,中國未來1-2年會看到50家以上公司做大模型。
一場關于人工智能與云計算的競爭在中國互聯網企業中間悄然拉開序幕。
得算力者得AI
GPT-1向GPT-2、GPT-3迭代,參數量分別是1.17億、15億、1750億,參數規模正以指數級速度增長。
越是聰明的大語言模型,參數量必然越大,這意味著每一次計算都要消耗更多的算力。換
登錄后獲取更多權限