面壁智能創始人劉知遠:我們應該把AI看作是一個工具

“ChatGPT是人類歷史上真正實現了用一個模型去理解和生成人類語言,這在歷史上是從來沒實現過的?!?br />
“把更多的知識放在一個更小參數的模型里面去,讓這個模型能以更低的成本去訓練,更低的成本使用,讓每個人都能用得起、用得上?!?br />
“未來只有少數人會去制造各個領域的AI產品,而更多人則可以享用這些AI產品所帶來的便利?!?/blockquote>

責任編輯:顧策

清華大學計算機系副教授劉知遠小學寫應用題,老會卡殼。總會過度思考,從一個題目里讀出多重含義。到了高中,寫英語閱讀理解時,這種感受更強烈了。

劉知遠從未懷疑過出題人,反而懷疑是不是自己太笨了,“理解不了題目”。多年后深入學習語言哲學之后,才漸漸意識到這其實是種天賦,“我就比較善于抓住語言里面那個不確定的地方”。

自然語言處理本質就是消除這種不確定,讓機器能夠精確無誤理解人類的語言。劉知遠前半生正是與這種不確定性纏斗的二十年。

特別是過去兩年,搭上ChatGPT的便車,自然語言處理坐上了時光機,2023年到2024年所經歷的這些新事情,比過去20年經歷的總和還要多得多”。

回望中國大模型史,年屆四十的劉知遠是個繞不過去的人物。參與締造中國第一個大模型,又躬身參與了這一輪大模型創業。2022年8月,在ChatGPT發布三個月,劉知遠發起成立了一家大模型公司——面壁智能。

這家公司最為出圈的一件事,2023年6月3日,斯坦福大學一個學生團隊發布的一個模型被發現是抄襲了面壁智能的模型。

面壁智能的辦公室位于北京中關村東路1號院6號樓3 層,辦公室的白墻上隨處可見那句《三體》的經典臺詞,“這是面壁計劃的一部分”。

圖片由農健使用AI工具生成

GPT前傳

1984年,劉知遠出生在山東泰安新泰市一個普通工薪家庭,小學偶爾逃課去游戲廳玩,家里也沒期待過他能上清華。他父親在郵電局上班,還建議放棄初中直接讀中專,方便以后接他的班。

沒想到十幾年后,劉知遠以山東省前三十名的成績,如愿進入清華大學。

當時正是互聯網泡沫破滅之時,最熱門的方向是建筑和生物醫學,計算機專業并不是高分專業。劉知遠報了建筑、生物工程和電子系,招生組反饋這些專業的名額已經被分數更高的同學占了,無奈選了計算機專業,“算是一個機緣巧合吧”。

讀博時也是如此,報考生物信息學方向也是招滿了,他陰差陽錯進入了自然語言實驗室,“我覺得非常幸運,因為五年之后生物信息學的導師自己都放棄了這個方向?!弊匀徽Z言處理正好開始了高歌猛進的二十年。

劉知遠清楚記得,讀博期間,實驗室有個大師兄做文本分類,“給你一篇文章,看能不能把它分到相關的類別里面,比如這篇新聞是社會新聞,還是國際新聞、軍事新聞,是別的新聞?”他的博士論文就是關鍵詞提取,通過統計的方法識別出文檔到底哪個詞,能代表文章主題的關鍵詞。

2012年成為一個分水嶺,深度學習在大洋彼岸叩響了發令槍。當年10月,Geoffrey Hinton和他的兩名學生——Alex Krizhevskyr,以及ChatGPT 的靈魂人物 Ilya Sutskeve,獲得ImageNet圖像識別比賽的冠軍,并且發表論文介紹了第一個深度卷積神經網絡模型AlexNet。ImageNet是斯坦福大學教授李飛飛創辦的人工智能領域一個重要賽事,通過對機器算法識別圖像,從而促進最先進算法的開發。

在處理圖像識別、語音識別方面,深度學習的能力得到了廣泛認可。在老師孫茂松的帶領下,劉知遠花了兩個月尋找答案。自然語言處理方向的大多數人的意見是,深度學習不能幫助自然語言處理。

最終劉知遠得出一個結論:基于統計學習用符號去表示語言知識的這種傳統路線,已經沒有太多突破的可能,深度學習是個非常值得探索的新技術路線。正是基于這樣的判斷,“我們實驗室應該是國內最早擁抱深度學習的團隊”。

2017

登錄后獲取更多權限

立即登錄

校對:星歌 吳依蘭

歡迎分享、點贊與留言。本作品的版權為南方周末或相關著作權人所有,任何第三方未經授權,不得轉載,否則即為侵權。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}
午夜宅男在线,中视在线直播,毛片网站在线,福利在线网址