RockAI,一群要替代Transformer的中國年輕人

一家中國AI初創企業試圖掀翻2017年谷歌提出的Transformer架構,深入更底層做創新。

責任編輯:黃金萍

在“百模大戰”打得不可開交的時候,一家成立于2023年6月的中國AI初創企業試圖掀翻2017年谷歌提出的Transformer架構,深入更底層做創新。

Transformer是目前主流生成式AI所采用的架構,包括引發這一輪AI熱潮的ChatGPT在內。谷歌發布Transformer架構的論文標題說,注意力即為一切(Attention Is All You Need)。

這家名為RockAI(巖芯數智)的中國企業卻想通過架構創新,減少冗余計算和算力消耗,要“讓世界上每一臺設備擁有自己的智能(Make every device its own intelligence)”。

不到兩年,他們取得了不錯的進展。RockAI做出了Yan架構,在2024年1月發布中國首個非Transformer架構Yan1.0大模型,之后將其迭代至多模態Yan1.3版本,可高效處理圖文、語音等多模態信息,適配樹莓派、無人機、機器人、PC、手機等各類終端設備,在弱網環境、硬件和算力不那么高的條件下實現端側智能。

在RockAI位于上海的辦公室,在一個全開放式辦公區里,坐著他們的全部團隊約60人。這一群極客少年工作起來十分投入,叫他們名字時通常會被置若罔聞,必須得拍一下肩膀,對方才可能反應過來。

2025年3月底,南方周末研究員在這里見到了RockAI的兩位聯合創始人劉凡平、鄒佳思。溫和、內斂,甚至還有些斯文,他們的外表和談吐,實在不像是喊出如此張揚口號的野心勃勃的創業者。

實際情況便是如此。他們曾在互聯網大廠里從事過搜索、游戲開發工作,還有過短暫的小型創業經歷,在二三四五網絡科技股份有限公司(以下簡稱“二三四五”,巖山科技(002195.SZ)前身)共事期間一起優化Transformer,窮盡各種可能之后,他們一拍即合,決定創業,建自己的AI架構。

“如果以前是‘軟件定義硬件’,那么未來則是‘智能定義硬件’?!盧ockAI創始人、CEO劉凡平對南方周末表示,智能終端是走向通用人工智能(AGI)的“最優載體”,它的形態將根據需求千變萬化,扮演真正的“變形金剛”(Transformers)角色。

就像ChatGPT引爆生成式人工智能革命,DeepSeek顛覆“算力霸權”,Yan架構和它所處的中國制造生態,能否帶領群體智能走向AGI?

從底層架構革新

南方周末:你們最早什么時候意識到大模型的效用?

劉凡平:從外界來看大模型好像近兩年才爆發,但我們所學專業和工作經歷都與算法高度相關,在相關技術最初出現時就有感知,2019年團隊做搜索推薦業務時就想用Transformer架構解決問題。幾次嘗試,

登錄后獲取更多權限

立即登錄

校對:趙立宇

歡迎分享、點贊與留言。本作品的版權為南方周末或相關著作權人所有,任何第三方未經授權,不得轉載,否則即為侵權。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}
午夜宅男在线,中视在线直播,毛片网站在线,福利在线网址