OpenAI忙宮斗,AI大模型和應用忙上新丨科創要聞

大模型這場算力、數據、模型的“內卷”屬于企業,對于用戶來說,大模型的使用價值和應用場景更為重要。

責任編輯:黃金萍

2023年11月中下旬,OpenAI經歷了一場不斷反轉的人事動蕩,并以Sam Altman重新被任命為OpenAI CEO暫告一段落。

劇情撲朔迷離,確實吸引了足夠多的眼球。一家明星公司、一位明星CEO,真的能左右AI在人類世界的發展進程嗎?不妨看看更多企業在AI大模型升級和應用方面的努力。

大模型上新

11月21日,來自美國加州舊金山的AI初創企業Anthropic推出Claude 2.1 AI模型,支持輸入多達20萬個Token,超過了OpenAI大型模型GPT-4 Turbo的12.8萬個Token,可以處理更長文本的內容,同時還新增同系統預設提示詞(System Prompt)功能。Anthropic稱,Claude2.1的準確率是Claude2.0的兩倍,增強了對于文本內容的理解能力,特別是在處理法律文件、財報與技術規格等更高準確度的文檔時。

正如OpenAI和微軟的合作,Anthropic和谷歌站在了一起。2023年11月初,Anthropic宣布將采用谷歌的芯片Cloud TPU v5e來支持其大模型,并使用其云計算服務,而谷歌則在2023年10月承諾將向其投資20億美元,前期已經投入5億美元。

另外,由谷歌旗下DeepMind AI研究小組聯合創始人Mustafa Suleyman、DeepMind AI首席科學家Karén Simonyan和 LinkedIn聯合創始人Reid Hoffman于2023年3月共同成立的企業Inflection AI,在11月22日發布了新一代大模型Inflection-2,并稱它是全球第二代大語言模型(LLM)。Inflection-2在5000塊英偉達H100 GPU上進行FP8混合精度訓練,具備約10^25次FLOP計算能力,和谷歌的PaLM 2 Large模型處于同一訓練計算類別,并在MMLU、TriviaQA、HellaSwag和GSM8k等大多數AI基準測試中,優于PaLM 2,部分測試僅次于OpenAI的GPT-4。

登錄后獲取更多權限

立即登錄

校對:胡曉

歡迎分享、點贊與留言。本作品的版權為南方周末或相關著作權人所有,任何第三方未經授權,不得轉載,否則即為侵權。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}
午夜宅男在线,中视在线直播,毛片网站在线,福利在线网址