OpenAI忙宮斗,AI大模型和應用忙上新丨科創要聞
大模型這場算力、數據、模型的“內卷”屬于企業,對于用戶來說,大模型的使用價值和應用場景更為重要。
責任編輯:黃金萍
2023年11月中下旬,OpenAI經歷了一場不斷反轉的人事動蕩,并以Sam Altman重新被任命為OpenAI CEO暫告一段落。
劇情撲朔迷離,確實吸引了足夠多的眼球。一家明星公司、一位明星CEO,真的能左右AI在人類世界的發展進程嗎?不妨看看更多企業在AI大模型升級和應用方面的努力。
大模型上新
11月21日,來自美國加州舊金山的AI初創企業Anthropic推出Claude 2.1 AI模型,支持輸入多達20萬個Token,超過了OpenAI大型模型GPT-4 Turbo的12.8萬個Token,可以處理更長文本的內容,同時還新增同系統預設提示詞(System Prompt)功能。Anthropic稱,Claude2.1的準確率是Claude2.0的兩倍,增強了對于文本內容的理解能力,特別是在處理法律文件、財報與技術規格等更高準確度的文檔時。
正如OpenAI和微軟的合作,Anthropic和谷歌站在了一起。2023年11月初,Anthropic宣布將采用谷歌的芯片Cloud TPU v5e來支持其大模型,并使用其云計算服務,而谷歌則在2023年10月承諾將向其投資20億美元,前期已經投入5億美元。
另外,由谷歌旗下DeepMind AI研究小組聯合創始人Mustafa Suleyman、DeepMind AI首席科學家Karén Simonyan和 LinkedIn聯合創始人Reid Hoffman于2023年3月共同成立的企業Inflection AI,在11月22日發布了新一代大模型Inflection-2,并稱它是全球第二代大語言模型(LLM)。Inflection-2在5000塊英偉達H100 GPU上進行FP8混合精度訓練,具備約10^25次FLOP計算能力,和谷歌的PaLM 2 Large模型處于同一訓練計算類別,并在MMLU、TriviaQA、HellaSwag和GSM8k等大多數AI基準測試中,優于PaLM 2,部分測試僅次于OpenAI的GPT-4。
登錄后獲取更多權限
校對:胡曉