
新智元报谈
剪辑:艾伦
【新智元导读】谷歌 Gemini 数据贯串厚爱东谈主 Andrew Dai 联手苹果首席探讨科学家 Yinfei Yang,隐身创办 AI 少壮 Elorian。首轮将融资 5000 万好意思元,剑指「视觉推理」这个下一代大模子的中枢问题。
硅谷的 AI 创业激越中,最立志的筹码历久押注在最资深的「大脑」上。
曾在谷歌 DeepMind 服从长达 14 年的资深探讨员 Andrew Dai,正在筹建一家名为 Elorian 的 AI 初创公司。
伸开剩余86%这家尚不为东谈主所知的公司,种子轮融资方针即高达 5000 万好意思元。
与 Andrew Dai 联手的,是刚于客岁 12 月去职的苹果探讨科学家 Yinfei Yang。
这两位别离来自谷歌和苹果的本领老兵,正在试图措置大模子范围的下一个中枢问题:视觉推理(Visual Reasoning)。
领投这轮融资的,极有可能是由前 CRV 普通合资东谈主 Max Gazor 创立的 Striker Venture Partners。
要是交往兑现,这将是硅谷近期最受注倡导早期融资之一,也再次印证了成本市集对于「谷歌毕业生」的豪恣追捧。
14 年,从 BERT 早期到 Gemini 幕后
在 AI 探讨圈,Andrew Dai 这个名字代表着一种「历久主义」。
不同于那些在 Transformer 波涛爆发后才匆忙入局的创业者,Andrew Dai 在谷歌的工号不错细密到 2012 年。
这意味着他竣工经历了深度学习从边际学科走向天下中心的统统这个词周期。
在他的 LinkedIn 资格中,最引东谈主贯注的是他动作 Gemini 模子预熟习(Pre-training)数据使命的贯串厚爱东谈主。
在现时的大模子斗争中,数据质地和预熟习计谋被以为是决定模子才略上限的要害成分。
大概在这个中枢款式担任厚爱东谈主,足以讲授他在谷歌里面的权重。
Andrew Dai 的学术孝顺不仅限于此。
他曾与谷歌首席科学家 Jeff Dean 以及 Quoc V. Le(Google Brain 的传说东谈主物)共同撰写过多篇论文。
早在 2015 年,他发表的一篇对于半监督序列学习(Semi-supervised Sequence Learning)的论文,就被以为对自后 OpenAI 的 GPT 系列模子产生了深入的启发。
一位熟悉 Andrew Dai 的东谈主士评价谈:「他是言语模子的前驱之一,昔日二十年一直专注于预熟习相关的探讨。他最擅长的,即是奈何从海量、嘈杂的数据源中索取出高质地的“常识”。」
要是说 Andrew Dai 代表了谷歌在大数据处理上的暴力好意思学,那么贯串独创东谈主 Yinfei Yang 则带来了苹果系的抽象与多模态视角。
Yinfei Yang 此前在苹果机器学习团队担任首席探讨科学家(Principal Research Scientist),主要参与苹果自研 AI 模子的开发。
在加入苹果之前,他曾经在 Google Research 使命过四年,专注于多模态示意学习。
他在图像-文本共镶嵌(Image-text Co-embedding)范围的专长,赶巧填补了单纯言语模子的感知短板。
视觉推理
不单是「看见」,更要「一语气」
Elorian 究竟思作念什么?
把柄 Andrew Dai 的说法,Elorian 并不是要再造一个 ChatGPT,而是要构建一个大概「同期一语气和处理文本、图像、视频和音频」的原生多模态模子。
当今的 AI 模子大多是基于文本熟习,再通过「补丁」的神气接入视觉智力。
而 Elorian 的愿景是构建一个天生的「通感者」。
这种模子不再是将图片调停为翰墨标签,而是像东谈主类雷同,通过视觉平直感知物理天下的逻辑。
「视觉推理」被以为是通向 AGI 的必经之路。
Andrew Dai 提到,机器东谈主将是 Elorian 本领的一个潜在期骗场景,但他强调公司的愿景远不啻于此。
在硅谷的投资东谈主眼中,这通常意味着 Elorian 对准的是 AI 智能体的广大市集——一个大概像东谈主类雷同看着电脑屏幕、一语气图形用户界面(GUI)、处理退货进程、审核法律文献、操作其他软件的超等助手。
它不需要你通过 API 喂给它数据,而是平直像你雷同「看」着 Excel 表格、「听」着电话灌音,同期「读」懂屏幕上的邮件,并及时作念出方案。
这即是 Elorian 试图构建的畴昔。
成本的逻辑
为「血缘」买单
5000 万好意思元的种子轮融资,在几年前听起来像是离奇乖癖,但在今天的 AI 泡沫中,这似乎成了顶级团队的「入场费」。
正在与 Elorian 洽谈领投的 Striker Venture Partners,本人亦然一家极具话题性的新锐基金。
其独创东谈主 Max Gazor 曾是老牌风投 CRV 的合资东谈主,以目光毒辣著称。
他在客岁 10 月刚刚安稳自主,Elorian 很可能是该基金开拓后的首批标记性赌注之一。
对于 Max Gazor 这么的投资东谈主来说,他们赌的不单是是本领旅途,更是「谷歌 DeepMind + 苹果」这种稀缺的基因组合。
谷歌提供了大范围熟习基础设施的劝诫,而苹果则有着将 AI 落地到具体家具的求实文化。
Elorian 的出现,也折射出大模子战场的编削。
第一阶段的斗争是对于「文本生成」,OpenAI 凭借 ChatGPT 拔得头筹;
第二阶段的斗争则是对于「多模态一语气」和「物理天下交互」。
在这个新战场上,不管是 Gemini 曾经 GPT,王人在豪恣补课视觉智力。
Elorian 动作一个初创公司,思要在巨头的夹缝中糊口,惟一的筹码即是本领上的代差,或者在垂直场景(如复杂的视觉 Agent)上作念到极致。
在硅谷,每一个从巨头出走的顶级探讨员,王人怀揣着一个「反叛」的梦思:用更小的团队、更聚焦的资源,去颠覆老东家雄壮而逐步的官僚体系。
Andrew Dai 离开了服从 14 年的谷歌,Yinfei Yang 离开了发布 Apple 智能的苹果。
他们选择了一条最重视的路——试图提示机器不仅「看见」天下,还要「看懂」天下。
这让东谈主思起设想机视觉范围的一句老话:「录像头只是眼睛,算法才是灵魂。」
而在 AI 的激流中,真确稀缺的历久不是算力,而是那些大概透过数据的迷雾,看清畴昔标的的眼睛。
参考贵府:
https://www.theinformation.com/articles/former-google-apple-researchers-raising-50-million-new-visual-ai-startup
秒追ASI天元证券投资注册-散户股票杠杆_私募股票开户配资
发布于:北京市天元证券投资注册-散户股票杠杆_私募股票开户配资提示:本文来自互联网,不代表本网站观点。