∞ 苹果的人工智能主管 John Giannandrea 仍不会离开
苹果可能起步较晚,并且在发展过程中遇到了一些障碍,但苹果机器学习和人工智能战略高级副总裁 John Giannandrea 希望在将权力移交给继任者之前,计划先将 Apple Intelligence打造成成熟的产品。
Giannandrea 仍然负责人工智能和大型语言模型 (LLM) 的研究、人工智能分析师,并将这些技术集成到更大的操作系统基础架构中。彭博社的一篇报道称,在他即将离职之前, 一些苹果高管希望他的职位与影响力能够进一步缩减。
据报道,苹果领导层希望Giannandrea退休,并最终确定继任者。即便如此,这位高管仍然吸引着苹果的顶尖工程师和研究人员,因此目前他仍将留任。
詹纳德雷亚承认人工智能和 Siri 的开发有所延迟。业内人士普遍认为,他缺乏实际经验,更专注于机器学习等底层技术,而不是像 Siri 这样的面向用户的功能。
一个月前,苹果将Siri 的开发工作移交给了 Vision Pro 负责人 Mike Rockwell。此举减轻了 Giannandrea 的一些负担,让他能够专注于苹果 AI 引擎的开发。
苹果还一直在收购一些专注于人工智能的小型公司,以增强自身实力。这些收购预计将改善面向用户的功能以及核心技术。
在下一个任务(或可能离开苹果)之前,Giannadrea 一直专注于升级现有的人工智能引擎,以更好地利用未来的苹果硬件,包括将在下一轮苹果产品中出现的改进版神经引擎芯片。
相比之下,Rockwell一直认为 Siri 有潜力成为用户与苹果各种操作系统互动的主要方式。他被认为能够调动资源,将 Siri 重建为一个真正的助手引擎——类似于 ChatGPT 和Google的 Gemini。
报道援引一位不愿透露姓名的员工的话称:“(Giannandrea)应该更加积极地争取资金,以便做大做强。但约翰不是销售员,他是技术专家。”
众所周知,由于科技行业竞争激烈,以及担心落后,苹果工程师们总是被要求快速完成任务。目前尚不清楚Giannandrea是否在执行这条潜规则。
此外,报告还指出,Giannandrea的团队在总部受到了优待。他们享受到了其他团队无法享受到的福利,这可能导致了团队之间的一些摩擦。
据报道,一名员工表示:“我知道这听起来很蠢,但苹果不提供免费食物。他们比其他人晚一年发货,但仍然享受免费午餐。”
虽然 Giannadrea 将 Siri 视为控制Apple TV或HomeKit兼容设备等设备的助手,但据说 Rockwell 专注于通过让 Siri 访问更广泛的信息源 来改善与用户的整体交互体验。
这将有效地使该技术在处理用户请求时更加灵活,并增强与其他引擎的交互能力,用户肯定会对此表示赞赏。目前尚不清楚的是,用户需要多长时间才能看到 Siri 作为语音搜索工具和交互助手的能力得到显著提升。
∞ 新版Siri跳票一年 苹果员工痛诉AI危机:我们正在下沉
5月19日消息,2018年,苹果从Google挖来AI负责人约翰·詹南德里亚(John Giannandrea),试图扭转其在人工智能领域的落后局面。然而七年过去,苹果的AI战略屡屡受挫:承诺的Siri升级多次跳票,自研大模型进展缓慢,功能发布滞后于竞争对手。
尽管投入巨资并重组团队,苹果仍面临技术短板、内部决策分歧和隐私政策限制等多重挑战。如今,苹果被迫调整策略,一边加速开发"LLM Siri"新架构,一边寻求与OpenAI等对手合作。内部人士称,在AI领域的持续失利正威胁着iPhone的主导地位,乃至机器人和其他未来产品的规划。
以下为英文翻译节选:
早在2018年,苹果的人工智能业务似乎终于步入正轨。那年年初,软件主管克雷格·费德里吉(Craig Federighi)召集高层团队,宣布了一项重磅人事任命:苹果从Google挖来了詹南德里亚出任人工智能业务负责人。这位业内人称“JG”的高管,此前掌管Google的搜索和AI团队,曾推动将前沿人工智能技术应用于Google Photos、Google Translate和Gmail等核心产品。这些成果,加上2014年Google对英国AI公司DeepMind的收购,让该公司在人工智能领域确立了标杆地位。
对苹果高层来说,延揽詹南德里亚不仅是从最强劲对手手中赢得的一场胜利,更被寄予厚望:这或许将是苹果向AI巨头转型的关键一步。2011年,在联合创始人史蒂夫·乔布斯(Steve Jobs)去世前夕,苹果首次发布了语音助手Siri。最初,Siri看起来宛如科幻电影中走进现实的技术创新——苹果再次将前沿科技变成主流产品。然而,短短几年后,Google、亚马逊等竞争对手相继推出更强大的语音助手,而苹果的Siri却在理解能力和执行指令方面问题频出。
出生于苏格兰的詹南德里亚被赋予全面统筹苹果AI业务的职责。多位员工表示,苹果在人工智能方面进展缓慢,部分原因在于AI相关工作长期分散在多个产品团队中。詹南德里亚上任后,机器学习研究、测试部门以及Siri团队被整合为统一架构。他直接向首席执行官Tim Cook(Tim Cook)汇报工作,使人工智能成为继软件、硬件和服务之后的第四大核心业务。
费德里吉在宣布詹南德里亚的任命时难掩激动之情。自Siri推出以来,该团队几经易手,最终由他接手,如今则正式交棒给詹南德里亚。“他正是我们需要的AI领军人物,”费德里吉在团队会议中表示。许多人认为詹南德里亚在Google的地位仅次于CEO,他不仅主导AI战略,还曾担任互联网先驱网景(Netscape)的首席技术官。“你还能找到比他更合适的人选吗?”一位参与招聘的人士反问。
努力七年,差距却越来越大
然而,七年过去,詹南德里亚带来的希望与乐观早已消退。苹果不仅未能在AI领域迎头赶上,反而逐渐被拉开了距离。自2022年OpenAI推出ChatGPT以来,全球科技公司纷纷加速开发大语言模型(LLM),将其整合进语音助手等工具,并积极向消费者推广。
苹果虽也推出了新AI功能,但往往被外界视为“姗姗来迟”且“缺乏亮点”。在去年的全球开发者大会上,苹果发布了“Apple Intelligence”,将其宣传为“为每个人打造的人工智能”——呼应1984年首款Mac电脑“为所有人设计的计算机”的标语。
苹果承诺,“Apple Intelligence”将具备写作优化、邮件与通知摘要、生成功能性图像和自定义表情符号等能力,并预告Siri将迎来重磅升级:首次能够深度访问用户的个人数据与屏幕内容,智能回答个性化问题。在现场演示中,詹南德里亚的一位高管助手请求Siri查询其母亲的行程安排,系统能无缝从邮件和短信中提取信息,自动构建出一份旅行计划。苹果还表示,用户将可通过Siri实现更多操作,例如选取、裁剪并发送照片,全程无需手动触控。
真正由AI驱动的iPhone前景,也助推苹果股价走高。去年9月,苹果宣称全新iPhone 16“从底层重构”,以支持Apple Intelligence,引发市场热议。然而该机上市时并未内建AI功能——写作工具与通知摘要等基础功能推迟一个半月才上线,自定义“生成表情”(Genmojis)直到12月才正式发布。至于按紧急程度自动整理的系统通知功能,则到今年3月才姗姗来迟。
而备受期待的Siri升级版,据开发团队透露,原计划于2025年4月上线。但多位知情高管表示,发布前数周,费德里吉在使用测试版iOS 18.4时发现,多个宣传中的功能(例如通过语音读取驾驶证号)根本无法使用。发布日期先是推迟至5月,随后再次被无限期延后——而此时,iPhone 16的广告中仍在高调宣传这些尚未实现的功能。部分用户遂以“虚假广告”为由对苹果提起集体诉讼。
新版Siri已确认无法赶在下月的全球开发者大会前推出——距离最初宣布整整过去了一年。用户依旧无法迎来一次彻底升级的语音助手,更谈不上获得一个可媲美ChatGPT的成熟产品。目前,他们只能继续等待苹果逐步兑现对Apple Intelligence功能的承诺。
“这是一场危机。” 一位苹果人工智能团队的资深成员直言不讳。另一位成员则将苹果当前的人工智能努力比作“一艘正在下沉的船”。根据内部数据,苹果的AI技术仍落后于竞争对手多年。
“后发制人”策略还有用吗?
但对苹果来说,错失一项可能改变世界的技术,未必就是生死存亡的问题。该公司一贯的战略,是让竞争对手率先推出新技术、承担初期风险,自己则在时机成熟时,向超过十亿用户推出精致易用、系统整合良好的版本。苹果曾在MP3播放器、智能手机、平板电脑、智能手表乃至耳机产品上,屡次通过这种“后发制人”的策略取得成功。
在今年5月的季度财报电话会议上,当被问及AI相关功能一再跳票的情况时,首席执行官Tim Cook(Tim Cook)提到了已上线的Apple Intelligence功能,以及它对西班牙语、中文等语言的支持扩展。他强调,Siri升级只是需要更长时间来达到苹果的质量标准。“没有其他复杂原因,”库克说,“只是比我们预期的要花更长一点时间而已。”
值得关注的是,尽管苹果在AI领域投入了巨大的资源,成效却相对有限。据多位高管透露,长期以来,苹果的AI专职员工数量远少于竞争对手,用于训练与运行大语言模型所需的GPU采购量也严重不足。今年,苹果高层为此进行了一次重大组织架构调整,将Siri和其他AI相关团队从詹南德里亚手中划出。
虽然有员工将这一困境归咎于个别高管的判断失误,也有人认为问题根源更为深层。苹果之所以能成为全球最具价值的科技公司,靠的是精雕细琢的硬件产品、经过严格筛选的内容生态,以及每年一次的大型系统更新。但人工智能的发展节奏截然不同——更快速、更不可预测,也更具侵入性。
苹果最成功的产品,通常建立在其自研的核心技术基础上,比如iPhone的多点触控,或iPad和最新Mac所用的自研芯片。但在AI领域,这一成功逻辑似乎并未奏效。去年,苹果砍掉了曾耗资百亿美元的自动驾驶汽车项目,部分原因正是公司意识到:现阶段,其人工智能能力无法实现真正的自动驾驶。
如果AI方面的困境持续下去,苹果的多个未来项目可能将受到根本性影响——从增强现实眼镜、机器人,到能识别周围物体的智能手表和耳机。如果苹果在这场关于“人与智能设备如何互动”的新一轮技术变革中败下阵来,其所处的劣势将极其严重。
苹果未能及时推出自有聊天机器人,也令高管层倍感不安。据员工透露,詹南德里亚始终对生成式AI持保守态度。他曾表示,智能体距离真正替代人类还有很长路要走,大多数用户与他一样对其信任有限,因此他并未将打造ChatGPT竞品视为优先事项。他还称,用户最常提出的请求之一就是“关闭它”。这种误判造成方向反复。2025年3月,苹果宣布推迟Siri重大升级,并撤下相关广告。
Siri的底层架构被“一分为二”
问题的根源在于Siri的底层架构已经被“一分为二”:旧代码支撑设置闹钟等传统功能,新代码则支撑调用个人数据的新请求。这种“临时拼接”的方式被视为将新功能尽快推向市场的必要手段,但最终适得其反,导致整合问题频发,从而造成大量延迟。员工们说,单个功能可能看起来运行良好,但当这些代码整合在一起、在Siri中统一测试时,就开始出问题了。
随着项目进展受挫,工程团队的士气持续低迷。一名成员抱怨:“我们甚至不知道发生了什么,也不知道为什么发生,这里缺乏真正的领导力。”
他很难融入苹果核心圈层——这些人一起共事了数十年,把公司当作家族企业来运营。而他也像此前那些“外来高管”一样意识到,在这样的文化中推行变革异常困难。苹果高层由一群强势的人物组成,最终是否被认可,取决于能否将新产品成功推向市场。相比之下,詹南德里亚性格低调,一些人认为他在争取所需资源时不够积极。
也有人认为,詹南德里亚的管理过于松散,对团队要求不够严格。一位高管说:“苹果的其他团队,至少在工程部门,都是拼命赶工、按时交付的节奏,但JG的团队完全不是这样,他们就是执行力不行。”这种“被特殊对待”的印象还延伸到了福利上。在苹果总部,和其他硅谷科技巨头不同,员工通常需要自费在食堂用餐。但在詹南德里亚的团队奋力推进Apple Intelligence时,一些工程师却经常能领到免费用餐券,引发其他团队的不满。一位员工说:“我知道听起来有点小题大做,但苹果一向不给员工提供免费食物。而他们在比别人晚了一年发布产品的情况下,竟然还能吃白食。”
詹南德里亚看似缺乏紧迫感,也许更多是一种理念问题,而非性格问题。他对AI发展的节奏持保守态度,对聊天机器人的价值也持怀疑态度。他在内部曾主张说,OpenAI、Meta、Google等并不构成紧迫威胁,用户真正想要的是一个可以控制设备的界面型助手。尽管出现了延误和挫折,他仍然坚持这个愿景。
当然,失败从来不是单方面造成的,将失误归咎于个人过于简单化。据知情人士透露,詹南德里亚本人曾表示,苹果的市场营销和广告团队才应为过度宣传未完成功能承担更多责任——这些团队分别由格雷格·乔斯维亚克(Greg Joswiak)和托尔·迈伦(Tor Myhren)负责。产品经理有责任向市场部门明确告知产品何时才能真正准备就绪。而软件方面的最终决策人是克雷格·费德里吉(Craig Federighi)。整个公司的产品文化,最终由Tim Cook(Tim Cook)设定方向。
前首席财务官卢卡·梅斯特里(Luca Maestri)对购买GPU的保守态度,事后看起来也不够明智。长期以来,库克主导下的苹果善于利用其市场主导地位和现金储备来塑造全球供应链——从半导体到智能手机屏幕玻璃都不例外。但GPU的需求后来远远超过供应,而苹果对这种新兴技术不完全信任、选择慢慢采购的做法最终自食其果。当亚马逊、微软等竞争对手抢购全球大部分GPU时,苹果只能眼睁睁看着。GPU数量不足,意味着苹果的AI模型训练速度明显滞后。一位AI团队成员说:“当竞争对手早就把GPU全抢走了,你不可能凭空变出更多GPU。”
苹果长期以来对用户隐私的承诺,也限制了它的发展。苹果拥有23.5亿活跃设备,能获取比许多竞争对手更多的数据——包括网页搜索、个人兴趣、通信内容等。但苹果对AI研究人员访问用户数据的限制,比Google、Meta和OpenAI都要严格。这种隐私承诺甚至延伸到非苹果用户的数据:苹果的网页爬虫Applebot会抓取网页数据,用于Siri、Spotlight和其他搜索功能,但它也允许网站轻松拒绝让自己的数据被用于改进Apple Intelligence。许多网站确实选择了屏蔽。
这些因素导致苹果的研究人员不得不更依赖从第三方授权的数据集,或者是所谓的“合成数据”——即为AI训练而特意生成的人工数据。一位熟悉苹果AI和软件开发的人说:“在这个领域有成千上万的‘不准’,你必须突破隐私监管才能做成任何事情。”另一位高管也持类似观点:“你看看X的Grok,他们会越来越强,因为他们能用整个X平台的数据。那苹果要用什么来训练?”
这又是AI技术与苹果传统优势“格格不入”的一个例子。一位在苹果工作多年的高管说:“我们的传统打法是:我们虽然起步晚,但有10亿以上用户,我们会坚持下去,最终赢得胜利。但这一次,这个策略行不通了。”
DeepSeek等新对手不断涌现
在苹果试图再次挽救其AI业务的当下,它还面临着一些独特的外部挑战。据知情人士透露,为满足欧盟即将实施的监管要求,苹果正计划修改其操作系统,首次允许用户将默认语音助手从Siri切换为第三方选项,如果苹果产品无法取得实质性突破,许多用户可能真的会选择更换语音助手。除了OpenAI、Anthropic、Meta和Alphabet的产品,像DeepSeek这样的创新型初创公司也在不断涌现。
据员工透露,如今苹果在苏黎世的AI办公室正在构建全新的软件架构,旨在取代目前问题缠身的Siri混合系统。这套所谓的“单体模型”(monolithic model)将完全基于大语言模型构建,最终目标是让Siri的对话更自然、信息整合更精准。这个秘密项目毫不意外地被命名为“LLM Siri”。
从得克萨斯到西班牙再到爱尔兰,苹果部署了数千名分析师,对Apple Intelligence生成的摘要进行准确性审查,将输出结果与原始资料进行比对,以确定系统出现AI“幻觉”(即事实扭曲)的频率。得益于最近一次软件更新,iPhone也开始参与改进苹果的合成数据:通过将系统生成的假数据与用户邮件中的语言进行比对,设备能够为AI训练提供真实世界的语言参考点——无需将用户的实际数据输入模型。
今年春天,詹南德里亚被剥夺了对产品开发的全部控制权,包括Siri工程团队和未来机器人设备项目。据几位高管透露,此举是因为库克对他在打造新产品方面的执行能力失去了信心。Siri现在由迈克·洛克韦尔(Mike Rockwell)接管,他曾领导团队开发Vision Pro混合现实头显。洛克韦尔直接向费德里吉汇报工作,而后者则接手了更多与苹果AI软件产品路线图相关的职责。
詹南德里亚的产品经理团队已归入费德里吉的管理体系,而洛克韦尔则重组了Siri管理层,将其头显项目的得力干将安插进关键岗位。原Siri主管沃克手下工程师几乎全被调离,被转派至新项目。
詹南德里亚目前仍负责管理AI研究、大语言模型的开发与优化、AI分析师团队以及部分基础设施团队。据内部人士透露,部分苹果高层曾讨论过进一步缩减詹南德里亚的职责,甚至安排他退休(他已年满60岁)。但费德里吉及其他人担心,若他离职,他招募进苹果的顶尖研究员和工程师也可能会随之出走。至少目前,詹南德里亚仍留任,并告诉同事他不希望在苹果AI工作尚未步入正轨前离开。他还坦言,Siri现在归他人负责,他反而松了一口气。
知情人士透露,詹南德里亚去年曾力推将Google的Gemini集成到Siri中,如今它有望在iOS 19中以ChatGPT替代选项的形式亮相。另有消息称,苹果也在与新兴公司Perplexity展开初步洽谈,可能让该公司在Siri中提供ChatGPT替代服务,同时成为Safari中的AI搜索引擎提供商。
在自研聊天机器人的方向上,尽管詹南德里亚过去态度消极,但现在一些高管正推动将Siri真正打造为ChatGPT的竞争对手。为此,苹果正探讨让Siri能够访问开放网络,从多个来源抓取并整合信息。据员工称,苹果内部正在测试的聊天机器人在过去六个月内取得显著进步,部分高管认为其表现已可媲美最近版本的ChatGPT。
将该聊天机器人整合进Siri,有助于为苹果提供“双保险”——以防Google每年高达200亿美元的搜索默认协议最终被美国反垄断监管机构叫停。苹果高层对另一项延迟的AI功能也抱有期待:让Siri能与iPhone应用深度整合,使用户能通过语音更全面地控制设备。这项能力若能实现,也将使年收入同样在200亿美元左右的应用商店得以继续在与聊天机器人共存的生态中保持优势。
据苹果内部人士称,在将于2025年6月的WWDC亮相的下一版iOS系统中,苹果计划专注于改进现有的Apple Intelligence功能,并新增一些能力,例如AI优化的电池管理模式和虚拟健身教练。至于Siri的重大升级——包括一年前承诺的内容——可能不会在大会上重点讨论,距离真正发布仍需数月时间。
消息人士还称,尽管苹果对“LLM Siri”寄予厚望,该公司目前正准备在品牌传播中将“Apple Intelligence”与“Siri”进行切割。这实则默认了语音助手口碑不佳已拖累AI形象。此外,苹果还决定,今后大多数功能将在发布前不提前几个月进行公开预告。
Siri联合创始人基特劳斯对AI版Siri仍持乐观态度。他说:“所有大型模型公司都不懂什么是真正的助手,而苹果自2010年起就在探索这个概念。”他认为,苹果现在只需完成“Siri大脑移植”, 凭借其入口优势和品牌认知,完全可能重夺智能助手霸主地位。
∞ 英伟达“去巨头化”战略曝光:加速培育“AI新势力” 押注数千亿美元市场
5月19日,据《金融时报》报道,英伟达正寻求减少对大型科技公司的依赖,转而通过与各国政府、企业集团以及微软、亚马逊和谷歌等巨头的竞争对手建立新的合作关系,来销售其AI芯片。上周,英伟达宣布与沙特公司Humain达成了一项价值数十亿美元的美国芯片供应协议。
黄仁勋
与此同时,阿联酋宣布计划与美国政府合作,在该国建设世界上最大的数据中心之一。目前,海湾国家正计划建设庞大的AI基础设施。
这些“主权AI”协议是英伟达多元化战略的重要组成部分,旨在大幅拓展客户群,而不只局限于硅谷。主权AI指的是各国独立控制和拥有的AI能力和基础设施。
减少对云巨头依赖
根据英伟达高管、业内人士及分析师的说法,目前市值3.2万亿美元的英伟达正致力于将业务扩展到所谓的“超大规模云服务商”(hyperscalers)之外领域。目前,亚马逊、微软和Google等大型云计算公司为英伟达贡献了超过一半的数据中心收入。
英伟达正在扶持亚马逊AWS、微软Azure以及Google云的潜在竞争对手,其中包括CoreWeave、Nebius、Crusoe和Lambda等“云端新势力”(neocloud)公司,并将它们纳入其不断壮大的“英伟达云合作伙伴”网络。
亚马逊等云巨头占英伟达数据中心收入逾一半
这些公司可以优先获得英伟达内部资源的支持,比如英伟达的专业团队。该团队会为这些公司设计和优化其数据中心提供指导,以便更好地适配英伟达的专用设备。
英伟达还为其云服务合作伙伴提供了更便捷的渠道,以便这些公司能够与那些将芯片集成到服务器及其他数据中心设备中的供应商开展合作,比如通过加快采购流程来实现这一目标。在某些情况下,英伟达还投资了CoreWeave、Nebius等新兴云服务提供商。
今年2月,英伟达宣布CoreWeave成为“首个大规模部署英伟达Blackwell平台的云服务提供商”。Blackwell是英伟达针对AI数据中心推出的最新一代处理器。
近几个月来,英伟达也与包括思科、戴尔以及惠普在内的解决方案供应商达成合作,以帮助其向企业客户销售产品。这些企业客户管理着自己的IT基础设施,而不是将其外包给云服务商。
英伟达CEO黄仁勋(Jensen Huang)在今年3月接受《金融时报》采访时表示:“与一年前相比,我现在对大型云服务提供商之外的商业机遇更加笃定了。”
主权AI协议
上周,黄仁勋与美国总统特朗普一同访问海湾国家,很好地展示了英伟达希望在全球范围内推广的主权AI战略。
分析师估计,英伟达与沙特新成立的AI公司Humain的交易,以及阿联酋AI公司G42在阿布扎比建设超大数据中心的计划,将为英伟达每年带来数以十亿美元计的收入。英伟达高管表示,已经有多个国家政府主动接洽,希望采购其芯片,用于类似的主权AI项目。
黄仁勋在推进英伟达业务多元化方面的态度已变得更加坚定。英伟达在2024年发布Blackwell芯片时,几乎所有大型科技公司都做出了支持性表态。但在今年3月的GTC开发者大会上,当时黄仁勋发布下一代芯片Rubin时,这些盟友的支持不再明显,取而代之的是CoreWeave和思科等公司。
英伟达扶持CoreWeave等新兴云提供商
他当时在发布会上表示,“每一个行业”未来都将拥有自己的“AI工厂”,也就是专门为英伟达强大芯片量身打造的定制化设施,这代表着一个数千亿美元规模的新商机。
然而,一家与英伟达关系密切的新兴云服务公司的高管表示,对英伟达来说,挑战在于大型科技公司是“唯一能够可持续将AI变现的一类企业”。“企业市场或许是下一个前沿领域,但是时机未到。”该高管表示。
截至1月的最近一个财季中,英伟达来自企业数据中心的销售额同比翻了一番,地区性云服务提供商在其销售额中所占比例也有所上升。然而,英伟达在向监管机构提交的文件中提醒投资者,公司仍然依赖“数量有限的客户”。这些客户普遍被认为是云服务和消费者互联网服务经营规模最大的几家科技巨头。
云巨头自研芯片
这些科技巨头也在开发自己的AI芯片,并将其作为英伟达芯片的替代品向客户推广。
例如,头号云服务提供商亚马逊的芯片野心就拓展到了AI训练领域。自ChatGPT引发生成式AI热潮以来的两年半时间里,这一领域一直由英伟达主导。亚马逊是AI创业公司Anthropic的重要投资者,后者正在使用亚马逊AWS的Trainium处理器来训练和运行其下一代模型。
“目前有很多客户正在试用Trainium芯片,利用它开发模型。”AWS计算与网络副总裁戴夫·布朗(Dave Brown)说道。
Together AI是一家专注于开源AI的新兴云服务公司,在今年3月成为英伟达的云服务合作伙伴。“成为云合作伙伴能让你深入接触到英伟达内部资源”。Together AI CEO维普尔·韦德·普拉萨克(Vipul Ved Prakash)表示。
“如果超大规模云服务提供商最终会成为竞争对手,不再是客户,那么英伟达拥有自己的云生态系统将非常重要。我认为这是他们关注的重点之一,打造云生态系统。”普拉萨克称。
另一家新兴云服务提供商的高管表示,英伟达对大型科技公司转用自家定制芯片感到“担忧”。
“我认为,这就是为什么他们正在投资新兴云服务商的原因。他们一半的收入来自大型云服务商,但最终他们基本上会逐步失去这部分业务。”该高管表示。
∞ 对话季宇:大模型非必须在GPU跑 CPU内存带宽已足够
在北京万泉河畔的一幢写字楼内,我初次见到季宇。他的身上有着多个令人瞩目的标签:前华为“天才少年”;昇腾编译器专家;清华大学计算机科学博士;CCF(中国计算机学会)优秀博士学位论文获得者。两年前,季宇从华为离职后,创办了行云集成电路,走上了自研GPU的道路。
而相较于他本人,更令我印象深刻的是他的办公室——各类物品摆放得井然有序,房间内纤尘不染,这样极致的整洁度,在工科背景的创业者中实属少见。
“主要原因是平时都在工位办公,所以办公室才能保持整洁。”正当我发出赞叹之时,季宇将手指向屋外,做出了补充说明。
这种令人猝不及防的“坦率”,在接下来两个小时的对谈中,上演了多次。
比如在谈到公司前不久发布的DeepSeek一体机“褐蚁”时,他甚至直接用“组装机”一词来代指。
对于关注AI行业的人来说,“DeepSeek一体机”的概念一定不会感到陌生,这是一种融合了高性能硬件、模型算法框架和行业应用软件的集成化计算设备,也可以粗暴地理解为“一台本地部署DeepSeek模型的电脑”。
当然,在硬件层面,DeepSeek一体机离不开上游产业链的支持,通常都是“英特尔/国产CPU+英伟达GPU+一定数量的系统盘/内存盘”组合。
这也是季宇将DeepSeek一体机称之为“组装机”的原因。
不过,相较于过去家用的组装机,DeepSeek一体机的“攒机成本”要高的多,比如在一台机器里放置8张H20芯片,仅GPU这项成本就奔着80万去了。因此,通常DeepSeek一体机报价都在百万级区间。
而在季宇看来,现阶段的大模型本地部署,成本上完全可以实现一个“数量级的降低”——从百万级拉低至十万级。
这是如何实现的?季宇给出的回答让人惊掉下巴。
“现在的大模型其实是不一定必须在GPU跑,CPU的内存带宽已经足够,CPU的内存可比GPU的显存便宜多了。”季宇解释道。
这番言论着实有些反常识。
因为在传统认知里,CPU内存的容量大,但带宽低;GPU显存的容量小,但带宽高。又因为大模型涉及大量的数据并行处理,对存储带宽有着很高的要求,因此在大模型训练和推理的过程中,GPU要比CPU更加适合,这是业界公认的事实。
在我抛出疑问后,季宇现场给我算了一笔账:
“最新的服务器级CPU,已经配备了12内存通道,DDR5的内存频率是6400M,再结合双路服务器的形态,顶级的CPU内存带宽可以达到1.2TB/s,已经超过RTX 4090(1TB/s)的水平。”
可即便大模型可以通过“跑在CPU”上的方式,来大幅降低成本,那么对于季宇和他所创立的行云来说,技术护城河是什么呢?业内其他公司同样可以复制这个技术路线。
更重要的是,作为一家主业为GPU研发的公司,却站出来否定GPU在大模型时代的重要性,多少有点“左右互博”的意味。
对此,季宇解释道,“现在我们用的公版CPU,它不是为了大模型而定制的,我们需要的是CPU内存,但CPU上配备的几百个物理核是用不上的,所以我们会重新设计一款芯片,它当然还是高性能计算卡,但与现在英伟达主推的GPU完全不是一个概念。”
值得一提的是,季宇自称是个“资深NV吹”,非常推崇黄仁勋的经营哲学,在他看来,英伟达能够在短短两年内掀翻英特尔的行业地位,背后源于黄仁勋十余年的系统性布局,从最早期的对元宇宙、比特币、生物医药等领域的投资,以一种“润物细无声”的方式,向行业证明GPU未来要比CPU重要。
某种程度上,现在的季宇会想到去做一款DeepSeek一体机,也是受到黄仁勋的启发。
“我们对于这个产品的定位,可能更偏向于PoC(概念验证),我不需要它赚多少钱,但我要向行业证明这个路线是可行的,如果行业里能有大批玩家接受,我们就能通过自研的芯片,为他们提供更低成本的方案。”
这位“资深NV吹”,似乎正在通过黄仁勋的方式,来挑战英伟达的权威。
以下为笔者与季宇交流实录,部分内容略有删减:
虎嗅:你之前在华为是做编译器开发的,为什么创业后会想到跨领域做GPU?
季宇:其实我在学校时研究的方向和入行后的工作,也没什么相关性。我那会学的是体系结构,算是与芯片架构相关。当时选择编译器时因为我发现行业内做了很多不错的芯片,但是最后商业化的时候还是卡在了软件生态这件事情上。我觉得要考虑它上面的编译器软件应该怎么去搭建,才能解决它这个端到端的问题。
后来做GPU是因为在大模型出来后,我意识到这件事情的长期确定性是非常高的。而且本身我们就是愿意去做这种新的事情。因为你做老的事情其实是没有太多的机会的对吧?因为老的事情格局,包括这个行业的秩序,其实都已经逐渐成型了你只有新的行业才有这个探索的可能性,也才适合创业公司。
虎嗅:从创业至今,你做过的最难的一次决定是什么?
季宇:可能出来创业这件事本身最难的,因为我得先想清楚,就是把商业逻辑想清楚,剩下的所有的事情都可以边干边学。
虎嗅:那在GPU行业里,你想清楚的商业逻辑是什么?
季宇:就是今天如果大家按照NV的路线去追赶NV,是不可能挑战成功的,计算机历史上就没有发生过。
我们可以回顾下,当年英特尔是怎么挤掉IBM成为行业龙头的?它不是靠我做了一个性能超强的大型机,而是靠8086这种毫不起眼的小芯片,最后推动了PC产业革命,让大家逐渐抛弃大型机,甚至后来集群也抛弃了大型机。
后面英伟达取代英特尔也是一样的,NV不是在做了一个性能多么强的CPU,而是告诉大家GPU可以用来做什么,它用了十年的时间直接把CPU在计算机行业中的历史给抹掉了。
虎嗅:所以当下行业中会发生这样的“新旧交替”的机会吗?
季宇:我觉得最重要的一个事情是要把大模型从超算竞争变成消费电子竞争,让每个人都用得起你,这个才能真正进入经济循环,进入各行各业。
所以我们大的逻辑是希望我们做的产品,是能够在像今天的消费电子一样的价位,同时又能够把今天超算才能做的这些最高质量的大模型,能用这样的产品能够支撑起来。
虎嗅:我们做的DeepSeek一体机“褐蚁”,为什么能把价格拉低到“十万元”档?
季宇:今天核心的矛盾是在于模型需要的显存跟今天单张卡的显存gap太大了。所以导致大家今天可能为了跑这样一个模型,得凑非常多的GPU,自然而然把整个行业的形态推成了一个8卡16卡的服务器的形态,然后价格都是上百万的。
但现在CPU的内存带宽也完全能够满足大模型的,顶级的服务器级CPU的内存带宽可以达到1.2TB/s,已经超过RTX 4090(1TB/s)的水平,而且它的容量也比GPU大的多,最重要的是跟动辄几百万的超算相比,内存条就相当于是不要钱了。
虎嗅:那行业内其他厂商没有意识到这个问题吗?
季宇:一方面,计算机行业是个惯性很大的行业,当所有人都习惯用GPU去做训练的时候,人们自然不愿意轻易尝试其他方案。
另一方面,可能大家都觉得用内存跑大模型,充其量只能达到Mac Studio那种水平,没法转化为生产力,但我们想通过极致的软件优化来把这么高的带宽水平发挥出来。让大家使用体验真正能达到,跟一个超算的体验没有什么区别。
虎嗅:我看到“褐蚁”的配置基本都是公版的,那这个行业存在硬件门槛吗?
季宇:我希望推动这个应用普惠,就应该用最普通的东西,大家都习以为常的东西,然后把这样的一个事情变成大家都用得起来,我觉得这才是一个关键。而不在于说你们一定要做一个什么门槛,然后让别人都进不来,其实这个不是我们期望的。
虎嗅:我们现在做的DeepSeek一体机,和行云的核心业务(自研GPU),有什么关联性吗?
季宇:我们自研的GPU,可以进一步降低整机的成本。
举个例子,比如现在的CPU和GPU是为了大模型一体机设计的吗?肯定不是,它的价值是建立在别的方面,但有些东西我们是可以扔掉的,但是有些东西我们是可以加强的,可能它非常不重要的一件部件,我们是值得强化的,而它很重要、甚至建立整个价格梯度的东西,我们是可以抛弃的。
虎嗅:能否展开讲讲,哪些是值得强化的?哪些是可以抛弃的?
季宇:比如CPU里的物理核,很多我们都用不上的,我们今天的重点是DDR内存,之是为了把DDR内存用起来,才用了这个CPU,至于它有几百个核跟我没有关系,我们只选了一个32核的,也完全能拉满内存通道带宽,而我们自己设计的芯片就可以把这些多余的物理核去掉,最大程度发挥DDR内存的性能,同时也能让成本大幅降低。
虎嗅:对于应用端来说,他们会很看重这种一次性成本吗?
季宇:如果行业里都是一台上百万的超算,那么行业可能就会卡在那边,大家会一直在想AI到底能做什么事情,云厂商天天想我到底找什么超级应用?这个其实对所有人都是难受的。大家更在乎就是说只要这个价位降到一定的水准之后,这个行业是有可能爆发的。
我可以再举一个例子,我们接下来还会发布一个叫“蚁群”的项目,就是用一堆“褐蚁”去做集群,大概300-400万的预算,我们就能实现500-1000的并发,这是什么概念?一千并发差不多可以支持10万DAU,那意味着很多小的创业团队都可以出来做了,大家一起去挖掘。
∞ 当代大学生做了什么孽 写个论文还得过一遍AI断头台
看到今年的毕业季,估计王勃会气得从地里爬出来,把开发AIGC检测模型的人电脑插头拔了。事情是这样的:今年很多学校为了防止学生用AI写毕业论文,在论文送审时加了一项“AIGC检测”,意思就是检测你文章里多少内容是由AI生成的。
起初,这条公告并没有掀起什么波澜。
但直到最近,大伙的论文都接近尾声了,才发现这玩意儿让大伙的毕业季变成了走马灯。
“我写的内容会被识别成AI,而AI写的反而不会被识别成AI,因此AI检测论文就是在检测谁能把话说的更不像人话。”25届毕业生小蛋如是说,此处内含脏话过滤器。
大伙发在网上的评论,更是一个比一个离谱。
因为自己写得太专业,被检测成AI写的。
有给导师改一遍,AI生成疑似度反而涨了的。
甚至有人把《滕王阁序》塞进去,发现其AI生成疑似度高达惊人的99.2%。
这下合理了,原来咱勃哥开的是AI挂,我就知道没人能即兴写出这么好的文章。
我估计是因为,这文章写得太华丽了,对仗工整,用典密集,信息密度巨大,跟现在的AI文章确实是有点相似之处的。
而且,你猜怎么着?AI生成疑似度的检测,也是由AI进行的。
这活儿,别说碳基生物了,硅基生物都想不到,自己被设计出来,要帮人写文章,改文章,还要帮你猜猜这文章是不是人写的??早知道上辈子烂在服务器里了。
为了和广大毕业生感同身受,咱也掏出了同事珍藏已久的毕业论文,用了大伙的同款工具来试试水。
从结果来看还可以,能勉强能达到毕业要求,看来论文含金(shi)量还是有的。
但从过程来看,就有点搞笑了。
比如,这段就是单纯的名词解释,你让人来写和AI来写都是这么个解释,客观规律不以人类意志为转移。
但它觉得是AI生成的,意思是我还得加点修辞手法吗?
而这段呢,是我对前人工作的总结,看过论文的人都知道,包不可能一个字一个字看的呀。这个部分其实是我把文献丢给AI让AI总结,最后一句一句拼起来的。然而,它并没有检测出来。
所以说,要是同事毕业那年有这指标,还真得开骂,这结果根本就不准啊。
更何况一共四万多字,就要了我84块。如果有人AI生成疑似度死活降不下去的话,我能感受到一种砸锅卖铁的绝望。
而且,这股潮流不光在国内涌动。身处英国的老树同学表示:“基本上所有小组作业都要检测一遍,而且相当不准。身边同学都挺烦这玩意的。”
可以说全世界都笼罩在AI的乌云之下。
而之前,咱也就试了一下论文这种专业性强的东西,我就很好奇啊,它是不是啥也不准。于是我当场手码了一段文字,让AI给我检测下。
看这无敌的逻辑性,就知道AI肯定写不出来。
然后提交上去。
于是,我的努力和汗水化为了一串冰冷的97.77%。
所以,检测AI生成疑似度的原理到底是啥?不能AI说啥就是啥吧?
没想到吧,还真是。
当你把文字输入检测工具时,它会分析这段文字的各种语言特征,包括词汇、句子结构、段落衔接方式等等。
然后,它会将这些特征与AI的写作模式进行对比。
对比分析后,检测工具就会得出一个判断,并不是绝对地告诉你“是”或“不是”,而是一个基于语言特征的概率推断。
但这种玩意其实就没准过。
像OpenAI在ChatGPT刚发布时,就推出了自己的AI文本识别工具AI Text Classifier。
但准确性就很拉了,只有约26%,还把莎士比亚的作品当成AI生成的。
这种文本分类器的原理也很简单,本质上就是一个经过特殊训练的模型,用来捕捉AI与人类文本之间的差异。
当AI写出的文本越来越像人类,分类器也越来越难跟上这种变化,导致它的判断完全不准确,甚至比瞎蒙还不准确。
就算它看出来了,你随便加一点,它也就看不出来了。
再说了,刨去准不准的事儿不提,AI本身就是用来模仿人的写作风格的。把人类的文章拿来训练AI,再把AI拿来检验人类写出的文章像不像AI,本身就有一种“爸爸像儿子”般的荒谬。
意思是AI学会了我的写作风格,我就再也不能用这种风格了吗?那留给人类的时间不多了。
而且,拥有不确定性,就意味着一定会导致误伤。
拿这个作为毕业指标,是不是有点拼运气了?这一整,没有大保底,非酋怕是毕不了业了,肄业原因是脸太黑。
于是,大家只能费尽心思,把自己的文章改得越来越不像人。
但,查完这个AI生成疑似率,才算迈过了第一道坎儿。
写过论文的朋友们都知道,很多大学都有自己的检测系统,却不喜欢给学生试用,为了顺利毕业,学生只能自掏腰包去第三方网站自查。
查重降重这种东西本来就要花钱。而现在又多了一项指标,就意味着要花钱的地方又多了一头。
但有个非常奇特的现象,用不同网站测同一篇文章,AI生成疑似度完全不一样,甚至相同网站不同时间的结果也不一样。
这导致学生被迫成了无头苍蝇——谁主张谁举证,这些网站都在主张你疑似使用AI,但根本没有证据,甚至没有一个统一的标准。所以,到底要怎么改呢?
这时,你再点进这些网站,就会发现从AI写作,AI查重,AI降重,AIGC检测,到降AI生成疑似度,所有需求,一站满足,哪里不会点哪里,结果嘛就是都要掏钱。
甚至有的网站还会故意拉高这些数字,目的嘛,也就可想而知了。
所以,毕业论文,真有必要检测AI生成疑似度吗?我们来看看教育部对毕业设计的要求:
可以看出,本质上,就是检验你大学四年有没有学到真东西,拥有发现问题、解决问题的能力。
所以,理论上只要把活老老实实干完,保证实验严谨,数据真实,就达到要求了。
用AI把我的工作,用学术风格写出来又怎么了?
AI的发明就是用来减轻人类负担的,它们早已成为很多研究者工作中的一部分。
中科院理化研究所的杨晓涛博士就曾表示过,单位和导师都鼓励科学家学习使用AI工具,也会让他们思考如何与科研结合。
而高校却不允许我们的学生使用AI,又怎么能接近真正的研究者呢。
当然,或许真的有这种学生,基本全篇都用AI生成,确实是在蒙混过关。
但,这其实也很好解决。AI用多了,你就会发现,肉眼辨AI基本上就够用了。
太离谱的文章,一眼能看出来是AI一作的,肯定是过不了关的。但一眼看不出来的,说明和人写的已经所差无几了——只要内容详实,又何必在意词句?
与其纠结AI生成疑似度,不如把目光放到内容真实性上来,一篇论文中包含的努力和汗水,才是其中最宝贵的东西。
总之,AI被发明的初衷是服务人类,现在让大家和AI斗智斗勇,属实是有点没事找事了。
处在AIGC元年的大伙,在此刻也终于理解了王勃——时运不齐,命途多舛;三尺微命,一介书生。