电脑维修 笔记本维修 手机维修 打印机维修 IT外包
24小时服务电话:0731-84688748  18229718750
地址:长沙市天心区青园街道友谊社区友谊小区A3栋15号

服务区域:湖南省政府方圆5公里内(友谊社区 青园小区 阳光嘉园 天一康园 湘超景园 国际公寓 HOPSCA写字楼 豪布斯卡 天城·泰祥苑 国检园 梦网景园 石人村金石·蓉园安置小区 鑫隆家园 湘诚嘉园 童话里 七星车城 华铁佳苑 巢之恋 鑫远杰座 鑫远华城 满庭芳 宽域 鑫天山水洲城 星语林名园 青园街道进湾子社区 白沙世纪佳园 长沙欧洲城 长沙奥林匹克花园 高升安置小区 湘府名邸 嘉尚君远 富景园 鑫源公寓 岳泰理想城 等等...)

行业新闻 - IT界最新新闻资讯挑选合辑。

更多行业资讯>> RSS镜像 RSS订阅

∞ OpenAI称GPT-5在众多职业领域表现比肩人类

OpenAI 于周四发布一项新基准测试,旨在评估其人工智能模型在各类行业及职业中与人类专业人士的表现差异。这项名为 GDPval 的测试,是该公司为了解自身系统在 “高经济价值工作” 上与人类表现的接近程度所做的初步尝试 —— 而实现这一目标,正是 OpenAI 成立使命中 “研发通用人工智能(AGI)” 的关键组成部分。

OpenAI 表示,研究发现其 GPT-5 模型及 Anthropic 公司的 Claude Opus 4.1 模型 “在工作质量上已接近行业专家水平”。

但这并不意味着 OpenAI 的模型即将立即取代人类岗位。尽管部分首席执行官预测人工智能将在数年内取代人类工作,但 OpenAI 承认,目前 GDPval 测试仅覆盖了人类实际工作中极为有限的一部分任务。不过,这仍是该公司衡量人工智能向 “超越人类” 这一里程碑迈进的最新方式之一。

GDPval 测试基于对美国国内生产总值(GDP)贡献最大的 9 个行业,涵盖医疗健康、金融、制造业、政府服务等领域。该基准测试评估人工智能模型在这些行业的 44 种职业中的表现,职业范围从软件工程师、护士到记者不等。

在 GDPval 测试的首个版本(GDPval-v0)中,OpenAI 邀请资深专业人士对人工智能生成的报告与其他人类专业人士生成的报告进行对比,并选出表现更优的一份。例如,其中一项测试要求投资银行家撰写 “最后一公里配送行业” 的竞争对手分析报告,并将其与人工智能生成的报告对比。随后,OpenAI 会计算该人工智能模型在所有 44 种职业的测试中,其报告 “优于或与人类报告持平” 的胜率平均值。

对于 GPT-5 的增强版本 ——GPT-5-high(配备额外计算能力),OpenAI 表示该模型在 40.6% 的测试场景中,表现被评定为 “优于或与行业专家持平”。

OpenAI 还对 Anthropic 公司的 Claude Opus 4.1 模型进行了测试,结果显示该模型在 49% 的任务中表现 “优于或与行业专家持平”。不过 OpenAI 认为,Claude 能取得如此高的评分,更多是因为其擅长生成视觉效果出色的图表,而非单纯依靠任务表现本身。

值得注意的是,大多数职场人士的工作远不止 “向老板提交研究报告”—— 而这正是 GDPval-v0 测试的全部内容。OpenAI 也承认这一局限性,并表示计划在未来开发更全面的测试,纳入更多行业及交互式工作流程的评估。

尽管如此,OpenAI 仍认为在 GDPval 测试中取得的进展值得关注。

在接受 TechCrunch(科技媒体)采访时,OpenAI 首席经济学家亚伦・查特吉(Aaron Chatterji)博士表示,GDPval 的测试结果表明,从事这些职业的人如今可以借助人工智能模型,将时间投入到更有意义的任务中。

“(因为)模型在这些任务上的表现越来越出色,” 查特吉说,“随着模型能力的不断提升,从事这些工作的人可以越来越多地借助模型分担部分工作,进而去完成潜在价值更高的任务。”

OpenAI 评估部门负责人特贾尔・帕特瓦丹(Tejal Patwardhan)向 TechCrunch 表示,GDPval 测试中展现的进步速度让她备受鼓舞。约 15 个月前发布的 OpenAI GPT-4o 模型,在该测试中 “优于或与人类持平” 的胜率仅为 13.7%;而如今 GPT-5 的胜率几乎是其 3 倍,帕特瓦丹预计这一上升趋势还将持续。

硅谷拥有多种用于衡量人工智能模型进展、判断某一模型是否达到 “最先进水平” 的基准测试,其中最受欢迎的包括 AIME 2025(竞争性数学题测试)和 GPQA Diamond(博士级科学问题测试)。然而,部分人工智能模型在这些基准测试中已接近 “性能饱和”,许多人工智能研究者表示,亟需更完善的测试来评估模型在实际任务中的能力。

随着 OpenAI 不断证明其人工智能模型对多个行业具有实用价值,GDPval 这类基准测试在相关讨论中的重要性可能会日益提升。但要明确宣称其人工智能模型能超越人类,OpenAI 或许还需要推出更全面的测试版本。

∞ 马斯克旗下xAI指控竞争对手OpenAI窃取商业机密

埃隆・马斯克(Elon Musk)旗下的人工智能初创公司 xAI 已在加利福尼亚州联邦法院对竞争对手 OpenAI 提起诉讼,指控其窃取商业机密,以在人工智能技术研发竞赛中获取不正当优势。

周三提交的诉讼文件称,OpenAI 存在一种 “令人深感不安的一贯做法”:通过挖走 xAI 前员工,获取与 xAI 人工智能聊天机器人 Grok 相关的商业机密。

诉讼文件指出:“OpenAI 专门锁定那些掌握 xAI 关键技术和商业计划的人员 —— 包括了解 xAI 源代码及其在数据中心建设方面运营优势的人员 —— 随后通过非法手段诱使这些员工违反对 xAI 的保密义务及其他相关义务。”

周四,两家公司的发言人尚未对针对该诉讼的置评请求作出即时回应。

xAI 表示,其在调查前工程师李雪辰(Xuechen Li,音译)涉嫌窃取商业机密的案件时,发现了上述所谓 “旨在破坏 xAI 运营” 的一系列行为。在另一桩独立诉讼中,xAI 指控李雪辰将机密信息带至 ChatGPT 的母公司(即 OpenAI)。

目前,李雪辰尚未对相关指控作出回应。

此外,xAI 已在联邦法院单独起诉苹果公司(Apple),指控其涉嫌与 OpenAI 合谋打压竞争对手平台。苹果公司目前尚未对该诉讼作出回应。

马斯克还就 OpenAI 转型为营利性公司一事对其提起诉讼,而 OpenAI 则反诉马斯克实施骚扰。

xAI 此次新提起的诉讼,是马斯克与 OpenAI(马斯克为该公司联合创始人)之间广泛法律纠纷的一部分,也凸显出硅谷当下一场高风险的竞争:在这个快速发展的行业中,企业竞相争夺人工智能相关人才,并抢占市场份额。

诉讼文件显示,除李雪辰外,OpenAI 还挖走了 xAI 前工程师吉米・弗雷彻(Jimmy Fraiture)以及一名未具名的高级财务高管,以获取 xAI 的商业机密。弗雷彻并非本案被告,目前暂无法联系到其就此置评。

∞ DeepMind新推出的AI模型能够让机器人利用网络搜索来帮助完成任务

Google DeepMind最新升级的AI模型使机器人能够执行更为复杂的任务,甚至可以通过网络获取所需信息。DeepMind机器人部门负责人Carolina Parada在新闻发布会上表示,公司的新AI模型协同运作,使机器人在实际行动前能够“多步推理”,提前规划行动方案。

此次系统升级采用了全新发布的Gemini Robotics 1.5和Gemini Robotics-ER 1.5这两款模型,对今年三月发布的AI模型进行了重大改进。现在,机器人已不再局限于单一的任务,比如折纸或拉开拉链,而是能够处理更复杂的操作,例如按深浅分拣洗衣物、根据伦敦当前天气打包行李,甚至通过针对当地要求进行网络搜索来协助垃圾、堆肥和回收物分类。

Parada介绍:“以往的模型能够很好地执行一条指令,并且具有广泛适用性。这次升级后,我们实现了从接受单一指令到真正理解和解决实际物理任务的转变。”

具体而言,机器人首先利用升级后的Gemini Robotics-ER 1.5模型理解其所处环境,并像人类一样使用Google搜索工具查找信息。随后,Gemini Robotics-ER 1.5会将搜索结果转化为自然语言指令,再交给Gemini Robotics 1.5模型,让机器人结合视觉和语言理解能力完成每一步操作。

DeepMind软件工程师Kanishka Rao指出,这些AI模型能够帮助不同构造的机器人互相“学习”,哪怕硬件配置存在差异。实验发现,ALOHA2机器人(配备机械臂)完成的任务可以直接在Franka双臂机器人及Apptronik“阿波罗”类人机器人上复现,“这意味着我们能用一个模型控制各类机器人,包括类人型机器人,且某个机器人习得的技能可以迁移到另一台机器人身上。”

Gemini Robotics-ER 1.5现已通过Gemini API在Google AI Studio向开发者开放,但Gemini Robotics 1.5仅对部分合作伙伴开放体验。

这一突破让机器人具备了利用网络为现实问题寻求解决方案的能力,有望推动自动化应用领域再上新台阶。

∞ 微软禁止以色列军方使用部分云和人工智能服务

微软已禁止以色列军方访问部分云服务和人工智能技术,此举是针对这些技术被用于对巴勒斯坦平民的大规模监控。微软副董事长兼总裁布拉德·史密斯在周四的内部备忘录中宣布了这一决定。此前,《卫报》等媒体报道称,以色列政府在微软的Azure上存储了每小时多达一百万次的巴勒斯坦人通话录音和数据。

史密斯表示,微软的内部审查目前还在进行,但已发现证据支持《卫报》的部分报道内容。“因此,我们已通知以色列国防部(IMOD)微软将终止并禁用特定IMOD订阅及其相关服务,包括部分云存储和人工智能技术的使用。我们与IMOD就此决定进行了审查,并采取措施确保遵守微软服务条款,重点确保我们的服务不会被用于对平民的大规模监控。”

此次封禁针对以色列国防部下属某一单位所使用的“部分服务”。史密斯强调,微软不会提供助力大规模监控平民的技术。此次行动并不影响微软与以色列政府签署的其他合同,微软仍将继续保护以色列及中东其他国家的网络安全,包括亚伯拉罕协议框架下的相关合作。

据《卫报》报道,自上月相关报道面世以来,以色列军方已将多达8TB的数据从Azure平台迁出,并计划转移至亚马逊云服务(AWS)。微软尚未就此事回应媒体询问。

微软对以色列军方使用Azure云和人工智能技术的审查,受到了《卫报》媒体报道以及微软现任和前任员工的持续压力。近期,微软因员工在总部参与抗议公司与以色列政府合同而解雇了五名员工。上月的抗议行动包括搭建帐篷、部分员工闯入微软总裁史密斯办公室并进行现场直播等。

发起“No Azure for Apartheid”运动的组织已持续一年开展针对微软的公开行动。该组织曾在微软50周年庆典及开发者大会期间多次打断公司高管发言。

组织者Hossam Nasr在接受采访时表示:“今天的消息是我们运动的重要胜利,也是前所未有的突破。在我们上个月进入史密斯办公室静坐后不到一个月,微软已成为自加沙危机以来首家叫停部分技术向以色列军方供应的美国科技公司。”

尽管抗议者取得了阶段性胜利,Nasr表示微软仅对以色列军方一个单位的部分服务进行了禁用,公司与以色列军方的大多数合同仍然有效。“今天的决定只会激励我们继续组织抗争,直至所有诉求实现,直至巴勒斯坦获得自由。”

∞ 苹果:由于欧盟的严格法规 iOS系统正逐渐变得更像Android

多家科技公司近日纷纷表达了对欧盟《数字市场法案》(DMA)的不满,该法案对厂商的软件服务及平台运营方式施加了严格约束。近期,苹果因未全面支持第三方应用商店而被欧盟处以5亿欧元罚款,而Meta因未为Facebook提供无定向广告的无广告版本被罚2亿欧元。面对新规定,苹果发布了措辞严厉的声明,直指DMA带来的一系列负面影响。

苹果指出,DMA要求其必须将部分功能适配至非苹果产品,这迫使公司投入大量工程资源,导致“实时翻译”“iPhone镜像”“地图访问记录及偏好路线”等功能在欧盟的上线时间被推迟。苹果强调,公司始终希望为欧洲用户同步带来创新服务,但因与其他平台互通技术尚不成熟,欧洲委员会也暂未接受其数据保护建议,相关新功能只能等待成熟后全平台统一推出,否则苹果将在欧盟面临巨额罚款,甚至产品下架。

除了功能推迟外,苹果还批评DMA强制开放App Store给第三方应用商店,认为这将带来体验下降、恶意应用风险扩大以及非Apple Pay渠道引发交易隐患等问题。

更令苹果担忧的是,DMA允许其他企业要求访问苹果用户数据及“核心技术”,且苹果几乎必须满足所有请求。这意味着用户通知内容、Wi-Fi连接历史等私密信息都将面临安全与隐私风险。

苹果表示,DMA本意是促使市场更开放,但实际上却让用户选择减少,厂商服务差异性降低,甚至加剧了不公平竞争。声明中特别强调,App Store的变革让iOS越来越像Android,这正在减少欧盟用户真正的选择。

苹果最后呼吁监管机构重新审视法律条款,也号召用户积极发声,共同保护创新与隐私权。