研究机构 METR 最新发布的一项研究显示,被广泛用于评估 AI 编程能力的基准测试 SWE-bench Verified 可能显著高估了 AI 代理在真实软件开发环境中的表现。研究发现,在基准测
Anthropic 近日对 Claude for Excel 与 Claude for PowerPoint 插件进行了功能更新,新增共享上下文、可复用工作流程以及更广泛的云平台支持,进一步强化
一项由 CNN 与非营利机构“反数字仇恨中心”(CCDH)联合开展的调查近日引发广泛关注。研究人员通过模拟具有心理困扰和暴力倾向的“青少年”角色,对包括 ChatGPT、Gemini、Claude
为了在成本高昂的全球人工智能竞赛中掌握主动权,社交媒体巨头 Meta 正在加速其底层硬件的去外部依赖进程。据相关报道显示,Meta 计划在 2027 年底前完成四代自研 AI 芯片的部署工作。这一
联想小新于今日正式宣布,将在平板行业首发端侧一键部署 OpenClaw 的 AI 技术,旨在为移动终端带来更具交互性的智能体验。此次适配计划覆盖了联想旗下多款高端平板产品,包括小新 Pro 13、
在外卖行业,后厨的卫生与规范一直是消费者关注的焦点。2026 年 3 月 11 日, 美团 宣布全面升级其自主研发的 “星眸” 垂域多模态大模型及软硬一体化服务体
腾讯旗下微信正加速其在人工智能领域的深度布局,据 36 氪报道,微信目前正在秘密研发一套完全独立的自有 AI 模型。该模型现已完成基础能力建设及内部代号命名,预计将于 2026 年正式对外落地。这
继“小龙虾”OpenClaw 方案走红后,AI 搜索新锐 Perplexity 紧随其后,正式推出了名为 Personal Computer 的云端智能体服务。这一创新的核心在于利用一台持续运行的
谷歌近日发布原生多模态嵌入模型 Gemini Embedding2,该模型可将文本、图像、视频、音频以及 PDF 文档统一映射到同一语义向量空间,旨在简化复杂的 AI 数据处理流程,并提升多模态检
随着生成式 AI 与系统底层的融合日益加深, 谷歌 正在加速将其最强模型 Gemini 部署到每一位用户的工具栏中。当地时间周三