关闭导航

AI资讯

METR研究发现SWE-bench基准显著高估AI编程能力,人工评审采纳率差距明显
AI妹 1 个月前 2 0

研究机构 METR 最新发布的一项研究显示,被广泛用于评估 AI 编程能力的基准测试 SWE-bench Verified 可能显著高估了 AI 代理在真实软件开发环境中的表现。研究发现,在基准测

Anthropic升级Claude办公插件 新增共享上下文、可复用技能与云平台支持
AI妹 1 个月前 2 0

Anthropic 近日对 Claude for Excel 与 Claude for PowerPoint 插件进行了功能更新,新增共享上下文、可复用工作流程以及更广泛的云平台支持,进一步强化

CNN与反数字仇恨中心调查:多数主流AI聊天机器人安全防线薄弱
AI妹 1 个月前 2 0

一项由 CNN 与非营利机构“反数字仇恨中心”(CCDH)联合开展的调查近日引发广泛关注。研究人员通过模拟具有心理困扰和暴力倾向的“青少年”角色,对包括 ChatGPT、Gemini、Claude

Meta加速自研AI芯片进程 计划2027年底前部署四代以减少外部依赖
AI妹 1 个月前 2 0

为了在成本高昂的全球人工智能竞赛中掌握主动权,社交媒体巨头 Meta 正在加速其底层硬件的去外部依赖进程。据相关报道显示,Meta 计划在 2027 年底前完成四代自研 AI 芯片的部署工作。这一

联想小新平板首发端侧OpenClaw AI 覆盖多款高端产品迈向智能中枢
AI妹 1 个月前 2 0

联想小新于今日正式宣布,将在平板行业首发端侧一键部署 OpenClaw 的 AI 技术,旨在为移动终端带来更具交互性的智能体验。此次适配计划覆盖了联想旗下多款高端平板产品,包括小新 Pro 13、

美团升级星眸大模型 实现外卖后厨食安事前预警与秒级阻断
AI妹 1 个月前 2 0

在外卖行业,后厨的卫生与规范一直是消费者关注的焦点。2026 年 3 月 11 日, 美团 宣布全面升级其自主研发的 “星眸” 垂域多模态大模型及软硬一体化服务体

微信秘密研发自有AI模型 接入小程序生态推全能AI助手构建生活接口
AI妹 1 个月前 2 0

腾讯旗下微信正加速其在人工智能领域的深度布局,据 36 氪报道,微信目前正在秘密研发一套完全独立的自有 AI 模型。该模型现已完成基础能力建设及内部代号命名,预计将于 2026 年正式对外落地。这

Perplexity正式推出Personal Computer云端智能体 本地Mac与云端协同成数字生产力中枢
AI妹 1 个月前 2 0

继“小龙虾”OpenClaw 方案走红后,AI 搜索新锐 Perplexity 紧随其后,正式推出了名为 Personal Computer 的云端智能体服务。这一创新的核心在于利用一台持续运行的

谷歌发布Gemini Embedding2 支持多模态内容统一语义向量映射
AI妹 1 个月前 2 0

谷歌近日发布原生多模态嵌入模型 Gemini Embedding2,该模型可将文本、图像、视频、音频以及 PDF 文档统一映射到同一语义向量空间,旨在简化复杂的 AI 数据处理流程,并提升多模态检

谷歌Gemini整合Chrome侧边栏 扩展至印加新等地区
AI妹 1 个月前 2 0

随着生成式 AI 与系统底层的融合日益加深, 谷歌 正在加速将其最强模型 Gemini 部署到每一位用户的工具栏中。当地时间周三