关闭导航

包含标签"强化学习"的内容

理想汽车OTA8.1更新:VLA司机大模型迭代 提升智驾语言交互体验
AI妹 1 个月前 18 0

近日,理想汽车正式推送了 OTA8.1版本更新,此次更新的亮点是其核心的 VLA 司机大模型进行了重要迭代,特别是在 “L” 语言智能方面的提升。此次更新不仅增强了用户的出行安全和舒适感,还使得驾

MIT实例自适应缩放技术提升LLM效率 计算量减半仍保准确率
AI妹 1 个月前 21 0

MIT 的研究团队近日发布了一项创新的计算方法,旨在提高大型语言模型(LLM)的运算效率,同时降低能源消耗。这项名为实例自适应缩放的技术,可以根据提问的复杂程度调整计算资源。研究小组的相关论文于1

Grok4.20斩获Alpha Arena1.5冠军 实时X数据流成杀手锏马斯克预告Grok5
AI妹 1 个月前 20 0

由量化平台 nof1.ai 主办的 Alpha Arena1.5赛季揭晓成绩单:xAI 内部代号 Grok4.20的实验模型以 +12.11% 报率夺冠,将1万美元起始资金在14个交易日内变为12

英伟达港大发布8亿参数Orchestrator模型 协调工具与LLM高效低成本解决问题
AI妹 1 个月前 28 0

近日,英伟达与香港大学的研究人员联合发布了名为 “Orchestrator” 的新模型,该模型拥有8亿个参数,能够协调不同的工具和大型语言模型(LLM)来解决复杂问题。在他们的实验中,Orches

OpenAI推“忏悔”机制 揭示AI潜在违规提升透明度 测试隐藏率仅4.4%
AI妹 1 个月前 20 0

近日,OpenAI 正在测试一种新方法,旨在揭示模型的潜在问题,比如奖励黑客行为或忽视安全规则。这一新机制被称为 “忏悔”,其核心理念是训练模型在单独的报告中承认规则违反,即使原始回答存在欺骗性,

DeepSeek V3.2系列发布 核心DSA升级性能对标闭源且开源可商用
AI妹 1 个月前 19 0

DeepSeek 发布 V3.2(标准版)与 V3.2-Speciale(深度思考版),官方评测显示: - V3.2在128k 上下文场景下与 GPT-5互有胜负 - V3.2-Special

快手发布Keye-VL-671B-A37B旗舰多模态模型 开放代码善看会想强化推理能力
AI妹 1 个月前 23 0

快手近日正式发布其新一代旗舰多模态模型 Keye-VL-671B-A37B,并同步开放代码。这一模型以其 “善看会想” 的特性,在通用视觉理解、视频分析和数学推理等多项核心 benchmark 中

MLLM-SC框架优化6G带宽 提升AR等场景低时延高质量体验
AI妹 1 个月前 20 0

AR 眼镜刚问“对面是什么楼”,后端的 MLLM-SC 框架就在 10 ms 内画出一张“语义注意力热图”:建筑轮廓被标成深红,优先级调到最高,其他背景一律降码率。高维多模态数据不再“平均

DeepSeek-Math-V2开源 系全球首个达IMO金牌水平的混合专家数学模型
AI妹 1 个月前 23 0

DeepSeek今日正式发布 DeepSeek-Math-V2,这款6850亿参数的混合专家(MoE)模型成为全球首个以开源形式达到国际数学奥林匹克(IMO)金牌水平的数学推理大模型。该模型基于

Ilya Sutskever离OpenAI创SSI,宣告AI规模时代终结,转向像人学习的安全超智能之路
AI妹 1 个月前 21 0

在人工智能发展史上,一个标志性时刻悄然到来。知名AI专家Ilya Sutskever近日接受访谈,首次系统阐述了他离开OpenAI后创办SSI(安全超智能实验室)的全新愿景。这场对话直击当下AI行