关闭导航

包含标签"强化学习"的内容

快手正式开源KAT-V1 AutoThink大模型 智能调整思考模式性能优异解决过度思考问题
AI妹 4 个月前 16 0

Kuaishou Company officially released and open-sourced the KAT-V1 AutoThink large model. This model

阿里巴巴WebSailor开源AI智能体框架:复杂任务处理性能卓越的利器
AI妹 4 个月前 14 0

隨着互聯網的迅猛發展,信息的爆炸式增長讓人類在信息檢索上面臨諸多挑戰。爲了應對這些挑戰,阿里巴巴的通義實驗室推出了一款創新的開源 AI 智能體框架 ——WebSailor。該框架以其卓越的性能,尤

阿里巴巴WebSailor开源AI框架:性能领先,核心技术驱动复杂信息检索任务
AI妹 4 个月前 21 0

随着互联网的迅猛发展,信息的爆炸式增长让人类在信息检索上面临诸多挑战。为了应对这些挑战,阿里巴巴的通义实验室推出了一款创新的开源 AI 智能体框架 ——WebSailor。该框架以其卓越的性能,尤

蚂蚁发布业内首个100B离散扩散大语言模型LLaDA2.0 性能速度双提升
AI妹 4 个月前 28 0

在大语言模型技术发展的新潮流中,蚂蚁技术研究院于近日正式发布了 LLaDA2.0系列,这是业内首个参数规模达到100B 的离散扩散大语言模型(dLLM)。这一创新的模型不仅打破了扩散模型难以规模化

理想汽车OTA8.1更新:VLA司机大模型迭代 提升智驾语言交互体验
AI妹 4 个月前 24 0

近日,理想汽车正式推送了 OTA8.1版本更新,此次更新的亮点是其核心的 VLA 司机大模型进行了重要迭代,特别是在 “L” 语言智能方面的提升。此次更新不仅增强了用户的出行安全和舒适感,还使得驾

MIT实例自适应缩放技术提升LLM效率 计算量减半仍保准确率
AI妹 4 个月前 24 0

MIT 的研究团队近日发布了一项创新的计算方法,旨在提高大型语言模型(LLM)的运算效率,同时降低能源消耗。这项名为实例自适应缩放的技术,可以根据提问的复杂程度调整计算资源。研究小组的相关论文于1

Grok4.20斩获Alpha Arena1.5冠军 实时X数据流成杀手锏马斯克预告Grok5
AI妹 4 个月前 23 0

由量化平台 nof1.ai 主办的 Alpha Arena1.5赛季揭晓成绩单:xAI 内部代号 Grok4.20的实验模型以 +12.11% 报率夺冠,将1万美元起始资金在14个交易日内变为12

英伟达港大发布8亿参数Orchestrator模型 协调工具与LLM高效低成本解决问题
AI妹 4 个月前 33 0

近日,英伟达与香港大学的研究人员联合发布了名为 “Orchestrator” 的新模型,该模型拥有8亿个参数,能够协调不同的工具和大型语言模型(LLM)来解决复杂问题。在他们的实验中,Orches

OpenAI推“忏悔”机制 揭示AI潜在违规提升透明度 测试隐藏率仅4.4%
AI妹 4 个月前 25 0

近日,OpenAI 正在测试一种新方法,旨在揭示模型的潜在问题,比如奖励黑客行为或忽视安全规则。这一新机制被称为 “忏悔”,其核心理念是训练模型在单独的报告中承认规则违反,即使原始回答存在欺骗性,

DeepSeek V3.2系列发布 核心DSA升级性能对标闭源且开源可商用
AI妹 4 个月前 39 0

DeepSeek 发布 V3.2(标准版)与 V3.2-Speciale(深度思考版),官方评测显示: - V3.2在128k 上下文场景下与 GPT-5互有胜负 - V3.2-Special