强化学习 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"强化学习"的内容

零一万物发布万智企业智能体“万仔” 李开复展望AI智能体三阶段

零一万物发布万智企业智能体“万仔” 李开复展望AI智能体三阶段

AI妹 5 个月前 42 0

零一万物在北京举行了盛大的产品发布会，推出了其全新版本的万智企业大模型一站式平台（万智平台）2.0，并正式发布了代号为 “万仔” 的企业级智能体(AI Agent)。这一创新产品以 “超级员工”

全栈研发技术工作流智能体深度思考多智能体协作 AI智能体三阶段

查看详情

Kimi K2技术报告揭秘：创新训练方法助其登顶全球开源模型竞赛

Kimi K2技术报告揭秘：创新训练方法助其登顶全球开源模型竞赛

AI妹 5 个月前 19 0

Recently, the Kimi team officially released the technical report of Kimi K2, revealing the trainin

Kimi K2 15.5万亿tokens 强化学习监督微调技术报告

查看详情

Kimi K2技术报告发布：万亿参数激活320亿，开源竞赛夺冠创新训练法

Kimi K2技术报告发布：万亿参数激活320亿，开源竞赛夺冠创新训练法

AI妹 5 个月前 21 0

近日，Kimi 团队正式发布了 Kimi K2的技术报告，揭示了这款全新模型背后的训练秘密。Kimi K2的参数总量达到1万亿，而激活参数则高达320亿，凭借其强大的能力，Kimi K2在刚上线一

全球开源模型竞赛桂冠 Agentic Tool Use数据合成pipeline NVIDIA H800 GPU集群 320亿激活参数 1万亿参数

查看详情

夸克健康大模型成国内首个通过12核心医学学科主任医师笔试的模型

夸克健康大模型成国内首个通过12核心医学学科主任医师笔试的模型

AI妹 5 个月前 16 0

July 23rd news: The Quark Health Large Model has successfully passed the written examination of 12

夸克健康大模型医学思维作弊检测机制 12个核心医学学科主任医师笔试 Qwen

查看详情

Qwen-MT机器翻译模型发布多语言可控轻量高效性能卓越

Qwen-MT机器翻译模型发布多语言可控轻量高效性能卓越

AI妹 5 个月前 15 0

Qwen-MT機器翻譯模型正式發佈，Qwen-MT基於強大的Qwen3模型，經過超大規模多語言和翻譯數據的訓練，結合強化學習技術，顯著提升了翻譯結果的準確性和語言流暢度。開發者可以通過Qwen A

人工评估记忆库低成本 92种语言互译轻量级MoE架构

查看详情

Qwen-MT机器翻译模型正式发布多语言高可控低成本性能领先

Qwen-MT机器翻译模型正式发布多语言高可控低成本性能领先

AI妹 5 个月前 18 0

Qwen-MT machine translation model is officially released. Qwen-MT is based on the powerful Qwen3 m

实时应用 Qwen-MT gemini-2.5-pro 术语干预轻量级MoE架构

查看详情

快手正式开源KAT-V1 AutoThink大模型智能调整思考模式性能优异解决过度思考问题

快手正式开源KAT-V1 AutoThink大模型智能调整思考模式性能优异解决过度思考问题

AI妹 5 个月前 18 0

Kuaishou Company officially released and open-sourced the KAT-V1 AutoThink large model. This model

KwaiCoder-AutoThink-preview Qwen2.5-32B 200B版本快手公司 Kwaipilot AI开发助手

查看详情

阿里巴巴WebSailor开源AI智能体框架：复杂任务处理性能卓越的利器

阿里巴巴WebSailor开源AI智能体框架：复杂任务处理性能卓越的利器

AI妹 5 个月前 16 0

隨着互聯網的迅猛發展，信息的爆炸式增長讓人類在信息檢索上面臨諸多挑戰。爲了應對這些挑戰，阿里巴巴的通義實驗室推出了一款創新的開源 AI 智能體框架 ——WebSailor。該框架以其卓越的性能，尤

强化学习 WebSailor 复杂任务处理 BrowseComp-en/zh测试阿里巴巴通义实验室

查看详情

阿里巴巴WebSailor开源AI框架：性能领先，核心技术驱动复杂信息检索任务

阿里巴巴WebSailor开源AI框架：性能领先，核心技术驱动复杂信息检索任务

AI妹 5 个月前 22 0

随着互联网的迅猛发展，信息的爆炸式增长让人类在信息检索上面临诸多挑战。为了应对这些挑战，阿里巴巴的通义实验室推出了一款创新的开源 AI 智能体框架 ——WebSailor。该框架以其卓越的性能，尤

拒绝采样微调(RFT) DUPO算法 WebSailor 信息模糊化技术复杂任务生成

查看详情

蚂蚁发布业内首个100B离散扩散大语言模型LLaDA2.0 性能速度双提升

蚂蚁发布业内首个100B离散扩散大语言模型LLaDA2.0 性能速度双提升

AI妹 5 个月前 30 0

在大语言模型技术发展的新潮流中，蚂蚁技术研究院于近日正式发布了 LLaDA2.0系列，这是业内首个参数规模达到100B 的离散扩散大语言模型（dLLM）。这一创新的模型不仅打破了扩散模型难以规模化

16B（mini） 100B(flash) 并行解码 Hugging Face 蚂蚁技术研究院

查看详情

...

15



资讯姬

文章数量13535

总阅读量233.893k

总评论量0

会员数量2

本站由emlog驱动