强化学习 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"强化学习"的内容

开源模型Skywork-R1V3.0多模态推理能力突出 MMMU得分领先闭源模型

开源模型Skywork-R1V3.0多模态推理能力突出 MMMU得分领先闭源模型

AI妹 5 个月前 15 0

Recently, Kuaizhi Wanyi officially released its brand-new open-source model Skywork-R1V3.0, claimi

数学推理逻辑推理多模态推理跨模态理解 Kuaizhi Wanyi

查看详情

腾讯云Hunyuan-A13B模型API发布 MoE架构高性价比成优势

腾讯云Hunyuan-A13B模型API发布 MoE架构高性价比成优势

AI妹 5 个月前 17 0

このたび、騰訊クラウドの公式ウェブサイトでは、騰訊・ホンイェンA13BモデルのAPIサービスが正式にリリースされ、入力料金は100万トークンあたり0.5元、出力料金は100万トークンあたり2元と設

Scaling Law LLM API服务统合推理模式 MoE模型

查看详情

腾讯混元A13B模型API上线高性价比MoE架构赋能多场景AI应用普及

腾讯混元A13B模型API上线高性价比MoE架构赋能多场景AI应用普及

AI妹 5 个月前 13 0

近日，騰訊雲官網正式上線了騰訊混元A13B模型的API服務，輸入價格定爲每百萬Tokens0.5元，輸出價格則爲每百萬Tokens2元，這一舉措迅速在開發者社區中引發了熱烈反響。作爲業界首個1

开发者友好长文处理混合专家模型开源推理框架性价比

查看详情

ART开源强化学习框架发布助力多场景智能Agent高效开发与应用

ART开源强化学习框架发布助力多场景智能Agent高效开发与应用

AI妹 5 个月前 16 0

人工智能技術的快速發展爲智能Agent的訓練帶來了全新機遇。近日，一款名爲ART（Agent Reinforcement Trainer）的開源強化學習框架正式發佈，引發開發者社區的廣泛關注。該框

邮件自动化多Agent协作 HuggingFace Transformers Llama Kimi

查看详情

ART开源强化学习框架助力AI智能体多场景高效训练与应用

ART开源强化学习框架助力AI智能体多场景高效训练与应用

AI妹 5 个月前 15 0

人工知能技術の急速な発展により、スマートエージェントのトレーニングに新たな機会がもたらされています。最近、ART（Agent Reinforcement Trainer）というオープンソースの強化

Langfuse Kimi Llama W&B GRPO算法

查看详情

开源强化学习框架ART发布，赋能智能Agent多场景高效训练与开发

开源强化学习框架ART发布，赋能智能Agent多场景高效训练与开发

AI妹 5 个月前 15 0

人工智能技术的快速发展为智能Agent的训练带来了全新机遇。近日，一款名为ART（Agent Reinforcement Trainer）的开源强化学习框架正式发布，引发开发者社区的广泛关注。该框

rollout GitHub 模块化设计多模态 Qwen3

查看详情

字节跳动Seed团队推出GR-3 VLA模型，机器人操作能力获突破性进展

字节跳动Seed团队推出GR-3 VLA模型，机器人操作能力获突破性进展

AI妹 5 个月前 15 0

近日，字节跳动Seed团队正式推出全新Vision-Language-Action Model（VLA）模型GR-3，该模型在机器人操作领域展现出突破性能力，不仅能理解包含抽象概念的语言指令，还可

Mixture-of-Transformers GR-3 通用机器人大脑三合一数据训练法 Flow-Matching技术

查看详情

字节跳动Seed团队推出GR-3 VLA模型机器人操作能力实现突破性进展

字节跳动Seed团队推出GR-3 VLA模型机器人操作能力实现突破性进展

AI妹 5 个月前 17 0

近日，字節跳動Seed團隊正式推出全新Vision-Language-Action Model（VLA）模型GR-3，該模型在機器人操作領域展現出突破性能力，不僅能理解包含抽象概念的語言指令，還可

ByteMini 长程餐桌清理 VR人类轨迹数据 DiT Vision-Language-Action Model

查看详情

阿里全新开源AI编程模型Qwen3-Coder：MoE架构性能媲美顶尖且全球开发者可用

阿里全新开源AI编程模型Qwen3-Coder：MoE架构性能媲美顶尖且全球开发者可用

AI妹 5 个月前 55 0

7月23日的清晨，阿里巴巴正式推出了其全新的開源 AI 編程模型 ——Qwen3-Coder。這款模型標誌着千問系列中的一次重大突破，採用了混合專家（MoE）架構，擁有高達480億的參數量，其中可

网页开发开源模型最佳成绩代码能力降低编程入门门槛魔搭社区

查看详情

零一万物发布万智平台2.0及“万仔”智能体李开复谈AI智能体三阶段

零一万物发布万智平台2.0及“万仔”智能体李开复谈AI智能体三阶段

AI妹 5 个月前 33 0

零一萬物在北京舉行了盛大的產品發佈會，推出了其全新版本的萬智企業大模型一站式平臺（萬智平臺）2.0，並正式發佈了代號爲 “萬仔” 的企業級智能體(AI Agent)。這一創新產品以 “超級員工”

L2推理智能体 L1工作流智能体李开复结果校验私有化部署

查看详情

...

14



资讯姬

文章数量13535

总阅读量233.893k

总评论量0

会员数量2

本站由emlog驱动