MoE模型 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"MoE模型"的内容

蚂蚁数科章鹏：AI智能体落地需提升Token效能大小模型结合成趋势

蚂蚁数科章鹏：AI智能体落地需提升Token效能大小模型结合成趋势

AI妹 20 天前 1 0

以OpenClaw为代表的自主执行智能体爆火，标志着AI应用已从“对话交互”向“任务执行”加速演进。企业在加速拥抱的同时，也面临着算力浪费、安全合规等多重挑战。如何让智能体真正实现规模化、可持续地

蚂蚁数科百灵企业版Ling DT大模型章鹏自主执行智能体 Token效能竞争

查看详情

科大讯飞联合华为国产算力助力星火大模型训练效率大幅提升

科大讯飞联合华为国产算力助力星火大模型训练效率大幅提升

AI妹 3 个月前 13 0

在近日的互动平台上，科大讯飞宣布了一个振奋人心的消息：经过几年的努力和投资，他们在星火大模型的训练和推理效率上取得了显著进展。与直接依赖英伟达显卡的传统方法不同，科大讯飞选择了更具挑战性的全国产算

长思维链强化学习英伟达A100 华为合作星火大模型国产算力方案

查看详情

英伟达GB200 NVL72在MoE测试中性能显著超AMD28倍成本低 AMD稠密模型有竞争力

英伟达GB200 NVL72在MoE测试中性能显著超AMD28倍成本低 AMD稠密模型有竞争力

AI妹 3 个月前 11 0

在最新发布的 SemiAnalysis InferenceMAX 基准测试中，Signal65 分析了 Deepseek-R1 0528 混合专家（MoE）模型的推理表现，结果显示英伟达（NVID

稠密模型英伟达Vera Rubin平台带宽压力成本效益 AMD Helios平台

查看详情

通义千问Qwen3模型发布开源多类型模型支持双思考模式赋能全球开发者

通义千问Qwen3模型发布开源多类型模型支持双思考模式赋能全球开发者

AI妹 3 个月前 22 0

通義千問團隊宣佈推出Qwen3，這是Qwen系列大型語言模型的最新成員。Qwen3系列模型在代碼、數學和通用能力等基準測試中表現出色，與DeepSeek-R1、o1、o3-mini、Grok-3和

MoE模型快速响应能力 Dense模型通义千问团队非思考模式

查看详情

通义千问团队推出Qwen3系列模型开源多版本MoE及Dense模型赋能开发者

通义千问团队推出Qwen3系列模型开源多版本MoE及Dense模型赋能开发者

AI妹 3 个月前 26 0

通义千问团队宣布推出Qwen3，这是Qwen系列大型语言模型的最新成员。Qwen3系列模型在代码、数学和通用能力等基准测试中表现出色，与DeepSeek-R1、o1、o3-mini、Grok-3和

预训练通义千问团队 Apache2.0许可阿里云百炼 Qwen Chat

查看详情

通义灵码Qwen3上线开源混合推理模型多能力助主流IDE编程效率大幅提升

通义灵码Qwen3上线开源混合推理模型多能力助主流IDE编程效率大幅提升

AI妹 3 个月前 13 0

通义灵码团队宣布正式上线Qwen3，并开源了8款「混合推理模型」，这标志着编程智能体的进一步发展。此次开源包括两款MoE模型:Qwen3-235B-A22B（2350多亿总参数、220多亿激活参数

MCP协议通义灵码团队 Visual Studio Qwen3-4B JetBrains IDEs

查看详情

通义灵码Qwen3上线开源混合推理模型支持主流IDE及多语言Agent能力升级

通义灵码Qwen3上线开源混合推理模型支持主流IDE及多语言Agent能力升级

AI妹 3 个月前 20 0

通義靈碼團隊宣佈正式上線Qwen3，並開源了8款「混合推理模型」，這標誌着編程智能體的進一步發展。此次開源包括兩款MoE模型:Qwen3-235B-A22B（2350多億總參數、220多億激活參數

基准测试 119种语言方言 Dense模型 Qwen-Agent框架工具调用能力

查看详情

阿里云通义千问Qwen3发布覆盖全场景性能突破国内首个混合思维模型

阿里云通义千问Qwen3发布覆盖全场景性能突破国内首个混合思维模型

AI妹 3 个月前 13 0

阿里雲旗下通義千問（Qwen）團隊正式發佈Qwen3系列模型，共推出8款不同規格的模型，覆蓋從移動設備到大型服務器的全部應用場景。這是國內首個全面超越DeepSeek R1的開源模型，也是首個配備

SGLang DeepSeek R1 Ollama Llama.cpp 128k上下文窗口

查看详情

阿里云通义千问Qwen3系列发布：覆盖全场景性能领先部署支持丰富

阿里云通义千问Qwen3系列发布：覆盖全场景性能领先部署支持丰富

AI妹 3 个月前 11 0

阿里云旗下通义千问（Qwen）团队正式发布Qwen3系列模型，共推出8款不同规格的模型，覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型，也是首个配备

多语言支持全面超越DeepSeek R1 MCP协议手动控制thinking开关 ollama run qwen3

查看详情

Qwen3系列大型语言模型开源发布性能领先支持119种语言

Qwen3系列大型语言模型开源发布性能领先支持119种语言

AI妹 3 个月前 12 0

在全球人工智能領域，Qwen 系列大型語言模型迎來了新成員 ——Qwen3的發佈。今日，通義宣佈將 Qwen3開源，帶來了令人振奮的技術革新。此次發佈的旗艦模型 Qwen3-235B-A22B

Kaggle ModelScope 通义 36万亿token vLLM

查看详情

1



资讯姬

文章数量11972

总阅读量194.623k

总评论量0

会员数量2

本站由emlog驱动