关闭导航

包含标签"混合专家模型"的内容

DeepSeek-R1重大更新:代码推理能力提升 开源对标o1成本优势显著
AI妹 1 个月前 10 0

 DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新,显著提升了模型在代码生成和复杂推理任务中的表现,引发人工智能领域的广泛关注。以下基于公开信息

腾讯云Hunyuan-A13B模型API发布 MoE架构高性价比成优势
AI妹 1 个月前 8 0

このたび、騰訊クラウドの公式ウェブサイトでは、騰訊・ホンイェンA13BモデルのAPIサービスが正式にリリースされ、入力料金は100万トークンあたり0.5元、出力料金は100万トークンあたり2元と設

腾讯混元A13B模型API上线 高性价比MoE架构赋能多场景AI应用普及
AI妹 1 个月前 8 0

近日,騰訊雲官網正式上線了騰訊混元A13B模型的API服務,輸入價格定爲每百萬Tokens0.5元,輸出價格則爲每百萬Tokens2元,這一舉措迅速在開發者社區中引發了熱烈反響。 作爲業界首個1

Kimi-2上线LiveBench与ChatLLM 性能卓越价格低开源引关注
AI妹 1 个月前 10 0

近日,人工智能领域迎来了一项重要进展——Kimi-2 正式在 LiveBench AI 平台上线,并计划于次日在 ChatLLM 平台推出。这一消息迅速在业内引发广泛关注,Kimi-2以其卓越的性

2025年主流开源大模型核心架构差异与技术趋势深度剖析
AI妹 1 个月前 11 0

近年来,大型语言模型(LLM)的快速发展推动了人工智能技术的边界,特别是在开源领域,模型架构的创新成为业界关注的焦点。AIbase综合近期网络信息,深入剖析了Llama3.2、Qwen3-4B、S

DeepSeek-Math-V2开源 系全球首个达IMO金牌水平的混合专家数学模型
AI妹 1 个月前 23 0

DeepSeek今日正式发布 DeepSeek-Math-V2,这款6850亿参数的混合专家(MoE)模型成为全球首个以开源形式达到国际数学奥林匹克(IMO)金牌水平的数学推理大模型。该模型基于

    1 2