MoE - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"MoE"的内容

谷歌DeepMind发布Gemma4，E2B架构突破端侧大模型部署瓶颈

谷歌DeepMind发布Gemma4，E2B架构突破端侧大模型部署瓶颈

AI妹 6 天前 1 0

开源大模型生态迎来底层架构的重大突破。谷歌 Google DeepMind 日前正式发布了其有史以来最强大的开放模型 Gemma4。尽管该模型在参数规模上与上一代

Gemini3 Android Studio 多模态 Gemma4 文本扩散

查看详情

腾讯云智能体开发平台宣布DeepSeek V4系列大模型全面大幅降价

腾讯云智能体开发平台宣布DeepSeek V4系列大模型全面大幅降价

AI妹 7 天前 0 0

为了进一步降低企业与开发者的创新门槛，腾讯云智能体开发平台于周二正式宣布了一项重大的价格调整举措。平台将于北京时间 6 月 3 日零时起，对深度求索（DeepSeek）旗下的 V4 系列大模型进行

价格调整 DeepSeek-V4-Flash 算力成本 DeepSeek-V4-Pro 超长上下文处理

查看详情

腾讯云智能体平台大幅下调DeepSeek-V4系列模型调用价格最高降幅达97.5%

腾讯云智能体平台大幅下调DeepSeek-V4系列模型调用价格最高降幅达97.5%

AI妹 7 天前 0 0

腾讯云智能体开发平台宣布，自2026年6月3日零时起大幅下调DeepSeek-V4系列模型的调用价格，全面持平官方售价，其中DeepSeek-V4-Pro的缓存命中价格降幅最高达97.5%。具

100万tokens上下文长度推理输入价格推理输出价格 DeepSeek-V4-Pro 1.6万亿参数量

查看详情

英伟达推出Nemotron3Nano Omni新多模态大模型性能居六大权威榜首助力企业AI部署

英伟达推出Nemotron3Nano Omni新多模态大模型性能居六大权威榜首助力企业AI部署

AI妹 1 个月前 1 0

当地时间4月28日，英伟达正式推出其最新的开放式多模态大模型——Nemotron3Nano Omni。这款模型被定位为“全能选手”，通过高度整合视频、音频、图像和文本的深度推理能力，旨在为开发者提

30B-A3B 混合专家架构开放式多模态大模型 MoE 实时解读

查看详情

MiniMax M2.7开源华为昇腾0Day适配赋能自我进化模型多场景落地

MiniMax M2.7开源华为昇腾0Day适配赋能自我进化模型多场景落地

AI妹 1 个月前 3 0

据报道，在 MiniMax 正式开源其首个自我深度迭代模型 MiniMax M2.7 的当天，华为昇腾 AI 基础软硬

AllGather 算子融合 0Day适配软件工程昇腾Atlas系列

查看详情

美团开源LongCat-Flash-Prover数学证明模型刷新全球SOTA纪录

美团开源LongCat-Flash-Prover数学证明模型刷新全球SOTA纪录

AI妹 2 个月前 3 0

在大模型向垂直专业领域进军的征途中，美团刚刚交出了一份令学术界与工业界瞩目的答卷。 3月21日，美团正式开源了名为 LongCat-Fla

Hugging Face 垂直专业领域逻辑推理 MoE HisPO算法

查看详情

腾讯混元开源全球最强图生图模型精准技术突破助力多场景高效创作

腾讯混元开源全球最强图生图模型精准技术突破助力多场景高效创作

AI妹 4 个月前 22 0

紧随“元宝春节10亿红包”活动的火热开启，腾讯混元团队于1月28日正式宣布，开源其最新的混元图像3.0图生图模型（HunyuanImage3.0-Instruct）。该模型凭借80

800亿总参数 MixGRPO算法原生多模态架构开源图生图模型思维链

查看详情

AI架构起源之争：Mistral与DeepSeek互指借鉴，开源技术反转引全球热议

AI架构起源之争：Mistral与DeepSeek互指借鉴，开源技术反转引全球热议

AI妹 4 个月前 7 0

近日，一场关于 AI 架构起源的争论在社交媒体上闹得沸沸扬扬。被誉为“欧洲版 OpenAI”的MistralCEO Arthur Mensch 在接受访谈时表示，中国强劲的开源模型DeepSeek

Mixtral论文 Arthur Mensch 开源模型 MLA技术开源精神

查看详情

DeepSeek Engram模块：高效存储静态知识，提升LLM性能与长文本处理能力

DeepSeek Engram模块：高效存储静态知识，提升LLM性能与长文本处理能力

AI妹 4 个月前 23 0

传统的 Transformer 模型在处理重复性知识时往往显得有些“浪费”，每次遇到相同的模式都需要重新计算，这不仅消耗深度也浪费了计算资源。为了打破这一瓶颈，DeepSeek 的研究团队近日推出

MMLU NIAH GSM8K 长文本处理验证损失优化

查看详情

MiniMaxのAIモデルが国家超算プラットに統合、オープンソースとチャットボットを提供

MiniMaxのAIモデルが国家超算プラットに統合、オープンソースとチャットボットを提供

AI妹 5 个月前 14 0

中国の人工知能産業は、世界市場への参入を加速させています。AIbaseはソーシャルメディアを通じて、国家インターネットスーパーコンピューティングプラットフォームがMiniMaxの最先端国産AIモデ

マルチモーダルAI MiniMax-VL-01 国家インターネットスーパーコンピューティングプラットフォーム MoE MiniMax

查看详情

1



资讯姬

文章数量13527

总阅读量227.787k

总评论量0

会员数量2

本站由emlog驱动