MMLU - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"MMLU"的内容

美团LongCat-Flash-Lite总685亿参凭嵌入扩展破瓶颈性能优异智能体代码领跑开源

美团LongCat-Flash-Lite总685亿参凭嵌入扩展破瓶颈性能优异智能体代码领跑开源

AI妹 4 个月前 1070 0

传统 MoE（混合专家）架构通过增加专家数量提升模型能力，却常受困于边际收益递减与高昂的通信开销。今日，美团 LongCat 团队发布了全新模型 LongCat-Flash-Lite，

500-700token/s生成速度 685亿总参数美团LongCat团队嵌入扩展推测解码协同

查看详情

DeepSeek Engram模块：高效存储静态知识，提升LLM性能与长文本处理能力

DeepSeek Engram模块：高效存储静态知识，提升LLM性能与长文本处理能力

AI妹 4 个月前 24 0

传统的 Transformer 模型在处理重复性知识时往往显得有些“浪费”，每次遇到相同的模式都需要重新计算，这不仅消耗深度也浪费了计算资源。为了打破这一瓶颈，DeepSeek 的研究团队近日推出

N-gram嵌入 GSM8K Engram模块 MoE Engram-27B

查看详情

OpenAI发布GPT-4.1系列模型性能超GPT-4o成本降效率提升

OpenAI发布GPT-4.1系列模型性能超GPT-4o成本降效率提升

AI妹 5 个月前 25 0

4月15日，OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型，涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。该系列在编程能力、指令理解及长文本

知识库更新至2024年6月 100万tokens上下文窗口 SWE-bench Verified GPT-4.1nano Gpt-4.1

查看详情

OpenAI发布GPT-4.1系列模型全面超越GPT-4o 高效低成本

OpenAI发布GPT-4.1系列模型全面超越GPT-4o 高效低成本

AI妹 5 个月前 33 0

4月15日，OpenAI 在其官方博客宣佈正式發佈 GPT-4.1系列模型，涵蓋 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。該系列在編程能力、指令理解及長文本

编程能力提升编程效率提升 Gpt-4.1 多模态处理上下文窗口100万tokens

查看详情

微信元宝AI好友上线：功能亮点及对行业的潜在影响解析

微信元宝AI好友上线：功能亮点及对行业的潜在影响解析

AI妹 5 个月前 37 0

微信于2025年4月16日正式推出元宝AI好友功能，允许用户将腾讯自研的AI助手元宝添加为微信联系人，直接在聊天窗口进行交互。这一功能的发布不仅增强了微信作为超级应用的粘性，也对其他AI聊天服务和

公众号深度整合开发者赋能功能深度提升功能扩展营销文案生成

查看详情

小米MiMo-7B开源大模型发布轻量化+强化学习赋能顶级推理能力

小米MiMo-7B开源大模型发布轻量化+强化学习赋能顶级推理能力

AI妹 5 个月前 31 0

小米正式在Hugging Face平台发布其首个专为推理（Reasoning）设计的开源大模型——MiMo-7B。据AIbase了解，MiMo-7B通过从预训练到后训练的强化学习(RL)优化，展现

推理引擎咨询场景 OpenAI o1-mini Qwen2.5-32B Hugging Face Transformers

查看详情

小米MiMo-7B开源推理大模型：轻量架构强化学习性能超32B模型

小米MiMo-7B开源推理大模型：轻量架构强化学习性能超32B模型

AI妹 5 个月前 28 0

小米正式在Hugging Face平臺發佈其首個專爲推理（Reasoning）設計的開源大模型——MiMo-7B。據AIbase瞭解，MiMo-7B通過從預訓練到後訓練的強化學習(RL)優化，展現

HumanEval 视频推理能力智能辅导系统 MiMo-7B-RL-Zero MATH数据集

查看详情

法国Mistral AI推出Mistral3系列模型开源128K上下文性能优价格仅GPT-4o一半

法国Mistral AI推出Mistral3系列模型开源128K上下文性能优价格仅GPT-4o一半

AI妹 6 个月前 37 0

法国独角兽 Mistral AI 于12月2日推出 Mistral3系列模型，包括3B、8B、14B 三个小型密集模型及迄今最强的 Mistral Large3，覆盖从边缘设备到企业级推理的全场景

MT-Bench 3B模型商业免费使用私有部署 Llama3.1

查看详情

DeepSeek V3.2系列发布核心DSA升级性能对标闭源且开源可商用

DeepSeek V3.2系列发布核心DSA升级性能对标闭源且开源可商用

AI妹 6 个月前 42 0

DeepSeek 发布 V3.2（标准版）与 V3.2-Speciale(深度思考版)，官方评测显示: - V3.2在128k 上下文场景下与 GPT-5互有胜负 - V3.2-Special

多数投票 GitHub 128K上下文链式推理长文本DSA内核

查看详情



资讯姬

文章数量13546

总阅读量238.074k

总评论量0

会员数量2

本站由emlog驱动