传统的 Transformer 模型在处理重复性知识时往往显得有些“浪费”,每次遇到相同的模式都需要重新计算,这不仅消耗深度也浪费了计算资源。为了打破这一瓶颈,DeepSeek 的研究团队近日推出
4月15日,OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型,涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。该系列在编程能力、指令理解及长文本
4月15日,OpenAI 在其官方博客宣佈正式發佈 GPT-4.1系列模型,涵蓋 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。該系列在編程能力、指令理解及長文本
微信于2025年4月16日正式推出元宝AI好友功能,允许用户将腾讯自研的AI助手元宝添加为微信联系人,直接在聊天窗口进行交互。这一功能的发布不仅增强了微信作为超级应用的粘性,也对其他AI聊天服务和
小米正式在Hugging Face平台发布其首个专为推理(Reasoning)设计的开源大模型——MiMo-7B。据AIbase了解,MiMo-7B通过从预训练到后训练的强化学习(RL)优化,展现
小米正式在Hugging Face平臺發佈其首個專爲推理(Reasoning)設計的開源大模型——MiMo-7B。據AIbase瞭解,MiMo-7B通過從預訓練到後訓練的強化學習(RL)優化,展現
法国独角兽 Mistral AI 于12月2日推出 Mistral3系列模型,包括3B、8B、14B 三个小型密集模型及迄今最强的 Mistral Large3,覆盖从边缘设备到企业级推理的全场景
DeepSeek 发布 V3.2(标准版)与 V3.2-Speciale(深度思考版),官方评测显示: - V3.2在128k 上下文场景下与 GPT-5互有胜负 - V3.2-Special
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论