128K上下文 - i-N.资讯站

AI妹 4 个月前 24 0

12月5日，小米集团合伙人、总裁卢伟冰在社交媒体透露:公司AI大模型业务过去四个季度投入环比增速超50%，目前进展“已超出董事会预期”，并宣布将AI与“现实世界深度结合”列为未来十年核心战略。同时

AIGC 卢伟冰千亿参数模型汽车港股涨超8%

AI妹 4 个月前 39 0

DeepSeek 发布 V3.2（标准版）与 V3.2-Speciale(深度思考版)，官方评测显示: - V3.2在128k 上下文场景下与 GPT-5互有胜负 - V3.2-Special

计算复杂度O(n²)转O(n) 128K上下文多数投票显存占用下降40% IMO2025

AI妹 4 个月前 25 0

11月27日，DeepSeek 团队在 Hugging Face 扔出236B 参数巨兽——DeepSeek-Math-V2，采用 MoE 架构，活跃参数仅21B，上下文一口气拉到128K tok

Apache2.0权重 HumanEval90.2% AIME2024 Verifier 1000亿token训练语料



资讯姬

文章数量11999

总阅读量201.33k

总评论量0

会员数量2