关闭导航

包含标签"128k上下文窗口"的内容

阿里云通义千问Qwen3发布 覆盖全场景性能突破国内首个混合思维模型
AI妹 1 个月前 9 0

阿里雲旗下通義千問(Qwen)團隊正式發佈Qwen3系列模型,共推出8款不同規格的模型,覆蓋從移動設備到大型服務器的全部應用場景。這是國內首個全面超越DeepSeek R1的開源模型,也是首個配備

阿里云通义千问Qwen3系列发布:覆盖全场景性能领先部署支持丰富
AI妹 1 个月前 10 0

阿里云旗下通义千问(Qwen)团队正式发布Qwen3系列模型,共推出8款不同规格的模型,覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型,也是首个配备

DeepSeek R1-0528发布:128K上下文+强推理 代码写作升级且免费开放
AI妹 1 个月前 8 0

作爲AI領域的先鋒力量,DeepSeek再次以其技術突破引發行業熱議。2025年5月28日,DeepSeek悄然發佈了R1-0528版本,這一更新不僅在性能上實現大幅躍升,還以免費開放的姿態震撼市

DeepSeek发布开源模型R1-0528 性能媲美o3高级版且免费API上线
AI妹 1 个月前 9 0

近日,AI領域迎來重磅消息!中國AI初創公司DeepSeek正式發佈了其開源大語言模型 DeepSeek-R1-0528的最新版本。這一更新不僅在性能上實現了重大突破,還通過免費API的提供進一步

DeepSeek发布开源大模型R1-0528 性能媲美o3高级版且免费API上线
AI妹 1 个月前 8 0

近日,AI领域迎来重磅消息!中国AI初创公司DeepSeek正式发布了其开源大语言模型 DeepSeek-R1-0528的最新版本。这一更新不仅在性能上实现了重大突破,还通过免费API的提供进一步

Hugging Face发布SmolLM3开源模型 30亿参数性能超同类支持多语言长上下文
AI妹 1 个月前 8 0

近日,全球知名的大模型开放平台 Hugging Face 正式发布了其最新开源模型 ——SmolLM3。这款模型拥有30亿参数,尽管参数量相对较小,但其性能显著超过了同类的开源模型,如 Llama

Hugging Face发布SmolLM3 30亿参数模型 性能超同类且支持多语言
AI妹 1 个月前 7 0

近日,全球知名的大模型開放平臺 Hugging Face 正式發佈了其最新開源模型 ——SmolLM3。這款模型擁有30億參數,儘管參數量相對較小,但其性能顯著超過了同類的開源模型,如 Llama