关闭导航

包含标签"混合专家模型"的内容

DeepSeek Engram模块:高效存储静态知识,提升LLM性能与长文本处理能力
AI妹 4 天前 3 0

传统的 Transformer 模型在处理重复性知识时往往显得有些“浪费”,每次遇到相同的模式都需要重新计算,这不仅消耗深度也浪费了计算资源。为了打破这一瓶颈,DeepSeek 的研究团队近日推出

阿里巴巴开源国内首个混合推理通义千问3模型 降本增效性能提升显
AI妹 1 个月前 10 0

阿里巴巴正式推出新一代通义千问模型 Qwen3(千问3),并宣布其开源。阿里云表示,千问3是国内首个 “混合推理模型”,同时集成了 “快思考” 与 “慢思考” 的能力。相比于 DeepSeek-R

通义App与网页版上线阿里千问3开源模型含多款尺寸性能提升
AI妹 1 个月前 9 0

4月29日,通義App與通義網頁版(tongyi.com)全面上線阿里新一代通義千問開源模型Qwen3(簡稱千問3)。用戶可以第一時間在通義App和網頁版中的專屬智能體“千問大模型”,以及主對話頁

Ollama全面支持阿里Qwen3模型 本地化部署高效性能出色
AI妹 1 个月前 12 0

Ollama官方宣佈已全面支持阿里巴巴通義千問最新一代大語言模型系列——Qwen3。這一重要更新進一步豐富了Ollama的開源模型生態,爲開發者、企業及AI愛好者提供了更強大的本地化部署選擇,顯著

阿里Qwen3:通义千问最新开源大模型,混合推理多模态全场景覆盖
AI妹 1 个月前 11 0

Qwen3是什么? 阿里Qwen3是通义千问系列的最新一代开源大语言模型(LLM),于2025年4月29日正式发布。作为全球首个支持“混合推理”的模型,Qwen3包含8款不同规模的模型,涵盖稠密

阿里Qwen3-235B-A22B模型HuggingChat上线 技术突破赋能开源AI生态
AI妹 1 个月前 9 0

由阿里巴巴雲開發的 Qwen3-235B-A22B 模型正式在 HuggingChat 平臺上線。這一開源大型語言模型以其強大的推理能力、靈活的模式切換和高效的性能表現,迅速成爲業界關注的焦點。A

GPT-5预计2025年中发布 技术飞跃参数跃升开启多模智能新时代
AI妹 1 个月前 9 0

隨着人工智能領域的競爭日益加劇,OpenAI的下一代大語言模型GPT-5備受關注。根據最新信息,GPT-5預計將於2025年年中至晚些時候發佈,具體時間可能在8月或更晚。本文綜合網絡信息,整理了關

ICEdit重大更新上线LoRA尺度功能 开源高效引领图像编辑新标杆
AI妹 1 个月前 9 0

备受瞩目的AI图像编辑工具ICEdit迎来重大更新,其Hugging Face演示空间正式上线LoRA尺度修改功能,为全球创作者带来前所未有的图像精细控制体验。这一革命性功能允许用户通过简单调整L

OpenAI发布GPT-5系列模型 四版本覆盖全场景+核心突破+开放定价革新AI体验

(注:经调整,该标题准确涵盖核心事件、产品特点及关键策略,符合30字左右要求)
AI妹 1 个月前 8 0

AIBase消息,2025年8月7日,OpenAI正式发布GPT-5系列模型,这是该公司历史上最重要的产品升级。此次发布包含GPT-5、GPT-5Mini、GPT-5Nano和GPT-5Pro四个

OpenAI发布GPT-5系列四版本 技术突破覆盖多场景并推免费开放策略
AI妹 1 个月前 12 0

AIBase消息,2025年8月7日,OpenAI正式發佈GPT-5系列模型,這是該公司歷史上最重要的產品升級。此次發佈包含GPT-5、GPT-5Mini、GPT-5Nano和GPT-5Pro四個

    1 2