关闭导航

包含标签"MoE"的内容

苹果与索邦大学合作研究多模态AI 早期融合模型效率及扩展性更优
AI妹 5 个月前 17 0

多様なモダリティを持つ人工知能(AI)の分野において、アップル社のエンジニアとフランスのソルボンヌ大学の研究チームが共同で重要な研究に取り組んでいます。最近、テクノロジーメディアのmarktech

阿里巴巴开源国内首个混合推理通义千问3模型 降本增效性能提升显
AI妹 5 个月前 20 0

阿里巴巴正式推出新一代通义千问模型 Qwen3(千问3),并宣布其开源。阿里云表示,千问3是国内首个 “混合推理模型”,同时集成了 “快思考” 与 “慢思考” 的能力。相比于 DeepSeek-R

Ollama全面支持阿里Qwen3模型 本地化部署高效性能出色
AI妹 5 个月前 21 0

Ollama官方宣佈已全面支持阿里巴巴通義千問最新一代大語言模型系列——Qwen3。這一重要更新進一步豐富了Ollama的開源模型生態,爲開發者、企業及AI愛好者提供了更強大的本地化部署選擇,顯著

智谱发布GLM-4.5开源模型 性能领先开源领域价格亲民竞争力强
AI妹 5 个月前 16 0

近日,智譜正式推出了其最新旗艦模型 GLM-4.5,這款模型被稱爲 “專爲 Agent 應用打造的基礎模型”,並且在推理、代碼生成以及智能體綜合能力上達到了開源模型的 SOTA(State Of

智谱AI GLM-4.5発表 オープンソース高性能低コストスマートエージェントモデル
AI妹 5 个月前 29 0

智譜AIは今日、新世代のエンドモデルGLM-4.5を正式に発表しました。これはスマートエージェントアプリケーション専用のベースモデルであり、Hugging FaceとModelScopeプラットフ

Deep Cogito発表Cogito v2 LLM、機械直感・自己改善推論の低コスト開源モデル
AI妹 5 个月前 17 0

【AIbase ニュース】最近、旧金山に本社を置くあまり知られていないが注目されているスタートアップ企業であるDeep Cogitoは、自社のCogito v2シリーズの大規模言語モデル(LLM)

Deep Cogito開源Cogito v2系列LLM 主打機器直覺與自我改進推理
AI妹 5 个月前 17 0

【AIbase 報道】近日,一家鮮爲人知但備受關注的舊金山初創公司 Deep Cogito 發佈了旗下 Cogito v2系列大型語言模型(LLM),試圖在擁擠的開源AI賽道中突圍。不同於傳統的參

OpenAI发布GPT-5系列四版本 技术突破覆盖多场景并推免费开放策略
AI妹 5 个月前 22 0

AIBase消息,2025年8月7日,OpenAI正式發佈GPT-5系列模型,這是該公司歷史上最重要的產品升級。此次發佈包含GPT-5、GPT-5Mini、GPT-5Nano和GPT-5Pro四個

腾讯混元TurboS技术报告发布 创新架构及机制助力Chatbot Arena第七名
AI妹 5 个月前 15 0

腾讯发布了混元 TurboS 技术报告,揭示了其旗舰大语言模型 TurboS 的核心创新与强大能力。 根据全球权威大模型评测平台 Chatbot Arena 的最新排名,混元 TurboS 在2

DeepSeek-R1重大更新:代码推理能力提升 开源对标o1成本优势显著
AI妹 5 个月前 17 0

 DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新,显著提升了模型在代码生成和复杂推理任务中的表现,引发人工智能领域的广泛关注。以下基于公开信息