MoE - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"MoE"的内容

苹果与索邦大学合作研究多模态AI 早期融合模型效率及扩展性更优

苹果与索邦大学合作研究多模态AI 早期融合模型效率及扩展性更优

AI妹 5 个月前 17 0

多様なモダリティを持つ人工知能（AI）の分野において、アップル社のエンジニアとフランスのソルボンヌ大学の研究チームが共同で重要な研究に取り組んでいます。最近、テクノロジーメディアのmarktech

スパースアーキテクチャ計算効率多様なモダリティAI アップル社拡張性

查看详情

阿里巴巴开源国内首个混合推理通义千问3模型降本增效性能提升显

阿里巴巴开源国内首个混合推理通义千问3模型降本增效性能提升显

AI妹 5 个月前 20 0

阿里巴巴正式推出新一代通义千问模型 Qwen3（千问3），并宣布其开源。阿里云表示，千问3是国内首个 “混合推理模型”，同时集成了 “快思考” 与 “慢思考” 的能力。相比于 DeepSeek-R

阿里巴巴 H20显卡 Qwen3 性能提升混合专家模型

查看详情

Ollama全面支持阿里Qwen3模型本地化部署高效性能出色

Ollama全面支持阿里Qwen3模型本地化部署高效性能出色

AI妹 5 个月前 21 0

Ollama官方宣佈已全面支持阿里巴巴通義千問最新一代大語言模型系列——Qwen3。這一重要更新進一步豐富了Ollama的開源模型生態，爲開發者、企業及AI愛好者提供了更強大的本地化部署選擇，顯著

开源模型生态 Qwen3 MoE 通义千问 Ollama

查看详情

智谱发布GLM-4.5开源模型性能领先开源领域价格亲民竞争力强

智谱发布GLM-4.5开源模型性能领先开源领域价格亲民竞争力强

AI妹 5 个月前 16 0

近日，智譜正式推出了其最新旗艦模型 GLM-4.5，這款模型被稱爲 “專爲 Agent 應用打造的基礎模型”，並且在推理、代碼生成以及智能體綜合能力上達到了開源模型的 SOTA（State Of

Agent应用基础模型参数效率 MoE 智能体综合能力 API价格

查看详情

智谱AI GLM-4.5発表オープンソース高性能低コストスマートエージェントモデル

智谱AI GLM-4.5発表オープンソース高性能低コストスマートエージェントモデル

AI妹 5 个月前 29 0

智譜AIは今日、新世代のエンドモデルGLM-4.5を正式に発表しました。これはスマートエージェントアプリケーション専用のベースモデルであり、Hugging FaceとModelScopeプラットフ

MIT license 全スタック開発 z.ai SciCode 思考モード

查看详情

Deep Cogito発表Cogito v2 LLM、機械直感・自己改善推論の低コスト開源モデル

Deep Cogito発表Cogito v2 LLM、機械直感・自己改善推論の低コスト開源モデル

AI妹 5 个月前 17 0

【AIbase ニュース】最近、旧金山に本社を置くあまり知られていないが注目されているスタートアップ企業であるDeep Cogitoは、自社のCogito v2シリーズの大規模言語モデル（LLM）

FP8量子化密接モデル 70B MoE Deep Cogito

查看详情

Deep Cogito開源Cogito v2系列LLM 主打機器直覺與自我改進推理

Deep Cogito開源Cogito v2系列LLM 主打機器直覺與自我改進推理

AI妹 5 个月前 17 0

【AIbase 報道】近日，一家鮮爲人知但備受關注的舊金山初創公司 Deep Cogito 發佈了旗下 Cogito v2系列大型語言模型（LLM），試圖在擁擠的開源AI賽道中突圍。不同於傳統的參

LLM 开源模型体系自我提升机器直觉自我改进推理能力

查看详情

OpenAI发布GPT-5系列四版本技术突破覆盖多场景并推免费开放策略

OpenAI发布GPT-5系列四版本技术突破覆盖多场景并推免费开放策略

AI妹 5 个月前 22 0

AIBase消息，2025年8月7日，OpenAI正式發佈GPT-5系列模型，這是該公司歷史上最重要的產品升級。此次發佈包含GPT-5、GPT-5Mini、GPT-5Nano和GPT-5Pro四個

GPT-5 多模态理解行业挑战 GPQA 无限制访问

查看详情

腾讯混元TurboS技术报告发布创新架构及机制助力Chatbot Arena第七名

腾讯混元TurboS技术报告发布创新架构及机制助力Chatbot Arena第七名

AI妹 5 个月前 15 0

腾讯发布了混元 TurboS 技术报告，揭示了其旗舰大语言模型 TurboS 的核心创新与强大能力。根据全球权威大模型评测平台 Chatbot Arena 的最新排名，混元 TurboS 在2

Hybrid Transformer-Mamba架构腾讯大语言模型 Chatbot Arena 监督微调技术报告

查看详情

DeepSeek-R1重大更新：代码推理能力提升开源对标o1成本优势显著

DeepSeek-R1重大更新：代码推理能力提升开源对标o1成本优势显著

AI妹 5 个月前 17 0

DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新，显著提升了模型在代码生成和复杂推理任务中的表现，引发人工智能领域的广泛关注。以下基于公开信息

阿里QwQ32B 自我反思 MoE Llama模型开源策略

查看详情

2



资讯姬

文章数量13541

总阅读量235.662k

总评论量0

会员数量2

本站由emlog驱动