关闭导航

包含标签"混合专家模型"的内容

阿里Qwen3-235B-A22B模型HuggingChat上线 技术突破赋能开源AI生态
AI妹 5 个月前 16 0

由阿里巴巴雲開發的 Qwen3-235B-A22B 模型正式在 HuggingChat 平臺上線。這一開源大型語言模型以其強大的推理能力、靈活的模式切換和高效的性能表現,迅速成爲業界關注的焦點。A

GPT-5预计2025年中发布 技术飞跃参数跃升开启多模智能新时代
AI妹 5 个月前 22 0

隨着人工智能領域的競爭日益加劇,OpenAI的下一代大語言模型GPT-5備受關注。根據最新信息,GPT-5預計將於2025年年中至晚些時候發佈,具體時間可能在8月或更晚。本文綜合網絡信息,整理了關

ICEdit重大更新上线LoRA尺度功能 开源高效引领图像编辑新标杆
AI妹 5 个月前 16 0

备受瞩目的AI图像编辑工具ICEdit迎来重大更新,其Hugging Face演示空间正式上线LoRA尺度修改功能,为全球创作者带来前所未有的图像精细控制体验。这一革命性功能允许用户通过简单调整L

OpenAI发布GPT-5系列模型 四版本覆盖全场景+核心突破+开放定价革新AI体验

(注:经调整,该标题准确涵盖核心事件、产品特点及关键策略,符合30字左右要求)
AI妹 5 个月前 16 0

AIBase消息,2025年8月7日,OpenAI正式发布GPT-5系列模型,这是该公司历史上最重要的产品升级。此次发布包含GPT-5、GPT-5Mini、GPT-5Nano和GPT-5Pro四个

OpenAI发布GPT-5系列四版本 技术突破覆盖多场景并推免费开放策略
AI妹 5 个月前 22 0

AIBase消息,2025年8月7日,OpenAI正式發佈GPT-5系列模型,這是該公司歷史上最重要的產品升級。此次發佈包含GPT-5、GPT-5Mini、GPT-5Nano和GPT-5Pro四個

DeepSeek-R1重大更新:代码推理能力提升 开源对标o1成本优势显著
AI妹 5 个月前 17 0

 DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新,显著提升了模型在代码生成和复杂推理任务中的表现,引发人工智能领域的广泛关注。以下基于公开信息

腾讯云Hunyuan-A13B模型API发布 MoE架构高性价比成优势
AI妹 5 个月前 17 0

このたび、騰訊クラウドの公式ウェブサイトでは、騰訊・ホンイェンA13BモデルのAPIサービスが正式にリリースされ、入力料金は100万トークンあたり0.5元、出力料金は100万トークンあたり2元と設

腾讯混元A13B模型API上线 高性价比MoE架构赋能多场景AI应用普及
AI妹 5 个月前 13 0

近日,騰訊雲官網正式上線了騰訊混元A13B模型的API服務,輸入價格定爲每百萬Tokens0.5元,輸出價格則爲每百萬Tokens2元,這一舉措迅速在開發者社區中引發了熱烈反響。 作爲業界首個1

Kimi-2上线LiveBench与ChatLLM 性能卓越价格低开源引关注
AI妹 5 个月前 18 0

近日,人工智能领域迎来了一项重要进展——Kimi-2 正式在 LiveBench AI 平台上线,并计划于次日在 ChatLLM 平台推出。这一消息迅速在业内引发广泛关注,Kimi-2以其卓越的性

2025年主流开源大模型核心架构差异与技术趋势深度剖析
AI妹 5 个月前 19 0

近年来,大型语言模型(LLM)的快速发展推动了人工智能技术的边界,特别是在开源领域,模型架构的创新成为业界关注的焦点。AIbase综合近期网络信息,深入剖析了Llama3.2、Qwen3-4B、S