传统的 Transformer 模型在处理重复性知识时往往显得有些“浪费”,每次遇到相同的模式都需要重新计算,这不仅消耗深度也浪费了计算资源。为了打破这一瓶颈,DeepSeek 的研究团队近日推出
中国の人工知能産業は、世界市場への参入を加速させています。AIbaseはソーシャルメディアを通じて、国家インターネットスーパーコンピューティングプラットフォームがMiniMaxの最先端国産AIモデ
多様なモダリティを持つ人工知能(AI)の分野において、アップル社のエンジニアとフランスのソルボンヌ大学の研究チームが共同で重要な研究に取り組んでいます。最近、テクノロジーメディアのmarktech
阿里巴巴正式推出新一代通义千问模型 Qwen3(千问3),并宣布其开源。阿里云表示,千问3是国内首个 “混合推理模型”,同时集成了 “快思考” 与 “慢思考” 的能力。相比于 DeepSeek-R
Ollama官方宣佈已全面支持阿里巴巴通義千問最新一代大語言模型系列——Qwen3。這一重要更新進一步豐富了Ollama的開源模型生態,爲開發者、企業及AI愛好者提供了更強大的本地化部署選擇,顯著
近日,智譜正式推出了其最新旗艦模型 GLM-4.5,這款模型被稱爲 “專爲 Agent 應用打造的基礎模型”,並且在推理、代碼生成以及智能體綜合能力上達到了開源模型的 SOTA(State Of
智譜AIは今日、新世代のエンドモデルGLM-4.5を正式に発表しました。これはスマートエージェントアプリケーション専用のベースモデルであり、Hugging FaceとModelScopeプラットフ
【AIbase ニュース】最近、旧金山に本社を置くあまり知られていないが注目されているスタートアップ企業であるDeep Cogitoは、自社のCogito v2シリーズの大規模言語モデル(LLM)
【AIbase 報道】近日,一家鮮爲人知但備受關注的舊金山初創公司 Deep Cogito 發佈了旗下 Cogito v2系列大型語言模型(LLM),試圖在擁擠的開源AI賽道中突圍。不同於傳統的參
AIBase消息,2025年8月7日,OpenAI正式發佈GPT-5系列模型,這是該公司歷史上最重要的產品升級。此次發佈包含GPT-5、GPT-5Mini、GPT-5Nano和GPT-5Pro四個
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论