关闭导航

包含标签" llama.cpp"的内容

Unsloth Qwen3动态量化2.0:智能层选低显存高效本地运行技术突破
AI妹 1 个月前 11 0

Unsloth宣佈推出Qwen3的動態量化2.0版本(Dynamic2.0Quants),爲顯存受限的用戶提供了高效的本地運行解決方案。據AIbase瞭解,新版本通過改進的量化技術,在保持高準確度

OpenAI首次回归开源领域 推出gpt-oss系列权重语言模型
AI妹 1 个月前 11 0

OpenAI宣布推出两款开源权重语言模型——gpt-oss-120b和gpt-oss-20b,这是自2019年GPT-2发布以来,OpenAI首次回归开源领域。此举不仅标志着OpenAI战略的重大

OpenAI回归开源推出gpt-oss系列 战略转向赋能开发者加速AI创新
AI妹 1 个月前 9 0

OpenAI宣佈推出兩款開源權重語言模型——gpt-oss-120b和gpt-oss-20b,這是自2019年GPT-2發佈以來,OpenAI首次迴歸開源領域。此舉不僅標誌着OpenAI戰略的重大

OpenAI时隔六年回归开源 发布gpt-oss-120b/20b模型赋能全球AI开发者
AI妹 1 个月前 10 0

OpenAI announced the release of two open-source weight language models—gpt-oss-120b and gpt-oss-20

Llamafile 0.9.3支持Qwen3 单文件跨平台助力本地AI高效便携部署
AI妹 1 个月前 9 0

Recently, the open-source project Llamafile under Mozilla released version 0.9.3, officially annou

Llamafile 0.9.3发布 正式支持Qwen3单文件跨平台轻量化运行
AI妹 1 个月前 9 0

近日、Mozillaが提供するオープンソースプロジェクト「Llamafile」がバージョン0.9.3をリリースし、正式にQwen3シリーズの大規模言語モデルをサポートしました。このアップデートでは

モア・スレッドMUSAアーキテクチャ、llama.cppと互換達成~MTT GPUでAI推論効率化
AI妹 1 个月前 9 0

世界的な人工知能技術が急速に発展する中、モア・スレッド(Moore Threads)は新たな突破を遂げました! 自社開発の汎用並列計算アーキテクチャである MUSA(Meta-computing