阿里云旗下通义千问(Qwen)团队正式发布Qwen3系列模型,共推出8款不同规格的模型,覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型,也是首个配备
在全球人工智能領域,Qwen 系列大型語言模型迎來了新成員 ——Qwen3的發佈。今日,通義宣佈將 Qwen3開源,帶來了令人振奮的技術革新。 此次發佈的旗艦模型 Qwen3-235B-A22B
Recently, DeepSeek's affiliated company —— Hangzhou DeepSeek Artificial Intelligence Basic Technol
In the wave of global artificial intelligence development, the speed and efficiency of model infer
在全球人工智能發展的浪潮中,模型推理的速度和效率愈發成爲焦點。近期,華爲的數學團隊在 DeepSeek 開源週期間推出了名爲 FlashComm 的新技術,旨在通過三項創新措施,大幅提升大模型推理
在全球人工智能发展的浪潮中,模型推理的速度和效率愈发成为焦点。近期,华为的数学团队在 DeepSeek 开源周期间推出了名为 FlashComm 的新技术,旨在通过三项创新措施,大幅提升大模型推理
このたび、騰訊クラウドの公式ウェブサイトでは、騰訊・ホンイェンA13BモデルのAPIサービスが正式にリリースされ、入力料金は100万トークンあたり0.5元、出力料金は100万トークンあたり2元と設
このたび、シリコンクラウド(SiliconCloud)プラットフォームは、月の暗面がオープンソースで公開したMoEモデルKimi K2を正式にリリースしました。このモデルのパラメータ総数は1Tであ
近日,硅基流動(SiliconCloud)平臺正式上線了月之暗面開源的 MoE 模型 Kimi K2。這款模型總參數達到1T,激活參數爲32B,在各項基準性能測試中表現不俗,能夠與頂尖的商業模型相
快手公司正式發佈並開源了 KAT-V1自動思考(AutoThink)大模型。這款模型在思考和非思考能力的融合方面表現卓越,能夠根據問題的複雜度自動調整其思考模式。 KAT-V1共有兩個版本,分別