关闭导航

包含标签"长文处理能力"的内容

腾讯混元开源四款小尺寸模型 为开发者适配端侧低功耗及多芯片平台
AI妹 1 个月前 10 0

騰訊混元團隊宣佈推出四款開源的小尺寸模型,參數分別爲0.5B、1.8B、4B和7B。這些模型專爲消費級顯卡設計,適用於筆記本電腦、手機、智能座艙、智能家居等低功耗場景,並支持垂直領域的低成本微調。

阿里巴巴Qwen3模型更新:非思考模式+256K长文处理 已开源
AI妹 1 个月前 10 0

アリババ・テンションは最近、エース製品のQwen3モデルの最新アップデートを発表し、Qwen3-235B-A22B-Instruct-2507-FP8という新しいバージョンをリリースしました。この