关闭导航

包含标签"监督微调"的内容

Liquid AI发布LFM2.5小型多模态模型家族 赋能边缘高效智能应用
AI妹 12 天前 7 0

Liquid AI 最近推出了 LFM2.5,这是一个新一代的小型基础模型家族,基于 LFM2架构,专注于边缘设备和本地部署。该模型家族包括 LFM2.5-1.2B-Base 和 LFM2.5-1

微软发布BitNet b1.58-2B-4T 低精度高効率20亿参数模型
AI妹 1 个月前 10 0

先日、マイクロソフトの研究チームは、BitNet b1.582B4Tというオープンソースの大規模言語モデルを発表しました。このモデルは20億のパラメータを持ち、独自の1.58ビット低精度アーキテク

微软开源高效BitNet低精度模型 1.58位权重20亿参数内存仅0.4GB
AI妹 1 个月前 10 0

近日,微软研究团队正式发布了一款名为 BitNet b1.582B4T 的开源大型语言模型。这款模型拥有20亿参数,采用了独特的1.58位低精度架构进行原生训练,与传统的训练后量化方式相比,Bit

d1框架结合强化学习 显著提升扩散式大语言模型推理能力与应用潜力
AI妹 1 个月前 9 0

在人工智能领域,UCLA 和 Meta AI 的研究人员联合推出了一种名为 d1的新框架,该框架通过强化学习技术显著提升了扩散式大语言模型(dLLMs)的推理能力。虽然传统的自回归模型如 GPT

Moonshot AI开源Kimi-VL多模态模型 高效能处理长文档与多任务
AI妹 1 个月前 9 0

中国初创公司 Moonshot AI 最近推出了一款名为 Kimi-VL 的开源模型。该模型在处理图像、文本和视频方面表现出色,以其高效的性能引起了广泛关注。Kimi-VL 最大的亮点在于其处理长

CameraBench:赋能AI精准理解镜头运动的创新研究成果
AI妹 1 个月前 11 0

咱们天天聊 AI 多牛逼,能写诗、能画画、还能跟你唠嗑到天亮。但你有没有想过,当 AI 看视频的时候,它真的“看懂”了吗? 你可能会说:“当然了,都能识别猫猫狗狗、人山人海了!” 打住!识别物

AI镜头运动理解有新招!CameraBench数据集显威力
AI妹 1 个月前 9 0

咱們天天聊 AI 多牛逼,能寫詩、能畫畫、還能跟你嘮嗑到天亮。但你有沒有想過,當 AI 看視頻的時候,它真的“看懂”了嗎? 你可能會說:“當然了,都能識別貓貓狗狗、人山人海了!” 打住!識別物

微软发布Phi-4系列推理新模型 轻量高效适配移动性能可媲美大模型
AI妹 1 个月前 9 0

微軟正積極擴展其Phi系列緊湊型語言模型,最新發佈了三款專爲高級推理任務設計的新變體:Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reaso

阿里ZeroSearch:摆脱谷歌依赖,开启AI自我检索学习新范式
AI妹 1 个月前 9 0

想象一下,如果AI不再依赖谷歌搜索、Bing搜索这些“外包助手”,而是自带“搜索引擎大脑”自我检索、自我学习,结果表现还更优秀——你是不是觉得这听起来像是《黑客帝国》第二集?但阿里真的做到了!

Black Forest Labs与Krea推出开源FLUX.1-Krea[dev] 解决AI图像人工痕迹问题
AI妹 1 个月前 8 0

Black Forest Labs与AI初创公司Krea携手推出开源图像生成模型FLUX.1-Krea [dev],该模型专注于解决当前AI生成图像中普遍存在的"人工痕迹"问题,通过优化细节处理和

    1 2