监督微调 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"监督微调"的内容

Liquid AI发布LFM2.5小型多模态模型家族赋能边缘高效智能应用

Liquid AI发布LFM2.5小型多模态模型家族赋能边缘高效智能应用

AI妹 5 个月前 18 0

Liquid AI 最近推出了 LFM2.5，这是一个新一代的小型基础模型家族，基于 LFM2架构，专注于边缘设备和本地部署。该模型家族包括 LFM2.5-1.2B-Base 和 LFM2.5-1

LFM2架构监督微调知识推理多模态 CPU

查看详情

微软发布BitNet b1.58-2B-4T 低精度高効率20亿参数模型

微软发布BitNet b1.58-2B-4T 低精度高効率20亿参数模型

AI妹 5 个月前 19 0

先日、マイクロソフトの研究チームは、BitNet b1.582B4Tというオープンソースの大規模言語モデルを発表しました。このモデルは20億のパラメータを持ち、独自の1.58ビット低精度アーキテク

大语言模型 DPO 平方ReLU 1.58比特低精度架构 GSM8K

查看详情

微软开源高效BitNet低精度模型 1.58位权重20亿参数内存仅0.4GB

微软开源高效BitNet低精度模型 1.58位权重20亿参数内存仅0.4GB

AI妹 5 个月前 17 0

近日，微软研究团队正式发布了一款名为 BitNet b1.582B4T 的开源大型语言模型。这款模型拥有20亿参数，采用了独特的1.58位低精度架构进行原生训练，与传统的训练后量化方式相比，Bit

三值系统开源大型语言模型 DPO(直接偏好优化) 1.58位低精度架构 subIn归一化

查看详情

d1框架结合强化学习显著提升扩散式大语言模型推理能力与应用潜力

d1框架结合强化学习显著提升扩散式大语言模型推理能力与应用潜力

AI妹 5 个月前 15 0

在人工智能领域，UCLA 和 Meta AI 的研究人员联合推出了一种名为 d1的新框架，该框架通过强化学习技术显著提升了扩散式大语言模型（dLLMs）的推理能力。虽然传统的自回归模型如 GPT

企业应用遮蔽扩散语言模型强化学习 SFT LLaDA-8B-Instruct

查看详情

Moonshot AI开源Kimi-VL多模态模型高效能处理长文档与多任务

Moonshot AI开源Kimi-VL多模态模型高效能处理长文档与多任务

AI妹 5 个月前 18 0

中国初创公司 Moonshot AI 最近推出了一款名为 Kimi-VL 的开源模型。该模型在处理图像、文本和视频方面表现出色，以其高效的性能引起了广泛关注。Kimi-VL 最大的亮点在于其处理长

手写笔记分析视频处理长文档处理监督微调活跃参数

查看详情

CameraBench：赋能AI精准理解镜头运动的创新研究成果

CameraBench：赋能AI精准理解镜头运动的创新研究成果

AI妹 5 个月前 19 0

咱们天天聊 AI 多牛逼，能写诗、能画画、还能跟你唠嗑到天亮。但你有没有想过，当 AI 看视频的时候，它真的“看懂”了吗? 你可能会说:“当然了，都能识别猫猫狗狗、人山人海了!” 打住!识别物

CMU 平移 Pan AI镜头运动理解 Dolly

查看详情

AI镜头运动理解有新招！CameraBench数据集显威力

AI镜头运动理解有新招！CameraBench数据集显威力

AI妹 5 个月前 18 0

咱們天天聊 AI 多牛逼，能寫詩、能畫畫、還能跟你嘮嗑到天亮。但你有沒有想過，當 AI 看視頻的時候，它真的“看懂”了嗎? 你可能會說:“當然了，都能識別貓貓狗狗、人山人海了!” 打住!識別物

Arcing/Orbiting Vlog Dolly 运动分类 VQA

查看详情

微软发布Phi-4系列推理新模型轻量高效适配移动性能可媲美大模型

微软发布Phi-4系列推理新模型轻量高效适配移动性能可媲美大模型

AI妹 5 个月前 17 0

微軟正積極擴展其Phi系列緊湊型語言模型，最新發佈了三款專爲高級推理任務設計的新變體:Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reaso

AIME-2025基准测试教育工具低端硬件 Phi-4-mini-reasoning 编程

查看详情

阿里ZeroSearch：摆脱谷歌依赖，开启AI自我检索学习新范式

阿里ZeroSearch：摆脱谷歌依赖，开启AI自我检索学习新范式

AI妹 5 个月前 16 0

想象一下，如果AI不再依赖谷歌搜索、Bing搜索这些“外包助手”，而是自带“搜索引擎大脑”自我检索、自我学习，结果表现还更优秀——你是不是觉得这听起来像是《黑客帝国》第二集?但阿里真的做到了!

AI开发范式监督微调大语言模型(LLM) 自我学习技术门槛降低

查看详情

Black Forest Labs与Krea推出开源FLUX.1-Krea[dev] 解决AI图像人工痕迹问题

Black Forest Labs与Krea推出开源FLUX.1-Krea[dev] 解决AI图像人工痕迹问题

AI妹 5 个月前 14 0

Black Forest Labs与AI初创公司Krea携手推出开源图像生成模型FLUX.1-Krea ，该模型专注于解决当前AI生成图像中普遍存在的"人工痕迹"问题，通过优化细节处理和美学表现，

Krea Comfy工作流开源图像生成模型 FLUX开源生态系统人类反馈强化学习

查看详情

1



资讯姬

文章数量13527

总阅读量230.286k

总评论量0

会员数量2

本站由emlog驱动