HuggingFace - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"HuggingFace"的内容

LongCat-Next原生多模态大模型发布开源打破模态阻隔推动产业落地

LongCat-Next原生多模态大模型发布开源打破模态阻隔推动产业落地

AI妹 5 天前 0 0

全球人工智能界正迎来一场关于“AI母语”的技术革新。针对当前大模型普遍存在的“以语言为中心、外挂视觉或语音模块”的拼凑式异构架构，大模型研发团队于近日正式发布并开源了全新原生多模态大模型 Long

RVQ 语义对齐编码器 DiNA架构 dNaViT LongCat-Flash-Lite MoE

查看详情

中国首个昇腾平台三值大模型BitCPM-CANN发布并开源

中国首个昇腾平台三值大模型BitCPM-CANN发布并开源

AI妹 15 天前 0 0

近日，面壁智能联合清华大学及 OpenBMB 开源社区，正式发布并开源了中国首个基于华为昇腾平台训练的三值（1.58-bit）大模型 ——BitCPM-CANN。该模型在低比特大模型训练领域取得了

并行策略清华大学显存红利面壁智能昇腾低比特训练基础设施

查看详情

美团龙猫团队开源LongCat-Video-Avatar1.5商用级数字人视频生成模型

美团龙猫团队开源LongCat-Video-Avatar1.5商用级数字人视频生成模型

AI妹 18 天前 0 0

美团龙猫大模型团队今日宣布，正式开源商用级数字人视频生成模型——LongCat-Video-Avatar1.5。该版本实现了从开源 SOTA（最高水平）向商业级实际应用的全面跨越，在唇形同步、物

多人互动首帧手部检测机制数字人视频生成模型 ModelScope LongCat-Video-Avatar1.5

查看详情

腾讯混元开源极致压缩轻量离线翻译模型支持33种语言断网实时翻译

腾讯混元开源极致压缩轻量离线翻译模型支持33种语言断网实时翻译

AI妹 1 个月前 2 0

4月29日，腾讯混元团队宣布正式开源其极限量化压缩版的翻译模型——Hy-MT1.5-1.8B-1.25bit。这款模型最大的亮点在于，它将支持33种语言的翻译能力精准压缩到了440MB左右，这意味

量化压缩技术少数民族语言 HuggingFace 方言腾讯内部业务场景

查看详情

五一临近腾讯混元发布极致量化翻译大模型手机本地运行且开源免费

五一临近腾讯混元发布极致量化翻译大模型手机本地运行且开源免费

AI妹 1 个月前 3 0

随着五一黄金周临近，腾讯混元团队近日发布了其专业翻译大模型的极致量化版本，为计划出国旅游的用户提供了硬核的语言解决方案。这款名为Hy-MT1.5-1.8B-1.25bit的模型仅有440MB，支持

5种方言后台取词 HuggingFace 隐私安全 1.25-bit方案

查看详情

小米开源Xiaomi-Robotics-0真机后训练流程加速机器人精细操作应用落地

小米开源Xiaomi-Robotics-0真机后训练流程加速机器人精细操作应用落地

AI妹 1 个月前 1 0

小米在机器人技术领域再次抛出“重磅炸弹”。继今年2月发布并开源其VLA大模型Xiaomi-Robotics-0后，小米于今日正式公布了该模型的真机后训练（Post-training）全流程。这一举

HuggingFace 开发者生态小米开源实时反馈与动作修正

查看详情

美团LongCat团队开源LongCat-AudioDiT 端到端语音克隆性能创新高

美团LongCat团队开源LongCat-AudioDiT 端到端语音克隆性能创新高

AI妹 2 个月前 3 0

音频生成技术正迎来从级联架构向端到端生成的范式转移。针对传统 TTS 系统因“梅尔频谱”中间表征带来的信息损耗与误差累积，美团 LongCat 团队于今日正式发布并开源了 LongCa

自适应投影引导（APG） UMT5文本编码器 GitHub HuggingFace Wav-VAE

查看详情

阿里通义实验室发布开源影视级多场景配音模型Fun-CineForge

阿里通义实验室发布开源影视级多场景配音模型Fun-CineForge

AI妹 2 个月前 4 0

阿里通义实验室于3月16日正式发布并开源了影视级多场景配音多模态大模型 Fun-CineForge。该模型旨在解决 AI 配音中长期存在的口型不同步、情感表达缺失以及多角色音色不一致等核心痛点，并

字错率1% 情感表达缺失口型不同步阿里通义实验室 Fun-CineForge

查看详情

通义实验室开源Fun-CineForge影视级多场景配音多模态大模型

通义实验室开源Fun-CineForge影视级多场景配音多模态大模型

AI妹 2 个月前 4 0

传统的 AI 配音在面对影视、动画等高标准场景时，常因难以匹配复杂的情绪爆发和精准口型而遭遇瓶颈。针对这一痛点，通义实验室正式发布并开源了首个影视级多场景配音多模态大模型——

时间对齐多人对话配音口型同步 HuggingFace Fun-CineForge

查看详情

腾讯清华联合研发SongGeneration2，AI音乐三大突破真开源低门槛助力全民创作

腾讯清华联合研发SongGeneration2，AI音乐三大突破真开源低门槛助力全民创作

AI妹 3 个月前 4 0

AI 音乐赛道在2026年初迎来了又一次震撼余震。3月9日，由腾讯与清华大学人机语音交互实验室联合研发的音乐基础模型 SongGenerat

22GB显存 Suno v5 多轨编曲清华大学人机语音交互实验室 MiniMax2.5

查看详情

1

...



资讯姬

文章数量13527

总阅读量227.016k

总评论量0

会员数量2

本站由emlog驱动