阿里通义实验室 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"阿里通义实验室"的内容

阿里通义Fun-ASR1.5语音大模型发布全能听力赋能多行业智能化升级

阿里通义Fun-ASR1.5语音大模型发布全能听力赋能多行业智能化升级

AI妹 1 个月前 4 0

在人工智能语音领域，通用性与精准度的平衡一直是行业攻克的难点。 4 月 20 日，阿里通义实验室宣布正式推出语音识别大模型Fun-ASR1.5。这款模型凭借统一的大模型架构，实现了在多语言、多方言

语音识别大模型复杂语境古诗词吟诵阿里通义实验室多方言

查看详情

阿里通义FIPO算法突破推理瓶颈 32B模型反超OpenAI o1-mini

阿里通义FIPO算法突破推理瓶颈 32B模型反超OpenAI o1-mini

AI妹 2 个月前 4 0

据报道，阿里通义实验室的 Qwen Pilot 团队推出了一项名为 FIPO 的全新算法。该算法旨在打破传统强化学习（RL）在处理复杂逻辑时的瓶颈，让模型在推

CoPaw 1.0新版本准确率阿里通义 Future-KL机制 32B模型

查看详情

阿里通义实验室FIPO算法突破大模型推理瓶颈提升复杂推理能力

阿里通义实验室FIPO算法突破大模型推理瓶颈提升复杂推理能力

AI妹 2 个月前 4 0

阿里通义实验室的 Qwen Pilot 团队近日推出了一种全新的算法 FIPO（Future-KL Influenced Policy Optimization），该算法旨在突破当前大模型在推理过

Δlog p Future-KL Influenced Policy Optimization Qwen2.5-32B-Base FIPO算法阿里通义实验室

查看详情

阿里通义实验室发布开源影视级多场景配音模型Fun-CineForge

阿里通义实验室发布开源影视级多场景配音模型Fun-CineForge

AI妹 2 个月前 5 0

阿里通义实验室于3月16日正式发布并开源了影视级多场景配音多模态大模型 Fun-CineForge。该模型旨在解决 AI 配音中长期存在的口型不同步、情感表达缺失以及多角色音色不一致等核心痛点，并

HuggingFace GitHub Fun-CineForge 动漫情感表达缺失

查看详情

阿里通义实验室开源全球首个影视级多模态配音模型Fun-CineForge破机械感难题

阿里通义实验室开源全球首个影视级多模态配音模型Fun-CineForge破机械感难题

AI妹 2 个月前 5 0

在 AIGC 横扫图像与文字领域后，影视行业的最后一个“人工堡垒”——配音，正在被阿里通义实验室攻破。3月16日，通义实验室正式发布并开源了全球首个支持影视级

配音高质量数据集构建方法后期制作 AIGC 开源平台

查看详情

阿里通义千问后训练负责人郁博文正式加入字节跳动Seed团队

阿里通义千问后训练负责人郁博文正式加入字节跳动Seed团队

AI妹 2 个月前 5 0

据报道，继阿里通义实验室大模型技术负责人林俊旸离职后，原Qwen（千问）大模型后训练负责人郁博文近日被曝已正式加入字节跳动，出任Seed团队视觉模型与多模态交互团队后训练负责人。尽管字节跳动方面尚

Seed团队视觉模型大模型人才流动吴永辉 Seedance2.0视频生成模型

查看详情

阿里通义实验室发布Qwen3.5小尺寸模型开源可商用降低AI应用门槛

阿里通义实验室发布Qwen3.5小尺寸模型开源可商用降低AI应用门槛

AI妹 3 个月前 5 0

阿里通义实验室宣布，正式推出其最新一代大语言模型 Qwen3.5的系列小尺寸版本。本次发布的模型涵盖了0.8B、2B、4B 以及9B 四种参数规模，旨在通过极致的性能优化，降低 AI 技术的应用门

端侧设备统一基座 Qwen3.5 LoRA微调开源可商用

查看详情

阿里通义实验室推出两款支持FreeStyle指令的革命性语音生成模型

阿里通义实验室推出两款支持FreeStyle指令的革命性语音生成模型

AI妹 3 个月前 4 0

阿里通义实验室语音团队今日宣布推出两款革命性的语音生成模型:Fun-CosyVoice3.5 与 Fun-AudioGen-VD。这两款模型最大的亮点在于支持“FreeStyle”指令，用户无需复

指令式生成 Fun-AudioGen-VD 环境沉浸感 Fun-CosyVoice3.5 FreeStyle指令

查看详情

阿里通义开源Qwen3-VL双子星开启多模态检索语义对齐新纪元

阿里通义开源Qwen3-VL双子星开启多模态检索语义对齐新纪元

AI妹 5 个月前 15 0

当图文、视频、图表甚至UI界面都能被统一“理解”并精准匹配，多模态信息检索的边界正在被彻底重构。今日，阿里通义实验室正式开源Qwen3-VL-Embedding与Qwen3-VL-Reranker

开源解决方案 Qwen3-VL-Embedding 语义对齐智能检索引擎向量表示

查看详情

阿里通义实验室OmniTalker：精准模仿人物风格免费开放数字人视频体验

阿里通义实验室OmniTalker：精准模仿人物风格免费开放数字人视频体验

AI妹 5 个月前 19 0

阿里通义实验室近日发布了一款名为 “OmniTalker” 的新型数字人视频生成大模型。这一创新模型的核心在于其能够通过上传一段参考视频，实现对视频中人物的表情、声音和说话风格的精准模仿。相较于传

预训练解码器声音模仿双分支DiT架构阿里通义实验室魔搭社区

查看详情

1



资讯姬

文章数量13547

总阅读量240.562k

总评论量0

会员数量2

本站由emlog驱动