关闭导航

包含标签"Hugging Face"的内容

韓国大学生3ヶ月開発AI音声Dia、会話クローン機能と安全懸念
AI妹 4 个月前 15 0

AI音声生成分野では、競争が激化しています。最近、韓国の2人の大学生が共同でDiaというAI音声モデルを開発し、GoogleのNotebookLMに匹敵する機能を持つと主張しています。AI分野での

两名韩国本科生创建AI语音模型Dia 1.6亿参数可生成对话与声音克隆
AI妹 4 个月前 18 0

在 AI 语音生成领域,竞争正变得愈发激烈。近日,来自韩国的两名本科生合伙创建了一款名为 Dia 的 AI 语音模型,声称其功能可与谷歌的 NotebookLM 相媲美。尽管这两位创始人在 AI

字节跳动PHD-Transformer技术突破LLM 2M上下文预训练效率瓶颈
AI妹 4 个月前 15 0

ByteDance has announced the launch of Efficient Pretraining Length Scaling, leveraging a novel Par

字节跳动PHD-Transformer:高效预训练长序列 支持2M上下文提升LLM训练效率
AI妹 4 个月前 14 0

字節跳動宣佈推出高效預訓練長度縮放技術(Efficient Pretraining Length Scaling),通過創新的Parallel Hidden Decoding Transforme

字节跳动Vidi多模态模型:视频时间检索性能超GPT-4o
AI妹 4 个月前 13 0

字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任

Ostris Flex.2-preview:8亿参文生图模型 开源适配ComfyUI控修兼备
AI妹 4 个月前 13 0

Ostris團隊發佈Flex.2-preview,一款基於8億參數的文本到圖像擴散模型,專爲集成到ComfyUI工作流設計。據AIbase瞭解,該模型在基於線條、姿態和深度的控制生成能力上表現出色

Ostris Flex.2-preview:8亿参数ComfyUI模型,强控制与图像修补能力
AI妹 4 个月前 13 0

Ostris团队发布Flex.2-preview,一款基于8亿参数的文本到图像扩散模型,专为集成到ComfyUI工作流设计。据AIbase了解,该模型在基于线条、姿态和深度的控制生成能力上表现出色

Ostris团队发布Flex.2-preview:8亿参数文生图模型 适配ComfyUI且开源
AI妹 4 个月前 13 0

Ostrisチームが、8億パラメーターのテキストツーイメージ拡散モデルであるFlex.2-previewを発表しました。これは、ComfyUIワークフローへの統合を目的として設計されています。AI

昆仑万维开源Skywork-R1V2.0 多模态推理能力显著提升领跑中文场景推AGI
AI妹 4 个月前 19 0

4月24日,昆仑万维宣布正式开源其多模态推理模型Skywork-R1V2.0(以下简称R1V2.0)。这一升级版本在视觉与文本推理能力上均实现了显著提升,特别是在高考理科难题的深度推理和通用任务场

昆仑万维开源Skywork-R1V2.0 多模态推理领跑中文场景刷新开源SOTA
AI妹 4 个月前 14 0

4月24日,崑崙萬維宣佈正式開源其多模態推理模型Skywork-R1V2.0(以下簡稱R1V2.0)。這一升級版本在視覺與文本推理能力上均實現了顯著提升,特別是在高考理科難題的深度推理和通用任務場