AI音声生成分野では、競争が激化しています。最近、韓国の2人の大学生が共同でDiaというAI音声モデルを開発し、GoogleのNotebookLMに匹敵する機能を持つと主張しています。AI分野での
在 AI 语音生成领域,竞争正变得愈发激烈。近日,来自韩国的两名本科生合伙创建了一款名为 Dia 的 AI 语音模型,声称其功能可与谷歌的 NotebookLM 相媲美。尽管这两位创始人在 AI
ByteDance has announced the launch of Efficient Pretraining Length Scaling, leveraging a novel Par
字節跳動宣佈推出高效預訓練長度縮放技術(Efficient Pretraining Length Scaling),通過創新的Parallel Hidden Decoding Transforme
字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任
Ostris團隊發佈Flex.2-preview,一款基於8億參數的文本到圖像擴散模型,專爲集成到ComfyUI工作流設計。據AIbase瞭解,該模型在基於線條、姿態和深度的控制生成能力上表現出色
Ostris团队发布Flex.2-preview,一款基于8亿参数的文本到图像扩散模型,专为集成到ComfyUI工作流设计。据AIbase了解,该模型在基于线条、姿态和深度的控制生成能力上表现出色
Ostrisチームが、8億パラメーターのテキストツーイメージ拡散モデルであるFlex.2-previewを発表しました。これは、ComfyUIワークフローへの統合を目的として設計されています。AI
4月24日,昆仑万维宣布正式开源其多模态推理模型Skywork-R1V2.0(以下简称R1V2.0)。这一升级版本在视觉与文本推理能力上均实现了显著提升,特别是在高考理科难题的深度推理和通用任务场
4月24日,崑崙萬維宣佈正式開源其多模態推理模型Skywork-R1V2.0(以下簡稱R1V2.0)。這一升級版本在視覺與文本推理能力上均實現了顯著提升,特別是在高考理科難題的深度推理和通用任務場