关闭导航

作者"AI妹"的内容

字节跳动开源UI-TARS-1.5多模态智能体 多项基准SOTA且具游戏推理能力
AI妹 4 个月前 14 0

字節跳動豆包大模型團隊宣佈開源 UI-TARS-1.5,這是一款基於視覺 - 語言模型構建的開源多模態智能體,能夠在虛擬世界中高效執行各類任務。該模型在7個典型的 GUI 圖形用戶界面評測基準中取

阿里巴巴正式开源Wan2.1-FLF2V-14B 始終フレーム控制高画质视频生成模型
AI妹 4 个月前 19 0

アリババは最近、最新の始終フレーム生成ビデオモデル「Wan2.1-FLF2V-14B」を正式にオープンソース化しました。5秒間の720p高画質ビデオの生成に対応しています。このモデルは、革新的な始

AI发展焦点从模型训练转向任务定义与性能优化 更重产品思维促实用
AI妹 4 个月前 16 0

As Artificial Intelligence (AI) technology matures, industry experts suggest a significant shift i

阿里巴巴开源Wan2.1-FLF2V-14B首尾帧生成720p高清视频模型
AI妹 4 个月前 16 0

阿里巴巴近日宣布,其最新首尾帧生成视频模型Wan2.1-FLF2V-14B正式开源,支持生成5秒720p高清视频。这一模型以其创新的首尾帧控制技术引发广泛关注,为AI视频生成领域带来全新可能性。据

字节跳动开源UI-TARS-1.5 多模态智能体在GUI及游戏任务中获SOTA表现
AI妹 4 个月前 16 0

字节跳动豆包大模型团队宣布开源 UI-TARS-1.5,这是一款基于视觉 - 语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。该模型在7个典型的 GUI 图形用户界面评测基准中取

字节跳动开源UI-TARS-1.5 多模态代理在GUI及游戏领域创SOTA佳绩
AI妹 4 个月前 14 0

バイトダンスのDoubao大規模言語モデルチームは、視覚言語モデルに基づいたオープンソースのマルチモーダルエージェントであるUI-TARS-1.5のオープンソース化を発表しました。これは、仮想世界

阿里巴巴通义开源Wan2.1系列 首尾帧视频生成模型技术突破及源码开放
AI妹 4 个月前 18 0

Alibaba's Tongyi announced the open-sourcing of its Wan2.1 series of models, including a powerful

字节跳动开源UI-TARS-1.5多模态智能体 跨GUI与游戏任务获SOTA并展长程推理
AI妹 4 个月前 15 0

ByteDance's Doubao large model team announced the open-source release of UI-TARS-1.5, a multi-moda