AI妹 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



作者"AI妹"的内容

字节跳动发布UI-TARS-1.5开源多模态智能体高效智能赋能跨平台GUI自动化

字节跳动发布UI-TARS-1.5开源多模态智能体高效智能赋能跨平台GUI自动化

AI妹 4 个月前 24 0

ByteDance has officially released UI-TARS-1.5 on the Hugging Face platform. This is an open-source

dynamic interfaces cross-platform adaptability complex tasks real-time dynamic interface understanding task requirements

查看详情

字节跳动开源UI-TARS-1.5多模态智能体多项基准SOTA且具游戏推理能力

字节跳动开源UI-TARS-1.5多模态智能体多项基准SOTA且具游戏推理能力

AI妹 4 个月前 14 0

字節跳動豆包大模型團隊宣佈開源 UI-TARS-1.5，這是一款基於視覺 - 語言模型構建的開源多模態智能體，能夠在虛擬世界中高效執行各類任務。該模型在7個典型的 GUI 圖形用戶界面評測基準中取

原生智能体模型泛化能力高阶推理能力 UI-TARS-1.5 SOTA表现

查看详情

阿里巴巴正式开源Wan2.1-FLF2V-14B 始終フレーム控制高画质视频生成模型

阿里巴巴正式开源Wan2.1-FLF2V-14B 始終フレーム控制高画质视频生成模型

AI妹 4 个月前 19 0

アリババは最近、最新の始終フレーム生成ビデオモデル「Wan2.1-FLF2V-14B」を正式にオープンソース化しました。5秒間の720p高画質ビデオの生成に対応しています。このモデルは、革新的な始

CLIP特征提取开源模型 RTX4090运行首尾帧生成视频模型 Hugging Face

查看详情

阿里巴巴开源Wan2.1-FLF2V-14B首尾帧控制5秒720p高清视频生成模型赋能多领域创作

阿里巴巴开源Wan2.1-FLF2V-14B首尾帧控制5秒720p高清视频生成模型赋能多领域创作

AI妹 4 个月前 19 0

Alibaba recently announced the open-sourcing of its latest first-last frame video generation model

multilingual environments Chinese prompt generation Cross-Attention Mechanism AI video generation Wan2.1-FLF2V-14B

查看详情

AI发展焦点从模型训练转向任务定义与性能优化更重产品思维促实用

AI发展焦点从模型训练转向任务定义与性能优化更重产品思维促实用

AI妹 4 个月前 16 0

As Artificial Intelligence (AI) technology matures, industry experts suggest a significant shift i

technological application reinforcement learning Yao Shunyu OpenAI Transformer

查看详情

阿里巴巴开源Wan2.1-FLF2V-14B首尾帧生成720p高清视频模型

阿里巴巴开源Wan2.1-FLF2V-14B首尾帧生成720p高清视频模型

AI妹 4 个月前 16 0

阿里巴巴近日宣布，其最新首尾帧生成视频模型Wan2.1-FLF2V-14B正式开源，支持生成5秒720p高清视频。这一模型以其创新的首尾帧控制技术引发广泛关注，为AI视频生成领域带来全新可能性。据

720p视频影视与广告 Wan2.1-FLF2V-14B 消费级GPU 首尾帧控制技术

查看详情

字节跳动开源UI-TARS-1.5 多模态智能体在GUI及游戏任务中获SOTA表现

字节跳动开源UI-TARS-1.5 多模态智能体在GUI及游戏任务中获SOTA表现

AI妹 4 个月前 16 0

字节跳动豆包大模型团队宣布开源 UI-TARS-1.5，这是一款基于视觉 - 语言模型构建的开源多模态智能体，能够在虚拟世界中高效执行各类任务。该模型在7个典型的 GUI 图形用户界面评测基准中取

Minecraft 强化学习开放空间交互能力 MineRL ScreenSpotPro

查看详情

字节跳动开源UI-TARS-1.5 多模态代理在GUI及游戏领域创SOTA佳绩

字节跳动开源UI-TARS-1.5 多模态代理在GUI及游戏领域创SOTA佳绩

AI妹 4 个月前 14 0

バイトダンスのDoubao大規模言語モデルチームは、視覚言語モデルに基づいたオープンソースのマルチモーダルエージェントであるUI-TARS-1.5のオープンソース化を発表しました。これは、仮想世界

视觉语言模型游戏推理强化学习 SOTA性能 Minecraft

查看详情

阿里巴巴通义开源Wan2.1系列首尾帧视频生成模型技术突破及源码开放

阿里巴巴通义开源Wan2.1系列首尾帧视频生成模型技术突破及源码开放

AI妹 4 个月前 18 0

Alibaba's Tongyi announced the open-sourcing of its Wan2.1 series of models, including a powerful

data parallelism (DP) open-sourcing FlashAttention3INT8 GitHub DiT architecture

查看详情

字节跳动开源UI-TARS-1.5多模态智能体跨GUI与游戏任务获SOTA并展长程推理

字节跳动开源UI-TARS-1.5多模态智能体跨GUI与游戏任务获SOTA并展长程推理

AI妹 4 个月前 15 0

ByteDance's Doubao large model team announced the open-source release of UI-TARS-1.5, a multi-moda

视觉感知增强 think-then-act机制视觉语言模型自进化训练范式原生agent模型

查看详情

...

410

...



资讯姬

文章数量12471

总阅读量213.893k

总评论量0

会员数量2

本站由emlog驱动