GenEval - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"GenEval"的内容

苹果最新UniGen1.5多模态AI模型集成图像三大功能测试表现超同类

苹果最新UniGen1.5多模态AI模型集成图像三大功能测试表现超同类

AI妹 5 个月前 18 0

近日，苹果研究团队推出了最新的多模态 AI 模型 UniGen1.5，标志着图像处理技术的一次重要突破。该模型不仅能够理解图像，还能生成和编辑图像，这三大功能被成功整合在一个系统中，显著提升了工作

UniGen1.5 ImgEdit 多模态AI模型苹果研究团队 GenEval

查看详情

通义千问Qwen-Image开源多模态图像生成编辑性能领先业界

通义千问Qwen-Image开源多模态图像生成编辑性能领先业界

AI妹 5 个月前 19 0

通義千問シリーズは、Qwen-Imageという20億パラメータのマルチモーダル・ディフュージョン・トランスフォーマー（MMDiT）画像生成ベースモデルを初めてオープンソース化しました。この革新的な

ImgEdit Technical report 图像生成基础模型 QwenChat Hugging Face

查看详情

Qwen-Image开源模型：文本渲染精准图像编辑强性能卓越

（注：标题含英文部分共约30字符，涵盖核心亮点：开源属性、文本渲染优势、图像编辑能力及优异性能。）

Qwen-Image开源模型：文本渲染精准图像编辑强性能卓越（注：标题含英文部分共约30字符，涵盖核心亮点：开源属性、文本渲染优势、图像编辑能力及优异性能。）

AI妹 5 个月前 18 0

The Qwen-Image, a 2 billion parameter multimodal diffusion transformer (MMDiT) image generation fo

MMDiT 精确图像编辑 GitHub Demo 细节增强

查看详情

通义千问首次开源Qwen-Image多模态模型图像生成编辑性能领先

通义千问首次开源Qwen-Image多模态模型图像生成编辑性能领先

AI妹 5 个月前 20 0

通义千问系列首次开源了一款名为Qwen-Image的20亿参数多模态扩散变换器（MMDiT）图像生成基础模型。这一创新成果不仅在复杂文本渲染和精确图像编辑方面取得了突破性进展，更是在多个公开基准测

精确图像编辑 ModelScope 书店橱窗风格迁移细粒度细节

查看详情

Flow-GRPO：在线RL赋能流動模型，大幅提升图像生成性能

（注：字符数控制在30左右，准确涵盖核心主体Flow-GRPO、关键技术在线RL、应用对象流動模型及效果提升方向图像生成性能，符合要求）

Flow-GRPO：在线RL赋能流動模型，大幅提升图像生成性能（注：字符数控制在30左右，准确涵盖核心主体Flow-GRPO、关键技术在线RL、应用对象流動模型及效果提升方向图像生成性能，符合要求）

AI妹 5 个月前 19 0

論文リンク: https://www.arxiv.org/pdf/2505.05470 プロジェクトリンク: https://github.com/yifan123/flow_grpo 一方で、

報酬詐欺テキストから画像生成 GPT-4o 報酬設計 PickScore

查看详情

腾讯混元大模型全面更新多模态能力升级与开源布局加速推进

腾讯混元大模型全面更新多模态能力升级与开源布局加速推进

AI妹 5 个月前 16 0

5月21日、腾讯はその「混元（ホンユエン）」大規模モデルの全体的なアップデートを発表し、同社の人工知能分野における技術能力が引き続き向上していることを示しました。今回のアップデートでは、旗艦となる

混元T1 腾讯混元大模型大语言模型王迪混元画像2.0

查看详情

快手上海交大ICML発表Orthus多模态生成理解模型性能超SDXL等既存模型

快手上海交大ICML発表Orthus多模态生成理解模型性能超SDXL等既存模型

AI妹 5 个月前 25 0

先ほど終了した国際機械学習会議（ICML）で、快手と上海交通大学は注目を集めるマルチモーダル生成理解モデル「Orthus」を発表しました。このモデルは、自己回帰型Transformerアーキテクチ

SDXL 计算效率图像文本转换端到端扩散建模 Show-o

查看详情

阿里通义Qwen-Image-i2L：单图生成LoRA，降低AI个性化创作门槛

阿里通义Qwen-Image-i2L：单图生成LoRA，降低AI个性化创作门槛

AI妹 6 个月前 24 0

在AI图像生成领域，一项革命性技术新鲜出炉:Qwen-Image-i2L。这款由阿里通义实验室推出的开源工具，能将任意单张图片瞬间转化为可微调的LoRA（Low-Rank Adaptation）模

单图风格迁移 AI图像生成扩散模型 MMDiT架构开源工具

查看详情



资讯姬

文章数量13541

总阅读量236.282k

总评论量0

会员数量2

本站由emlog驱动