GitHub - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"GitHub"的内容

DeepSeek V3.2系列发布核心DSA升级性能对标闭源且开源可商用

DeepSeek V3.2系列发布核心DSA升级性能对标闭源且开源可商用

AI妹 4 个月前 39 0

DeepSeek 发布 V3.2（标准版）与 V3.2-Speciale(深度思考版)，官方评测显示: - V3.2在128k 上下文场景下与 GPT-5互有胜负 - V3.2-Special

多数投票代码任务计算复杂度O(n²)转O(n) 强化学习 DeepSeek V3.2

查看详情

vLLM发布全模态推理框架vLLM-Omni 解耦架构提效开源

vLLM发布全模态推理框架vLLM-Omni 解耦架构提效开源

AI妹 4 个月前 25 0

vLLM团队发布首个“全模态”推理框架vLLM-Omni，将文本、图像、音频、视频的统一生成从概念验证变成可落地代码。新框架已上线GitHub与ReadTheDocs，开发者可立即pip安装并调用

ViT 文本异构模型数据流 vLLM-Omni 语音Codec模型

查看详情

vLLM团队推出vLLM-Omni全模态推理框架支持多模态处理且开源

vLLM团队推出vLLM-Omni全模态推理框架支持多模态处理且开源

AI妹 4 个月前 26 0

在近日举行的技术发布会上，vLLM 团队正式推出了 vLLM-Omni，这是一个面向全模态（omni-modality）模型的推理框架。这一新框架旨在简化多模态推理的过程，并为新一代能够理解和生成

LLM 全模态推理框架模态生成器模态编码器 vLLM-Omni

查看详情

英伟达NeurIPS发布首个自动驾驶VLAM模型及工具全力推进物理人工智能

英伟达NeurIPS发布首个自动驾驶VLAM模型及工具全力推进物理人工智能

AI妹 4 个月前 29 0

芯片巨头英伟达周一在加州圣地亚哥举行的 NeurIPS 人工智能大会上宣布了新的基础设施和人工智能模型，此举旨在加速构建物理人工智能（Physical AI）的基础技术，该领域包括能够感知现实世界

Cosmos-Reason模型 NeurIPS人工智能大会自动驾驶推理视觉语言模型比尔·戴利英伟达

查看详情

阿里通义Z-Image生图模型：6亿参数高质量，多版本赋能高效创作编辑

阿里通义Z-Image生图模型：6亿参数高质量，多版本赋能高效创作编辑

AI妹 4 个月前 22 0

阿里通义正式发布了其最新的生图模型 Z-Image。该模型在发布首日便迅速登顶 Hugging Face 的趋势榜，下载量达到惊人的50万次。Z-Image 以仅6亿个参数的规模，实现了与大型模型

复杂图像编辑生图模型照片级真实感 Z-Image-Edit 高效图像生成

查看详情

DeepSeek-Math-V2开源系全球首个达IMO金牌水平的混合专家数学模型

DeepSeek-Math-V2开源系全球首个达IMO金牌水平的混合专家数学模型

AI妹 4 个月前 27 0

DeepSeek今日正式发布 DeepSeek-Math-V2，这款6850亿参数的混合专家（MoE）模型成为全球首个以开源形式达到国际数学奥林匹克(IMO)金牌水平的数学推理大模型。该模型基于

强化学习药物设计可自我验证能力 DeepSeek-Math-V2 生成-验证双模型闭环机制

查看详情

YPrompt聊天式提示词工具：对话挖需求多格式输出版本可回溯

YPrompt聊天式提示词工具：对话挖需求多格式输出版本可回溯

AI妹 4 个月前 24 0

一款名为 YPrompt 的聊天式提示词工程工具上线，旨在帮助用户更高效地生成和优化提示词。YPrompt 通过与用户的对话，深入挖掘需求，自动生成专业的提示词，像是一位精通需求分析的产品经理，帮

YPrompt 版本管理代码块即时渲染效果多种输出格式

查看详情

阿里通义实验室开源Z-Image模型轻量高效助力AI图像消费级转型

阿里通义实验室开源Z-Image模型轻量高效助力AI图像消费级转型

AI妹 4 个月前 29 0

阿里巴巴通义实验室近日重磅开源全新图像生成模型 Z-Image，该模型凭借仅 6B 的参数规模，实现了高效的图像生成与编辑，其视觉质量已接近国际领先商业模型的三倍参数级别（约20B）。Z-Imag

单流DiT架构 ModelScope 中英双语文字渲染 NVIDIA RTX30系列 8个采样步骤

查看详情

巨人网络AI Lab联合清华等推出三项音视频多模态生成技术成果

巨人网络AI Lab联合清华等推出三项音视频多模态生成技术成果

AI妹 4 个月前 24 0

巨人网络AI Lab 近日联合清华大学 SATLab、西北工业大学，重磅推出了三项音视频领域的多模态生成技术成果:音乐驱动的视频生成模型 YingVideo-MV、零样本歌声转换模型 YingMu

YingMusic-SVC YingMusic-Singer 音视频多模态生成技术 HuggingFace 零样本歌声转换

查看详情

腾讯混元开源HunyuanOCR模型 10亿参数轻量化高效性能获多项SOTA

腾讯混元开源HunyuanOCR模型 10亿参数轻量化高效性能获多项SOTA

AI妹 4 个月前 24 0

11月25日，腾讯混元正式宣布开源全新 OCR 模型 HunyuanOCR。该模型参数仅10亿（1B），依托混元原生多模态架构打造，在多项业界 OCR 应用榜单中斩获 SOTA(最先进水平)成绩，

OmniDocBench 多语种复杂文档解析混元原生多模态架构 ICDAR2025端到端文档翻译比赛腾讯混元

查看详情

...

44



资讯姬

文章数量12102

总阅读量203.329k

总评论量0

会员数量2

本站由emlog驱动