过去两三年,大模型已经从“新鲜事”变成了许多人工作与生活的一部分。从 ChatGPT、LLaMA 到 Qwen、DeepSeek,越来越多的通用模型不断更新迭代,能力越来越强大。 但在真实业务场
针对 AI 视频生成领域长期存在的“角色走样”与“环境闪烁”难题,字节跳动与南洋理工大学研究团队近期联合推出名为 StoryMem 的创新系统。该系统通过引入一种类似人类记忆的机制,成功实现了长视
阶跃星辰与ACE Studio联合发布了开源音乐大模型ACE-Step(中文名:音跃),标志着音乐创作与生成技术的又一重要突破。ACE-Step是继语音、视频、图片、视觉推理等多模态大
階躍星辰與ACE Studio聯合發佈了開源音樂大模型ACE-Step(中文名:音躍),標誌着音樂創作與生成技術的又一重要突破。ACE-Step是繼語音、視頻、圖片、視覺推理等多模態大
先月開催された2025年 I/O デベロッパーカンファレンスにおいて、グーグルは新たな医療AIモデル「MedGemma」をオープンソースとして発表しました。このモデルはGemma3アーキテクチャに
At the recently concluded 2025 I/O Developer Conference, Google announced the open-sourcing of its
在剛剛結束的2025年 I/O 開發者大會上,谷歌宣佈開源全新醫療 AI 模型 ——MedGemma。這款基於 Gemma3架構的模型專爲醫療領域設計,具備強大的多模態圖像和文本理解能力,旨在提升
近日,新加坡国立大学(NUS)团队发布了一个名为 “OmniConsistency” 的创新项目,旨在以极低的成本复现 OpenAI 的 GPT-4o 模型在图像风格化上的一致性。这项技术不仅解决
近日,新加坡國立大學(NUS)團隊發佈了一個名爲 “OmniConsistency” 的創新項目,旨在以極低的成本復現 OpenAI 的 GPT-4o 模型在圖像風格化上的一致性。這項技術不僅解決
最近、シンガポール国立大学(NUS)のチームは、「OmniConsistency」という革新的なプロジェクトを公開しました。これは、極めて低いコストで OpenAI の GPT-4o モデルによる
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论