4月16日,蚂蚁灵波科技正式宣布开源流式三维重建模型 LingBot-Map。该模型突破性地实现了仅依靠单个普通 RGB 摄像头,即可在视频采集过程中实时估计相机位姿并重建场景三维结构。这一进展为
在2026年的 AI 智能体领域,一款名为 “Hermes” 的新兴产品正引发广泛关注。这款由 Nous Research 团队开发的 Hermes Agent,目前其GitHub 上获得了惊人的
腾讯正式推出混元3D 世界模型2.0(HY-World2.0),并将其开源。该模型具备多模态能力,能够根据文本、图片和视频等不同输入形式,自动生成、重建和模拟3D 世界。这一创新产品支持多种格式的
4月15日,小红书AI平台团队悄悄做了一件在技术圈颇具分量的事——正式开源了一款名为Relax的大模型强化学习训练引擎。 Relax的设计定位很明确:专为全模态与Agentic场景打造。换句话说
微软近日正式开源了其最新研发的多模态推理模型 Phi-4-reasoning-vision-15B。该模型凭借15B 的参数规模,在保持轻量化的同时,实现了高性能与低成本的理想平衡,为资源受限环境
4月7日,微软必应(Bing)团队宣布正式开源名为“Harrier”的全新词嵌入模型系列,旨在重塑全球搜索、检索及人工智能代理的底层逻辑。Harrier系列包含三个不同规格的版本,其中旗舰级27B
清华大学智能产业研究院(AIR)联合水木分子正式发布并开源了生物医药大模型插件集OpenBioMed Skills。该项目首次将生物医药专家的决策流程转化为可执行的Agent Skill代码,并在
4 月 3 日, 美团技术团队 正式发布原生多模态大模型 LongCat-Next 。该模型突破了传统“语言基座+插件”的拼凑架构,通过将
据报道,基于 Java 开发的开源 LLMOps 平台 Maxkb4j 正式发布了 v2.6.0 版本。作为一款集成了 LLM 工作流与 RAG(检索增强生成)能力的深度
3月31日,蚂蚁灵波科技正式开源大规模 RGB-D 深度数据集 LingBot-Depth-Dataset。该数据集包含300万对高质量样本,其中200万对来自真实场景采集、100万对由