关闭导航

包含标签"稳定性"的内容

Jan-v2-VL-Max多模态模型发布 突破Agent长程执行稳定性并超越竞品
AI妹 27 天前 8 0

在AI智能体(Agent)向复杂、多步任务演进的关键阶段,开源社区迎来一员新锐猛将。Jan团队今日正式发布 Jan-v2-VL-Max——一款300亿参数的多模态大模型,专为长周期、高稳定性自动化

全球首个人形机器人半马北京亦庄开赛 “天工”机器人夺冠创历史
AI妹 1 个月前 11 0

北京,2025年4月19日——今天,全球首个人形机器人半程马拉松在北京经济技术开发区(亦庄)正式开赛,标志着机器人技术与体育竞技的创新融合迈出历史性一步。 本次赛事吸引了近20支来自全球的人形机

2025北京BDA人形机器人半马开赛 天宫机器人夺冠展技术突破
AI妹 1 个月前 11 0

Beijing, April 19, 2025—Today, the world's first humanoid robot half-marathon officially kicked of

GPT-4.1推出引关注 对齐性与稳定性下降引发研究人员担忧
AI妹 1 个月前 11 0

近日,OpenAI 推出了其新一代人工智能模型 ——GPT-4.1,聲稱在遵循用戶指令方面表現優異。然而,令人意外的是,多項獨立測試的結果顯示,GPT-4.1的對齊性和穩定性較之前的版本有所下降,

CameraBench:赋能AI精准理解镜头运动的创新研究成果
AI妹 1 个月前 11 0

咱们天天聊 AI 多牛逼,能写诗、能画画、还能跟你唠嗑到天亮。但你有没有想过,当 AI 看视频的时候,它真的“看懂”了吗? 你可能会说:“当然了,都能识别猫猫狗狗、人山人海了!” 打住!识别物

微软研究API与GUI代理对比及三种混合系统策略
AI妹 1 个月前 10 0

近日,微软的研究团队对 API 代理和 GUI 代理进行了对比研究,发现这两种代理各有特点,可以根据不同需求进行合理选择。API 代理通过可编程接口与软件进行交互,而 GUI 代理则模拟人类的操作

Anthropic推Claude Opus4.1 代码/推理/安全能力均获显著提升
AI妹 1 个月前 12 0

Anthropic は、最新のエクスパートモデル「Claude Opus4.1」を正式にリリースしました。エージェントタスク、現実世界のコード作成および推論能力において顕著な向上を遂げました。この

OpenAI组织重组为IPO铺路 微软投资超130亿美元 上市时机看市场
AI妹 1 个月前 10 0

OpenAI 的首席財務官莎拉・弗里爾(Sarah Frier)近日在都柏林科技峯會上透露,公司正在進行的組織重組爲未來可能的首次公開募股(IPO)鋪平了道路。雖然 OpenAI 正在積極準備,但

OpenAI组织重组为IPO铺路 微软投资超130亿美元上市时机待定
AI妹 1 个月前 11 0

OpenAI 的首席财务官莎拉・弗里尔(Sarah Frier)近日在都柏林科技峰会上透露,公司正在进行的组织重组为未来可能的首次公开募股(IPO)铺平了道路。虽然 OpenAI 正在积极准备,但

ZeroSearch框架:通义实验室北大团队推出 无需真实搜索降88%成本激活检索能力
AI妹 1 个月前 10 0

最近,通义实验室和北京大学的研究团队推出了一项名为 ZeroSearch 的创新框架,这一新技术可以在不需要真实搜索的情况下,激活大语言模型的检索能力,并且训练成本降低了惊人的88%。这一突破为大

    1 2