关闭导航

包含标签"斯坦福大学"的内容

英伟达NitroGen游戏智能体:海量视频训练 跨游通用成功率提52%且开源
AI妹 29 天前 8 0

英伟达(NVIDIA)近期展示了其在通用人工智能(AGI)领域的最新突破,推出了一款名为 NitroGen 的游戏智能体基础模型。与传统单一用途的 AI 不同,N

大语言模型过度预训练或致性能下降 存在灾难性过度训练拐点
AI妹 1 个月前 8 0

近日,来自卡内基梅隆大学、斯坦福大学、哈佛大学和普林斯顿大学的研究人员揭示了一个关于大语言模型(LLMs)训练的新发现:并不是预训练的数据越多,模型的表现就越好。相反,他们指出,过度的预训练可能会

GPT-5多版本LMArena测试表现优异 新功能有望深远重塑编程与智能领域格局
AI妹 1 个月前 8 0

With the development of technology, the competition in the field of artificial intelligence is bec

研究提出Elephant基准评估LLM谄媚,各测试模型均有且GPT-4o最明显存性别偏见
AI妹 1 个月前 9 0

最近,随着 OpenAI 对 GPT-4o 的一些更新进行回撤,关于该模型 “谄媚” 用户的讨论引发了广泛关注。前 OpenAI 首席执行官埃梅特・希尔(Emmet Shear)和 Hugging

斯坦福等校提出Elephant基准 测评LLM谄媚 GPT-4o最明显且有性别偏见
AI妹 1 个月前 6 0

最近,隨着 OpenAI 對 GPT-4o 的一些更新進行回撤,關於該模型 “諂媚” 用戶的討論引發了廣泛關注。前 OpenAI 首席執行官埃梅特・希爾(Emmet Shear)和 Hugging

RBench-V基准发布 评估多模态大模型视觉推理能力表现欠佳
AI妹 1 个月前 7 0

最近、清華大学、テンセント・ミックスワン、スタンフォード大学、そしてカーネギーメロン大学の研究チームは、多モーダル大規模モデルの視覚推論能力をテストするための新しい評価ベンチマークである RBen

RBench-V基准发布 多模态大模型视觉推理能力评估结果揭晓
AI妹 1 个月前 9 0

近日,由清华大学、腾讯混元、斯坦福大学及卡耐基梅隆大学的研究团队联合发布了一项新评估基准 ——RBench-V,专门针对多模态大模型的视觉推理能力进行测试。该基准的推出,旨在填补当前评估体系中对模

LocAgent图索引LLM代理框架 代码定位准确率高达92.7%
AI妹 1 个月前 8 0

程序員們又有新工具可以歡呼了!由 OpenHands、耶魯大學、南加州大學和斯坦福大學的研究團隊聯手推出的 LocAgent,正是一個專門爲代碼定位而設計的圖索引大語言模型(LLM)代理框架。令人

LocAgent图索引框架:高准确率解决代码定位难题提升开发效率
AI妹 1 个月前 7 0

程序员们又有新工具可以欢呼了!由 OpenHands、耶鲁大学、南加州大学和斯坦福大学的研究团队联手推出的 LocAgent,正是一个专门为代码定位而设计的图索引大语言模型(LLM)代理框架。令人

微软开源Phi-4-mini-flash-reasoning 借SambaY架构推理效率提升10倍
AI妹 1 个月前 8 0

微软今天凌晨在官网上开源了最新版本的 Phi-4家族模型 ——Phi-4-mini-flash-reasoning。这一新版本在继承了 Phi-4系列参数小、性能强的优点基础上,专为受到计算能力、

    1 2