关闭导航

包含标签"RLHF"的内容

腾讯发布WeChat-YATT大模型训练库 高效解决多模态与RL复杂训练难题
AI妹 1 个月前 10 0

テンセントは最近、Megatron-CoreとSGLang/vLLMを基盤として開発した大規模モデルトレーニングライブラリ「WeChat-YATT(Yet Another Transformer

DMind推出Web3专用AGI模型DMind-1系列 开源助力生态革新
AI妹 1 个月前 8 0

人工知能とブロックチェーン技術の融合が加速する重要なタイミングで、オープンソースのAGI研究機関であるDMindは、革新的なWeb3専用言語モデルを通じて業界を変革しています。この機関は最近、DM

小米MiMo-VL-7B多模态模型性能领先 创新算法赋能成开源佼佼者
AI妹 1 个月前 7 0

近日,小米公司研发的MiMo-VL多模态模型接过MiMo-7B的接力棒,在多个领域展现出了强大的实力。该模型在图片、视频、语言的通用问答和理解推理等多个任务上大幅领先同尺寸标杆多模态模型Qwen2

谷歌DeepMind与伦敦大学研究揭示大语言模型面对反对意见易动摇现象
AI妹 1 个月前 10 0

最近,Google DeepMind 与伦敦大学的研究揭示了大语言模型(LLMs)在面对反对意见时的 “软弱” 表现。比如,像 GPT-4o 这样的先进模型,有时会显得非常自信,但一旦遇到质疑,它

Google DeepMind与伦敦大学研究揭示大语言模型面对反对意见容易放弃正确答案
AI妹 1 个月前 15 0

最近,Google DeepMind 與倫敦大學的研究揭示了大語言模型(LLMs)在面對反對意見時的 “軟弱” 表現。比如,像 GPT-4o 這樣的先進模型,有時會顯得非常自信,但一旦遇到質疑,它

Google DeepMind研究:LLM遇反对意见易放弃正确判断
AI妹 1 个月前 10 0

最近、Google DeepMind とロンドン大学の研究では、大規模言語モデル(LLMs)が反対意見に直面した際の「弱さ」が明らかにされました。例えば、GPT-4o のような先進的なモデルは、し

AI接受心理咨询现类似心理困扰 拟人化结论引发技术社区争议
AI妹 1 个月前 15 0

 近日,一项在国外引起广泛关注的研究,试图解答一个有趣的赛博伦理问题:经受过大量训练的 AI 会不会有心理创伤或心理疾病? 研究人员将包括 Gemini、Claude 和 Grok 在内

AI数据服务商Micro1 ARR破1亿 三年成独角兽 24岁创始人掌舵
AI妹 1 个月前 22 0

12月4日,AI数据服务商Micro1宣布年化经常性收入(ARR)突破1亿美元,较年初的700万美元增长超14倍,成为年内增速最快的AI供应链公司。公司同时披露最新估值达5亿美元,三年时间从0到独

    1 2