关闭导航

包含标签"自动评估"的内容

Agent-as-a-Judge智能评估项目:省时省成本 获ICML2025认可 成功应用于代码生成
AI妹 1 个月前 7 0

在当前人工智能的迅猛发展中,评估智能代理的能力成为了一个重要课题。为此,Agent-as-a-Judge(代理法官)项目应运而生,它不仅是一个技术库,更是一种全新的评估理念。该项目旨在通过智能代理

Agent-as-a-Judge智能评估项目:高效省成本 获ICML2025学术认可
AI妹 1 个月前 8 0

在當前人工智能的迅猛發展中,評估智能代理的能力成爲了一個重要課題。爲此,Agent-as-a-Judge(代理法官)項目應運而生,它不僅是一個技術庫,更是一種全新的評估理念。該項目旨在通過智能代理

谷歌DeepMind AlphaEvolve:AI编码代理 核心技术融合Gemini进化 多领域突破开启新纪元
AI妹 1 个月前 8 0

谷歌DeepMind發佈了一項顛覆性研究成果——AlphaEvolve,一款結合Gemini大語言模型與進化算法的AI編碼代理。這款系統不僅能自動發現和優化複雜算法,還在谷歌的數據中心、芯片設計和

谷歌DeepMind AlphaEvolve:Gemini与进化算法融合 多领域创新突破
AI妹 1 个月前 9 0

谷歌DeepMind发布了一项颠覆性研究成果——AlphaEvolve,一款结合Gemini大语言模型与进化算法的AI编码代理。这款系统不仅能自动发现和优化复杂算法,还在谷歌的数据中心、芯片设计和

Qwen-MT机器翻译模型发布 多语言互译可控性强高效低成本
AI妹 1 个月前 9 0

Qwen-MT机器翻译模型正式发布,Qwen-MT基于强大的Qwen3模型,经过超大规模多语言和翻译数据的训练,结合强化学习技术,显著提升了翻译结果的准确性和语言流畅度。开发者可以通过Qwen A

Qwen-MT机器翻译模型发布 多语言可控轻量高效性能卓越
AI妹 1 个月前 7 0

Qwen-MT機器翻譯模型正式發佈,Qwen-MT基於強大的Qwen3模型,經過超大規模多語言和翻譯數據的訓練,結合強化學習技術,顯著提升了翻譯結果的準確性和語言流暢度。開發者可以通過Qwen A

Qwen-MT机器翻译模型正式发布 多语言高可控低成本性能领先
AI妹 1 个月前 8 0

Qwen-MT machine translation model is officially released. Qwen-MT is based on the powerful Qwen3 m

Qwen-MT机械翻译模型正式发布 多语言高性能低代价优势显著
AI妹 1 个月前 12 0

Qwen-MTの機械翻訳モデルが正式リリースされました。Qwen-MTは、強力なQwen3モデルを基盤とし、超大規模な多言語および翻訳データでトレーニングを行い、強化学習技術を組み合わせることで、