关闭导航

包含标签"LLMs"的内容

Gartner报告:2027年企业任务型AI模型使用量将达通用LLM三倍
AI妹 1 个月前 7 0

A new Gartner report predicts that by 2027, businesses will use task-specific AI models three time

字节跳动PHD-Transformer技术突破LLM 2M上下文预训练效率瓶颈
AI妹 1 个月前 10 0

ByteDance has announced the launch of Efficient Pretraining Length Scaling, leveraging a novel Par

DTVM开源:性能超传统30倍 兼容以太坊生态并集成AI开发工具套件
AI妹 1 个月前 8 0

On April 24th, a blockchain virtual machine named DTVM (Deterministic Virtual Machine) was announc

LLM智能体决策缺陷(知行不一/贪婪/频率偏差)与RLFT改进研究
AI妹 1 个月前 7 0

現在的大模型(LLMs)已經非常智能。寫文章、編代碼、當醫生、當老師,樣樣精通。於是乎,有人就想了:既然它們這麼聰明,能不能讓它們自己做決定,當個“智能體”呢?比如,在複雜的環境裏自己探索、自己解

五校联合发布综述 聚焦提升大语言模型逻辑推理能力及路径
AI妹 1 个月前 9 0

在當前人工智能領域,大語言模型(LLMs)取得了顯著成就,但其邏輯推理能力依然顯得不足。爲了提升這一能力,來自北京大學、清華大學、阿姆斯特丹大學、卡內基梅隆大學以及阿布扎比的 MBZUAI 等五所

北大清华等五校联合发布综述 聚焦提升大模型逻辑推理能力的策略
AI妹 1 个月前 9 0

在当前人工智能领域,大语言模型(LLMs)取得了显著成就,但其逻辑推理能力依然显得不足。为了提升这一能力,来自北京大学、清华大学、阿姆斯特丹大学、卡内基梅隆大学以及阿布扎比的 MBZUAI 等五所

MCP协议推动AI模型工具交互标准化,引领AI应用生态变革
AI妹 1 个月前 8 0

The emergence of the Model Context Protocol (MCP) heralds a fundamental transformation in the ecos

Google开源LangExtract库:LLM助力非结构化文本结构化提取跨领域应用
AI妹 1 个月前 7 0

Google has officially released a new open-source Python library LangExtract, designed to efficient

OpenAI發布HealthBench框架 評估醫療LLM真實場景表現與安全性
AI妹 1 个月前 9 0

近日,OpenAI 發佈了一款名爲 HealthBench 的開源評估框架,旨在測量大型語言模型(LLMs)在真實醫療場景中的表現和安全性。此框架的開發得到了來自60個國家和26個醫學專業的262

DeepSeek-V3依托2048枚H800 GPU训练 突破硬件限制实现高效训推
AI妹 1 个月前 7 0

この記事の公開URLは次のとおりです: [https://arxiv.org/pdf/2505.09343](https://arxiv.org/pdf/2505.09343) この研究では、大

    1 2