LLMs - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"LLMs"的内容

Gartner报告：2027年企业任务型AI模型使用量将达通用LLM三倍

Gartner报告：2027年企业任务型AI模型使用量将达通用LLM三倍

AI妹 5 个月前 17 0

A new Gartner report predicts that by 2027, businesses will use task-specific AI models three time

AI model customization Retrieval-Augmented Generation Sumit Agarwal proprietary data talent development

查看详情

字节跳动PHD-Transformer技术突破LLM 2M上下文预训练效率瓶颈

字节跳动PHD-Transformer技术突破LLM 2M上下文预训练效率瓶颈

AI妹 5 个月前 17 0

ByteDance has announced the launch of Efficient Pretraining Length Scaling, leveraging a novel Par

Megatron-LM ByteDance LLMs Hailuo Image ultra-long context language models

查看详情

DTVM开源：性能超传统30倍兼容以太坊生态并集成AI开发工具套件

DTVM开源：性能超传统30倍兼容以太坊生态并集成AI开发工具套件

AI妹 5 个月前 18 0

On April 24th, a blockchain virtual machine named DTVM (Deterministic Virtual Machine) was announc

Java Pharos 链上AI dApps C++

查看详情

LLM智能体决策缺陷（知行不一/贪婪/频率偏差）与RLFT改进研究

LLM智能体决策缺陷（知行不一/贪婪/频率偏差）与RLFT改进研究

AI妹 5 个月前 16 0

現在的大模型（LLMs）已經非常智能。寫文章、編代碼、當醫生、當老師，樣樣精通。於是乎，有人就想了:既然它們這麼聰明，能不能讓它們自己做決定，當個“智能體”呢?比如，在複雜的環境裏自己探索、自己解

Thought Cloning（TC）探索机制多臂老虎机（MABs） Behavior Cloning（BC）智能体

查看详情

五校联合发布综述聚焦提升大语言模型逻辑推理能力及路径

五校联合发布综述聚焦提升大语言模型逻辑推理能力及路径

AI妹 5 个月前 18 0

在當前人工智能領域，大語言模型（LLMs）取得了顯著成就，但其邏輯推理能力依然顯得不足。爲了提升這一能力，來自北京大學、清華大學、阿姆斯特丹大學、卡內基梅隆大學以及阿布扎比的 MBZUAI 等五所

LLMs 逻辑问答预训练不确定性模态逻辑

查看详情

北大清华等五校联合发布综述聚焦提升大模型逻辑推理能力的策略

北大清华等五校联合发布综述聚焦提升大模型逻辑推理能力的策略

AI妹 5 个月前 16 0

在当前人工智能领域，大语言模型（LLMs）取得了显著成就，但其逻辑推理能力依然显得不足。为了提升这一能力，来自北京大学、清华大学、阿姆斯特丹大学、卡内基梅隆大学以及阿布扎比的 MBZUAI 等五所

医疗模态逻辑逻辑一致性外部求解器逻辑问答

查看详情

MCP协议推动AI模型工具交互标准化，引领AI应用生态变革

MCP协议推动AI模型工具交互标准化，引领AI应用生态变革

AI妹 5 个月前 14 0

The emergence of the Model Context Protocol (MCP) heralds a fundamental transformation in the ecos

flywheel effect fragmented tools contextual information Model Context Protocol self-reinforcing flywheel

查看详情

Google开源LangExtract库：LLM助力非结构化文本结构化提取跨领域应用

Google开源LangExtract库：LLM助力非结构化文本结构化提取跨领域应用

AI妹 5 个月前 15 0

Google has officially released a new open-source Python library LangExtract, designed to efficient

Literary Research Google market trend insights GitHub radiology reports

查看详情

OpenAI發布HealthBench框架評估醫療LLM真實場景表現與安全性

OpenAI發布HealthBench框架評估醫療LLM真實場景表現與安全性

AI妹 5 个月前 15 0

近日，OpenAI 發佈了一款名爲 HealthBench 的開源評估框架，旨在測量大型語言模型（LLMs）在真實醫療場景中的表現和安全性。此框架的開發得到了來自60個國家和26個醫學專業的262

LLMs 针对性沟通不确定情况反应 Gpt-4.1 GPT-3.5Turbo

查看详情

DeepSeek-V3依托2048枚H800 GPU训练突破硬件限制实现高效训推

DeepSeek-V3依托2048枚H800 GPU训练突破硬件限制实现高效训推

AI妹 5 个月前 12 0

この記事の公開URLは次のとおりです: (https://arxiv.org/pdf/2505.09343) この研究では、大規模言語モデル（LLMs）の急速な拡張が既存のハードウェアアーキテク

訓練ハードウェアアーキテクチャ制限 DeepSeek-V3 NVIDIA H800-GPUクラスター推論

查看详情

1



资讯姬

文章数量13527

总阅读量227.016k

总评论量0

会员数量2

本站由emlog驱动