预训练数据 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"预训练数据"的内容

英伟达主动接洽盗版站点获取书籍训练AI 深陷作家集体版权诉讼

英伟达主动接洽盗版站点获取书籍训练AI 深陷作家集体版权诉讼

AI妹 4 个月前 15 0

全球芯片巨头英伟达（NVIDIA）近期因 AI 模型训练数据来源问题深陷法律纠纷。一份最新提交给美国加州法院的修正起诉书披露了惊人细节:英伟达被指控为了在竞争

作家原告盗版图书合理使用集体诉讼 Megatron

查看详情

新研究揭示大语言模型过度预训练致灾难性性能下降需适度训练调整

新研究揭示大语言模型过度预训练致灾难性性能下降需适度训练调整

AI妹 5 个月前 16 0

近日，來自卡內基梅隆大學、斯坦福大學、哈佛大學和普林斯頓大學的研究人員揭示了一個關於大語言模型（LLMs）訓練的新發現:並不是預訓練的數據越多，模型的表現就越好。相反，他們指出，過度的預訓練可能會

拐点微调性能下降预训练数据灾难性过度训练

查看详情

阿里Qwen3：通义千问最新开源大模型，混合推理多模态全场景覆盖

阿里Qwen3：通义千问最新开源大模型，混合推理多模态全场景覆盖

AI妹 5 个月前 18 0

Qwen3是什么? 阿里Qwen3是通义千问系列的最新一代开源大语言模型（LLM），于2025年4月29日正式发布。作为全球首个支持“混合推理”的模型，Qwen3包含8款不同规模的模型，涵盖稠密

混合推理长上下文处理通义千问系列多模态扩展智能体能力

查看详情

GPT-5首次亮相引热议奥特曼实测通用验证器助力研发遇数据挑战

GPT-5首次亮相引热议奥特曼实测通用验证器助力研发遇数据挑战

AI妹 5 个月前 15 0

在科技領域引起廣泛關注的 GPT-5終於首次亮相，令人興奮的是，這次實測是由 “奧特曼” 親自帶來的，立刻引發了網友們的熱烈討論。儘管最初的對話主要集中在電視劇推薦上，但這仍然是一個值得期待的官方

工程问题证明者文本处理能力代码重构强化学习

查看详情

腾讯混元2.0发布：混合专家架构长上下文推理效率业界领先接入生态

腾讯混元2.0发布：混合专家架构长上下文推理效率业界领先接入生态

AI妹 6 个月前 31 0

腾讯自研大模型混元2.0（Tencent HY2.0）正式发布，与此同时，DeepSeek V3.2也逐步接入腾讯生态。目前，这两大模型已在元宝、ima等腾讯AI原生应用中率先上线，腾讯云也同步开

HMMT2025 Humanitys Last Exam IMO-AnswerBench ima 腾讯混元2.0

查看详情

快手发布Keye-VL-671B-A37B旗舰多模态模型开放代码善看会想强化推理能力

快手发布Keye-VL-671B-A37B旗舰多模态模型开放代码善看会想强化推理能力

AI妹 6 个月前 31 0

快手近日正式发布其新一代旗舰多模态模型 Keye-VL-671B-A37B，并同步开放代码。这一模型以其 “善看会想” 的特性，在通用视觉理解、视频分析和数学推理等多项核心 benchmark 中

DeepSeek-V3-Terminus 富文本OCR 预训练数据工具调用通用多模态系统

查看详情



资讯姬

文章数量13527

总阅读量229.167k

总评论量0

会员数量2

本站由emlog驱动