关闭导航

包含标签"大规模语言模型"的内容

清华上交研究质疑RL提升大语言模型推理能力 引发学界广泛讨论
AI妹 1 个月前 11 0

【研究の転換点】 清華大学と上海交通大学が共同発表した最新の論文は、業界で広く信じられている「純粋な強化学習(RL)は大規模言語モデルの推論能力を向上させる」という見解に異議を唱えています。研

百度Create会議発文心X1Turbo/4.5Turbo、高性能低価格競争激化
AI妹 1 个月前 8 0

百度Create開発者会議において、百度創業者である李彦宏氏は大規模言語モデルの最新世代である文心大模型X1Turboを発表しました。このモデルは性能の大幅な向上に加え、価格競争力も非常に高く、1

百度Create开发者会议李彦宏发布文心4.5Turbo与X1Turbo 速度大幅升成本显著降
AI妹 1 个月前 9 0

4月25日に開催された百度Create開発者会議で、百度創業者である李彦宏氏は大規模言語モデルシリーズの最新作である文心4.5TurboとX1Turboを発表しました。これらの新しいモデルは、速度

B站发布AI原创语音翻译功能 保持原声音质支持英语助力内容国际化
AI妹 1 个月前 9 0

Bilibiliは、自社開発した「AIオリジナル音声翻訳機能」を正式にリリースしました。この機能は、今年5月に国際版アプリと国内版の統合後、国内外のコンテンツが相互に利用できるようするためのもので

GPT-5開発大幅遅れ(人材流失・データ瓶頸)Orion降格、OpenAI資本市場強靭
AI妹 1 个月前 10 0

OpenAIの次世代大規模言語モデルの開発は、過去にない課題に直面しています。報道によると、注目を集めるGPT-5プロジェクトは、核心チームの人材流出やデータリソースのボトルネックなどの複数の問題

Anthropic内部测试Claude Opus4.1 强化问题解决能力或近期推出
AI妹 1 个月前 11 0

ソーシャルメディアで広まっている内部スクリーンショットによると、Anthropicは次世代の大規模言語モデル「Claude Opus4.1」を内部的にテストしているようです。リーク情報によると、こ

西湖大学齐教授团队提出扩散型发散思考链 增强AI推理与创造力
AI妹 1 个月前 8 0

近年の人工知能研究において、思考の連鎖(チェーンオブシンキング)の概念がますます注目を集めています。特に大規模言語モデルの訓練や推論においてその重要性が増しています。最近、西湖大学MAPLE研究所

稀宇科技发布MiniMax Agent全栈开发功能 助力开发者高效构建应用
AI妹 1 个月前 10 0

近日,稀宇科技正式发布了其最新的全栈开发功能 ——MiniMax Agent,这一创新工具旨在帮助开发者更轻松地构建各类应用程序。随着数字经济的不断发展,开发者们面临着越来越多的挑战,而 Mini

MetaのAU-Net:動的バイト組合せによるLLMテキスト処理の革新的アーキテクチャ
AI妹 1 个月前 11 0

大規模言語モデル(LLM)の分野において、テキストデータの分解は常に重要な研究テーマです。従来のトークン化技術、例えばバイトペアエンコーディング(Byte Pair Encoding)は、通常、テ