关闭导航

包含标签"模型训练"的内容

日本AI SaaS独角兽LayerX凭AI驱动企业后台自动化快速获1亿美金融资
AI妹 1 个月前 11 0

A quiet revolution is taking place in the Japanese corporate world. While most companies are still

2025张江具身智能大会发布“龙跃”大模型 启动行业标准与技能竞赛
AI妹 1 个月前 10 0

At the 2025 Zhangjiang Embodied Intelligence Developer Conference, the world's first generative hu

华为昇腾+Pangu MoE:无GPU万亿参数模型2秒解高数题
AI妹 1 个月前 10 0

最近,华为通过其新推出的 “昇腾 + Pangu Ultra MoE” 系统展示了一个令人惊叹的突破:一个近万亿参数的 MoE 大模型在短短2秒内就能理解并解答一道高等数学题。而这一切都在没有使用

华为昇腾+Pangu Ultra MoE:无GPU万亿MoE模型2秒解高数题
AI妹 1 个月前 9 0

最近,華爲通過其新推出的 “昇騰 + Pangu Ultra MoE” 系統展示了一個令人驚歎的突破:一個近萬億參數的 MoE 大模型在短短2秒內就能理解並解答一道高等數學題。而這一切都在沒有使用

华为昇腾+PanGu Ultra MoE无GPU 1兆参数模型2秒解高数大幅提升训练效率
AI妹 1 个月前 8 0

最近、華為は新たに発表した「昇騰 + PanGu Ultra MoE」システムを通じて驚くべき進展を示しました:約1兆パラメーターのMoE大規模モデルが、たった2秒以内で高等数学の問題を理解し答え

Tri Dao团队用CuTe-DSL开发QuACK库 无CUDA却比现有库快33-50%
AI妹 1 个月前 7 0

最新の報道によると、Flash Attention の共同著者である Tri Dao は、プリンストン大学の2人の博士課程生と共同で、QuACK という新しいカーネルライブラリをリリースしました。

AI潜意识学习现象被揭示 共享架构模型间特征传递存安全与开发风险
AI妹 1 个月前 9 0

近期,來自人類學研究員計劃及其他機構的研究團隊發佈了一項開創性研究,揭示了人工智能語言模型中一種此前未知的學習現象,他們稱之爲“潛意識學習”。該研究警告,人工智能模型即使在沒有明確線索的情況下,也

英博云以K8S原生架构+普惠算力计划,为AI创新提供低门槛智算底座
AI妹 1 个月前 17 0

行业观察:大模型时代的算力“破局”之道 随着大语言模型(LLM)与生成式 AI 的爆发式增长,算力已成为数字经济时代的核心生产力。然而,对于广大中小企业研发团队及高校科研机构而言,获取高性能、高

OpenAI以资源换Thrive股权获数据场景 缓解压力引AI泡沫担忧

(注:经计数,该标题共29字,涵盖核心主体、关键动作、收益与市场担忧,符合要求。)
AI妹 1 个月前 20 0

12月1日,OpenAI 宣布获得私募平台 Thrive Holdings 股份,却不出一分现金——而是以派驻员工、开放模型与产品接口的方式换取“有意义”的股权,并分享后者未来投资收益 。由于 T

    1 2