关闭导航

包含标签"模型架构"的内容

Qwen3-Coder-Flash:甜品级编程模型 超强Agent能力开源易用多平台支持
AI妹 1 个月前 10 0

Qwen3-Coder系列迎来了新成员——Qwen3-Coder-Flash,这款被开发者亲切称为“甜品级”的编程模型以其卓越的性能和高效的运行速度,为编程领域带来了新的惊喜。 Qwen3-Co

Meta与佐治亚理工研发CATransformers 推动AI减排与性能可持续发展
AI妹 1 个月前 9 0

在人工智能迅猛发展的今天,Meta 的 FAIR 团队与佐治亚理工学院联合研发了一款名为 CATransformers 的全新框架。该框架以降低碳排放为核心设计理念,旨在通过优化模型架构与硬件性能

AI潜意识学习现象被揭示 共享架构模型间特征传递存安全与开发风险
AI妹 1 个月前 8 0

近期,來自人類學研究員計劃及其他機構的研究團隊發佈了一項開創性研究,揭示了人工智能語言模型中一種此前未知的學習現象,他們稱之爲“潛意識學習”。該研究警告,人工智能模型即使在沒有明確線索的情況下,也