关闭导航

包含标签"监督微调(SFT)"的内容

马斯克xAI完成Grok9训练 1.5万亿参数版将3-4周发布并提升编程能力
AI妹 22 天前 1 0

埃隆·马斯克近日在社交平台X上确认,旗下人工智能公司xAI的内部第 9 版Grok大模型基础模型已正式完成训练。这款新模型拥有高达1. 5 万亿的惊人参数量,预计将在未来 3 到 4 周内向公众发

马斯克将推1.5万亿参数Grok9版 用Cursor数据补短板对标Claude
AI妹 22 天前 1 0

马斯克终于要出手了。 在AI编程赛道上,OpenAI和Anthropic越跑越快,xAI这边多少有点跟不上节奏。马斯克嘴上没少说要对标Claude,但Grok4.X系列几次更新下来,跑分看着光鲜

OpenSeeker-v2:纯学术团队SFT训练超越工业模型的顶尖搜索智能体开源
AI妹 1 个月前 1 0

在当前的大模型(LLM)领域,深度搜索能力已成为顶尖智能体的“必杀技”。然而,这一赛道的游戏规则长期以来被资源雄厚的工业巨头所主导。传统的开发模式通常依赖于极其消耗资源的流水线,包括预训练、持续预

国产智谱GLM-4.7超越GPT-5.2登顶开源代码榜 开源Slime框架提升强化学习效率
AI妹 5 个月前 15 0

年底的科技圈再度掀起波澜,智谱科技最新推出的 GLM-4.7模型不仅在代码竞技场的 WebDev 榜单上超越了 GPT-5.2,荣登开源大模型第一,还引发了网友们的热烈讨论和实测狂潮。这个被称为

UCLA與Meta AI推出d1框架 強化學習提升擴散式大語言模型推理能力
AI妹 5 个月前 17 0

在人工智能領域,UCLA 和 Meta AI 的研究人員聯合推出了一種名爲 d1的新框架,該框架通過強化學習技術顯著提升了擴散式大語言模型(dLLMs)的推理能力。雖然傳統的自迴歸模型如 GPT

B站开源Index-AniSora动画视频生成模型 实现二次元创作革命性突破
AI妹 5 个月前 15 0

2025年5月19日,哔哩哔哩(B站)宣布开源其最新的动画视频生成模型——Index-AniSora,这一创新技术为二次元风格视频的生成带来了革命性的突破。Index-AniSora支持多种二次元

B站开源Index-AniSora动画模型 技术突破赋能二次元创作发展
AI妹 5 个月前 14 0

2025年5月19日,嗶哩嗶哩(B站)宣佈開源其最新的動畫視頻生成模型——Index-AniSora,這一創新技術爲二次元風格視頻的生成帶來了革命性的突破。Index-AniSora支持多種二次元

阿里开源WebAgent:自主搜索AI智能体赋能高效信息检索
AI妹 5 个月前 15 0

阿里巴巴在 GitHub 上發佈了其創新的自主搜索 AI 智能體 ——WebAgent。這款 AI 智能體具備端到端的信息檢索和多步推理能力,能夠像人類一樣在網絡環境中主動搜索、分析和決策。它的推