关闭导航

包含标签"推理成本"的内容

Cloudflare引入国产Kimi K2.5开源模型 成本降77%性能卓越成范本
AI妹 20 天前 2 0

在全球互联网基础设施巨头 Cloudflare 的最新技术演进中,一场关于“算力性价比”的变革正在发生。据 Kimi 开放平台披露,Cloudflare 已正式将月之暗面(Moonshot AI)

英伟达Nemotron3 Nano上线亚马逊Bedrock 轻量高效成企业AI性价比优选
AI妹 1 个月前 2 0

在 2026 年的生成式 AI 竞赛中,虽然千亿、万亿参数的大模型依然是技术实力的象征,但“小而美”的模型正成为企业落地生产力的真香选择。3 月 10 日,云巨头 亚马逊

vLLM团队创Inferact种子轮8亿估值融资 引领AI推理算力效率革命
AI妹 2 个月前 24 0

当全球AI的聚光灯还流连于那些吞噬万亿参数的巨型模型时,一场关于算力效率的革命已经在底层代码的深处悄然爆发。作为全球顶尖开源推理引擎vLLM的造物主们,今日正式向世界宣告了他们的野心:成立AI基础

OpenAI算力暴涨9.5倍 营收破200亿 推理成本降 聚焦AI Agent
AI妹 2 个月前 10 0

OpenAI 首席财务官 Sarah Friar 近日披露了公司在财务业绩与基础设施建设方面的最新进展。数据显示,

印度Alpie大模型:源于中国开源 性能超顶尖AI模型低门槛引发争议
AI妹 3 个月前 12 0

印度人工智能领域近期杀出一匹黑马。由169PI 公司发布的 Alpie 大模型在多个国际主流 AI 榜单中表现抢眼,甚至在部分数学和软件工程指标上超越了 GPT-

英伟达豪赌200亿获Groq LPU技术 核心团队加盟巩固AI芯片护城河
AI妹 3 个月前 21 0

全球AI芯片霸主英伟达(NVIDIA)正以惊人动作巩固其技术护城河。据CNBC与TechCrunch综合报道,英伟达已与AI芯片挑战者Groq达成一项非独家技术授权协议,并同步聘请Groq创始人兼

OpenAI预测2029年收入1250亿 AI代理为主力用户增长现金流转正
AI妹 3 个月前 13 0

OpenAI 近期发布了一项关于未来收入的预测,预计到2029年,其总收入将达到1250亿美元。其中,AI 代理业务和渠道收入将成为主要驱动力。根据预测,AI 代理业务将占总收入的近四分之一,预计

字节跳动发布Seed1.5-VL多模态大模型 性能优异开放API供用户体验
AI妹 3 个月前 14 0

在人工智能領域競爭日益激烈的今天,字節跳動的 Seed 團隊於5月13日正式發佈了其最新的多模態大模型 Seed1.5-VL,旨在爲智能體技術的進步鋪平道路。該模型經過超過3萬億 tokens 的

谷歌Gemini3Flash发布:速度快3倍成本大幅降 编程反超旗舰成新搜索默认引擎
AI妹 3 个月前 18 0

大模型领域的“性价比之战”再次升级!近日,谷歌宣布正式发布其最新一代轻量化旗舰模型 Gemini3Flash 。令人惊喜的是,这款主打“极速与