关闭导航

包含标签"音频处理"的内容

谷歌AI Edge Gallery登陆macOS 本地运行Gemma模型及离线语音听写功能上线
AI妹 5 天前 1 0

谷歌旗下的实验性应用 AI Edge Gallery 近日正式登陆苹果 macOS 系统。这一举动意味着,广大 Mac 用户现在无需依赖网络连接,就可以直接在自己的笔记本上本地运行最新的 Gemm

MiniCPM-V4.6端侧多模态大模型发布 低内存6G即可流畅运行
AI妹 27 天前 2 0

近日,面壁智能联合清华大学及 OpenBMB 开源社区,正式发布了新一代端侧多模态大模型 ——MiniCPM-V 4.6。该模型在仅有 1.3B 参数的情况下,展现出了卓越的性能和效率,尤其在当前

字节火山引擎豆包全模态模型发布 多模态理解与智能体能力升级
AI妹 1 个月前 2 0

字节跳动旗下火山引擎于5月6日宣布,豆包大模型家族正式迎来首款全模态理解模型——Doubao-Seed-2.0-lite。作为该系列的重磅升级版本,新模型彻底打破了单一模态的限制,实现了视频、图像

微软加速推进自研关键AI模型 其目标2027年达世界领先并摆脱外部依赖
AI妹 2 个月前 3 0

微软公司正以前所未有的力度推进自研AI模型研发,旨在未来几年内构建起能与OpenAI和Anthropic并驾齐驱的前沿系统。微软AI负责人苏莱曼明确表示,公司的核心目标是打造行业内最尖端的模型。

OpenAI发布o4-mini与o3多模态模型 性能卓越具工具调用等强大能力
AI妹 5 个月前 16 0

At 1 AM tonight, OpenAI unveiled its latest and most powerful multimodal models: o4-mini and the f