谷歌在 5 月 19 日正式发布了其最新的 Gemini Omni 模型,标志着其在人工智能领域的一次重大突破。作为 Gemini 模型家族的最新成员,Gemini Omni 将多模态技术提升到了
想象一下:你正以 160 公里的时速骑摩托车飞驰,前方路面上突然「浮现」出一个导航箭头,精准指示转弯位置。没有手机、不用低头看仪表盘,所有信息都通过头盔里一枚拇指大小的镜片,自然融入你的视野。
AI 助手正在从“只会对话”向“深度代劳”完成质变。 3月24日,据报道,人工智能初创公司 Anthropic 正式发布了其备受瞩目的 “电脑使用”(Computer
语音合成技术正从“机械复读”向“情感共鸣”完成质的跨越。3月19日, 小米 正式发布自研语音合成大模型 Xiaomi MiMo-V2-TTS 。这不
在 AI 领域,马斯克的步伐从来不甘于人后。据最新报道, 马斯克 旗下的 AI 公司 xAI 宣布, Grok
Anthropic旗下AI编程神器Claude Code迎来重磅更新——官方正式支持语音模式(Voice Mode)。这一功能让开发者彻底告别纯键盘输入,能通过自然语音快速下达指令,极大提升编程协
1 月 15 日,通义千问App宣布一次性上线超过 400 项全新功能,覆盖外卖订餐、酒店机票预订、淘宝购物、政务办事、财务分析、市场研究乃至一对一AI家教等多元场景——所有能力即刻向全体用户开放
多模态人工智能的商业化浪潮正加速席卷资本市场。1月12日,A股多模态AI概念板块强势爆发,焦点科技、易点天下、引力传媒、新华网、浙数文化等个股全线涨停,昆仑万维、中文在线、拓尔思、因赛集团、万兴科
在屏幕交互渐显疲态之际,科技巨头正集体转向一个更自然、更沉浸的交互范式——语音。据《The Information》最新披露,OpenAI已秘密整合多个工程、产品与研究团队,全力重构其音频AI系统
在智能手机创新见顶的当下,AI正成为破局关键。近日,中兴通讯与字节跳动联合打造的“豆包手机”引发行业高度关注。中兴内部人士向AIbase透露,选择字节跳动作为首发AI合作伙伴,源于双方对“AI手机