关闭导航

包含标签"人机交互"的内容

谷歌发布Gemini Omni多模态AI模型 提升跨模态交互效率与实时性
AI妹 20 天前 1 0

谷歌在 5 月 19 日正式发布了其最新的 Gemini Omni 模型,标志着其在人工智能领域的一次重大突破。作为 Gemini 模型家族的最新成员,Gemini Omni 将多模态技术提升到了

AI智能眼镜行业爆发前夜 LetinAR光学模组突破成核心关键助力
AI妹 21 天前 2 0

想象一下:你正以 160 公里的时速骑摩托车飞驰,前方路面上突然「浮现」出一个导航箭头,精准指示转弯位置。没有手机、不用低头看仪表盘,所有信息都通过头盔里一枚拇指大小的镜片,自然融入你的视野。

Anthropic发布Claude电脑使用功能 可操作用户Mac实现深度代劳
AI妹 2 个月前 4 0

AI 助手正在从“只会对话”向“深度代劳”完成质变。 3月24日,据报道,人工智能初创公司 Anthropic 正式发布了其备受瞩目的 “电脑使用”(Computer

小米发布MiMo-V2-TTS语音合成大模型 实现情感共鸣与多风格表达
AI妹 2 个月前 5 0

语音合成技术正从“机械复读”向“情感共鸣”完成质的跨越。3月19日, 小米 正式发布自研语音合成大模型 Xiaomi MiMo-V2-TTS 。这不

马斯克xAI Grok Speech API上线 助力多模态交互发展
AI妹 2 个月前 5 0

在 AI 领域,马斯克的步伐从来不甘于人后。据最新报道, 马斯克 旗下的 AI 公司 xAI 宣布, Grok

Anthropic Claude Code推出语音模式 大幅提升开发者编程协作效率
AI妹 3 个月前 5 0

Anthropic旗下AI编程神器Claude Code迎来重磅更新——官方正式支持语音模式(Voice Mode)。这一功能让开发者彻底告别纯键盘输入,能通过自然语音快速下达指令,极大提升编程协

通义千问上线400项功能 超级AI智能体落地开启一站式服务新时代
AI妹 4 个月前 25 0

1 月 15 日,通义千问App宣布一次性上线超过 400 项全新功能,覆盖外卖订餐、酒店机票预订、淘宝购物、政务办事、财务分析、市场研究乃至一对一AI家教等多元场景——所有能力即刻向全体用户开放

多模态AI技术突破商业化加速 政策技术双驱资本市场掀强劲涨停潮
AI妹 4 个月前 18 0

多模态人工智能的商业化浪潮正加速席卷资本市场。1月12日,A股多模态AI概念板块强势爆发,焦点科技、易点天下、引力传媒、新华网、浙数文化等个股全线涨停,昆仑万维、中文在线、拓尔思、因赛集团、万兴科

OpenAI布局音频AI,2026推优先设备,语音引领下一代交互革命
AI妹 5 个月前 15 0

在屏幕交互渐显疲态之际,科技巨头正集体转向一个更自然、更沉浸的交互范式——语音。据《The Information》最新披露,OpenAI已秘密整合多个工程、产品与研究团队,全力重构其音频AI系统

中兴联合字节首发豆包手机 构建开放多元AI手机生态体系
AI妹 5 个月前 16 0

在智能手机创新见顶的当下,AI正成为破局关键。近日,中兴通讯与字节跳动联合打造的“豆包手机”引发行业高度关注。中兴内部人士向AIbase透露,选择字节跳动作为首发AI合作伙伴,源于双方对“AI手机