跨语言沟通正迎来一场技术范式的重塑。近日,谷歌发布了全新的音频模型 Gemini3.5Live Translate,旨在通过先进的实时语音到语音(Speech-to-Speech)技术,打破语言沟
字节跳动旗下火山引擎于5月6日宣布,豆包大模型家族正式迎来首款全模态理解模型——Doubao-Seed-2.0-lite。作为该系列的重磅升级版本,新模型彻底打破了单一模态的限制,实现了视频、图像
近日,谷歌为其 AI 助手 Gemini 推出了一项革命性的交互式图像生成功能。得益于底层的 Nano Banana 技术,Gemini 的可视化能力实现从“静态图像”向“动态交互模拟”的跨越。当
长视频理解的“深水区”终于迎来了权威评测标准。2026 年 3 月 2 日,由 与 联合提出的长视频多模态检索基准 LoVR (Long Video Retrieval) 正式宣布被国际顶级会议
在线教育领域正迎来一场关于“人机协作”的深度变革。 1 月 21 日,全球语言学习市场领军企业 Preply 宣布完成 1.5 亿美元的 D 轮融资。本轮融资由
近日,一款名为pad.ws的在线工具引发了广泛关注。这款工具将白板与代码编辑器无缝结合,为开发者、设计师和团队协作提供了全新的解决方案。 pad.ws 是一个运行于浏览器的开源工具,集成了电子白
近日,一款名爲pad.ws的在線工具引發了廣泛關注。這款工具將白板與代碼編輯器無縫結合,爲開發者、設計師和團隊協作提供了全新的解決方案。 pad.ws 是一個運行於瀏覽器的開源工具,集成了電子白
最近、pad.wsというオンラインツールが大きな注目を集めています。このツールはホワイトボードとコードエディターをシームレスに統合し、開発者、デザイナー、チームコラボレーションに全く新しいソリュー
字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任
最近一款名为Fogsight的AI动画引擎引发业内关注。这款工具通过输入简单概念词即可生成叙事完整、视觉效果出色的教学动画,为教育工作者和内容创作者提供了高效、便捷的解决方案。