字節跳動SeedチームはHugging Faceプラットフォーム上で、混合専門家(MoE)アーキテクチャに基づくオープンソースのマルチモーダルベースモデル「BAGEL」を発表しました。総パラメータ
グローバルなAI翻訳技術の急速な発展の背景で、初のアプリケーション指向型AI翻訳評価リスト「TransBench」が正式に公開されました。このリストは、アリインターナショナルAIビジネスチーム、上
Magentic-UI: 人間中心のAIウェブエージェントシステム マイクロソフトのBuild開発者カンファレンスで、同社はそのオープンソースプロジェクト「Magentic-U
最近、グーグルは人工知能の領域でまた新たな波を引き起こし、Gemmaモデルに基づく3つの新しいバリエーションを発表しました。それらはそれぞれメディカル、手話翻訳、イルカ言語研究の分野に特化しており
最近、通義大模型はCoGenAVを発表しました。これは音声と映像の同期というアイデアに基づいて音声認識技術を革新し、雑音干渉による問題を効果的に解決しています。 従来の音声認識技術はノイズ環境
論文をポスターに変換する多機能なツール「Paper2Poster」が学術界とAIコミュニティで熱い議論を巻き起こしています。このツールは自動化技術を活用し、複雑な学術論文を視覚的に明確で情報量の多
最近、AI分野で大きなニュースが飛び込んできました!中国のAIスタートアップであるDeepSeekは、そのオープンソースの大規模言語モデル「DeepSeek-R1-0528」の最新バージョンを正式
最近、グーグル(Google)はそのソーシャルメディアプラットフォーム上で、手話から音声テキストに変換できる新しい人工知能モデル「SignGemma」を予告しました。この革新は今年後半にオープンソ
最近、グーグル(Google)はそのソーシャルメディアプラットフォーム上で、手話から音聲テキストに変換できる新しい人工知能モデル「SignGemma」を予告しました。この革新は今年後半にオープンソ
アンカーグループのバーリン大規模モデルチームは最近開催されたアンカー技術デーで重大な決定を発表しました:マルチモーダル大規模モデル「Ming-lite-omni」を全面的にオープンソースにすること
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论