Hugging Face推出的SmolVLM多模態模型迎來重大突破:通過WebGPU技術,SmolVLM現可在瀏覽器中實現實時網絡攝像頭圖像識別,無需服務器支持,全部計算在用戶設備上完成。這一創新
A major breakthrough has been achieved by SmolVLM, a multimodal model introduced by Hugging Face:
Xiaomi's large model team announced the open source of the latest multimodal large model Xiaomi Mi
小米大模型团队宣布开源最新一代多模态大模型 Xiaomi MiMo-VL-7B-2508,包含 RL 与 SFT 两个版本。 官方数据显示,新版模型在学科推理、文档理解、图形界面定位及视频理解四
小米のマルチモーダル大規模モデルチームは、最新のマルチモーダル大規模モデル「Xiaomi MiMo-VL-7B-2508」をオープンソース化したことを発表しました。このモデルにはRLとSFTの2つ
アリババグループのQwenチームは、新しい好みモデリングモデルシリーズ「WorldPM」を発表しました。このシリーズには、「WorldPM-72B」とその派生版「WorldPM-72B-HelpS
阿里巴巴旗下Qwen团队宣布推出全新偏好建模模型系列——WorldPM,包括WorldPM-72B及其衍生版本WorldPM-72B-HelpSteer2、WorldPM-72B-RLHFLow和
小米大模型團隊宣佈開源最新一代多模態大模型 Xiaomi MiMo-VL-7B-2508,包含 RL 與 SFT 兩個版本。 官方數據顯示,新版模型在學科推理、文檔理解、圖形界面定位及視頻理解四
阿里巴巴旗下Qwen團隊宣佈推出全新偏好建模模型系列——WorldPM,包括WorldPM-72B及其衍生版本WorldPM-72B-HelpSteer2、WorldPM-72B-RLHFLow和
近日,KittenML 團隊在 Hugging Face 平臺上發佈了其新款開源文本轉語音模型 ——Kitten TTS。這一模型的設計目標是實現高質量的語音合成,同時保持輕量級和高效能,適合在各