关闭导航

包含标签"长上下文处理"的内容

阿布扎TII发布Falcon H1R7B开源大模型 7亿参数打破越大越强传统
AI妹 13 天前 6 0

阿布扎技术创新研究院(TII)近期推出了全新的开源大型语言模型 ——Falcon H1R7B。这款模型在维持紧凑的7亿参数规模的同时,展现了行业领先的推理性能,显著挑战了 “越大越强” 的传统观念

智谱华章正式发布开源GLM-4.7大模型 编码性能卓越居开源国产双榜首
AI妹 26 天前 10 0

12月22日,北京智谱华章科技股份有限公司正式发布并开源其新一代旗舰大语言模型 GLM-4.7,在全球大模型竞争中再掀波澜,为开发者与研究人员带来全新选择。该模型在多项国际主流公开基准测试中表现卓

Ollama全面支持阿里通义千问Qwen3 丰富开源生态助力本地化部署
AI妹 1 个月前 8 0

Ollama官方宣布已全面支持阿里巴巴通义千问最新一代大语言模型系列——Qwen3。这一重要更新进一步丰富了Ollama的开源模型生态,为开发者、企业及AI爱好者提供了更强大的本地化部署选择,显著

Ollama全面支持阿里Qwen3模型 本地化部署高效性能出色
AI妹 1 个月前 12 0

Ollama官方宣佈已全面支持阿里巴巴通義千問最新一代大語言模型系列——Qwen3。這一重要更新進一步豐富了Ollama的開源模型生態,爲開發者、企業及AI愛好者提供了更強大的本地化部署選擇,顯著

阿里Qwen3:通义千问最新开源大模型,混合推理多模态全场景覆盖
AI妹 1 个月前 11 0

Qwen3是什么? 阿里Qwen3是通义千问系列的最新一代开源大语言模型(LLM),于2025年4月29日正式发布。作为全球首个支持“混合推理”的模型,Qwen3包含8款不同规模的模型,涵盖稠密

阿里Qwen3:通义千问最新开源大模型 混合推理多模態赋能全场景
AI妹 1 个月前 8 0

Qwen3是什麼? 阿里Qwen3是通義千問系列的最新一代開源大語言模型(LLM),於2025年4月29日正式發佈。作爲全球首個支持“混合推理”的模型,Qwen3包含8款不同規模的模型,涵蓋稠密

Hugging Face开源SmolLM3:3B参数性能直逼4B,多优势赋能多场景
AI妹 1 个月前 8 0

近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越

2025年主流开源大模型架构特点、技术差异与趋势深度解析
AI妹 1 个月前 13 0

近年來,大型語言模型(LLM)的快速發展推動了人工智能技術的邊界,特別是在開源領域,模型架構的創新成爲業界關注的焦點。AIbase綜合近期網絡信息,深入剖析了Llama3.2、Qwen3-4B、S

2025年主流开源大模型核心架构差异与技术趋势深度剖析
AI妹 1 个月前 10 0

近年来,大型语言模型(LLM)的快速发展推动了人工智能技术的边界,特别是在开源领域,模型架构的创新成为业界关注的焦点。AIbase综合近期网络信息,深入剖析了Llama3.2、Qwen3-4B、S

开发者遇Replit AI误删数据库事故 平台反思后将推隔离恢复功能
AI妹 1 个月前 9 0

近日,一位名叫 Jason 的开发者经历了一场令人瞠目结舌的 “删库” 事故,他的数据库在无预警的情况下被清空,令他感到无比沮丧。 这场事故发生在 Jason 使用 Replit 的 Code