长上下文处理 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"长上下文处理"的内容

阿布扎TII发布Falcon H1R7B开源大模型 7亿参数打破越大越强传统

阿布扎TII发布Falcon H1R7B开源大模型 7亿参数打破越大越强传统

AI妹 5 个月前 19 0

阿布扎技术创新研究院（TII）近期推出了全新的开源大型语言模型 ——Falcon H1R7B。这款模型在维持紧凑的7亿参数规模的同时，展现了行业领先的推理性能，显著挑战了 “越大越强” 的传统观念

Falcon H1R7B 强化学习增强（GRPO） GPQA测试开源大型语言模型吞吐率

查看详情

智谱华章正式发布开源GLM-4.7大模型编码性能卓越居开源国产双榜首

智谱华章正式发布开源GLM-4.7大模型编码性能卓越居开源国产双榜首

AI妹 5 个月前 38 0

12月22日，北京智谱华章科技股份有限公司正式发布并开源其新一代旗舰大语言模型 GLM-4.7，在全球大模型竞争中再掀波澜，为开发者与研究人员带来全新选择。该模型在多项国际主流公开基准测试中表现卓

SWE-bench 代码生成 Code Arena 多轮对话一致性工具调用机制

查看详情

Ollama全面支持阿里通义千问Qwen3 丰富开源生态助力本地化部署

Ollama全面支持阿里通义千问Qwen3 丰富开源生态助力本地化部署

AI妹 5 个月前 17 0

Ollama官方宣布已全面支持阿里巴巴通义千问最新一代大语言模型系列——Qwen3。这一重要更新进一步丰富了Ollama的开源模型生态，为开发者、企业及AI爱好者提供了更强大的本地化部署选择，显著

长上下文处理数据隐私保护混合专家模型（MoE）模型量化多语言支持

查看详情

Ollama全面支持阿里Qwen3模型本地化部署高效性能出色

Ollama全面支持阿里Qwen3模型本地化部署高效性能出色

AI妹 5 个月前 21 0

Ollama官方宣佈已全面支持阿里巴巴通義千問最新一代大語言模型系列——Qwen3。這一重要更新進一步豐富了Ollama的開源模型生態，爲開發者、企業及AI愛好者提供了更強大的本地化部署選擇，顯著

开源模型生态通义千问 MoE 数学推理本地化部署

查看详情

阿里Qwen3：通义千问最新开源大模型，混合推理多模态全场景覆盖

阿里Qwen3：通义千问最新开源大模型，混合推理多模态全场景覆盖

AI妹 5 个月前 19 0

Qwen3是什么? 阿里Qwen3是通义千问系列的最新一代开源大语言模型（LLM），于2025年4月29日正式发布。作为全球首个支持“混合推理”的模型，Qwen3包含8款不同规模的模型，涵盖稠密

Qwen3-VL 阿里云PAI 开源大语言模型 Qwen3-Audio 强化学习

查看详情

阿里Qwen3：通义千问最新开源大模型混合推理多模態赋能全场景

阿里Qwen3：通义千问最新开源大模型混合推理多模態赋能全场景

AI妹 5 个月前 16 0

Qwen3是什麼? 阿里Qwen3是通義千問系列的最新一代開源大語言模型（LLM），於2025年4月29日正式發佈。作爲全球首個支持“混合推理”的模型，Qwen3包含8款不同規模的模型，涵蓋稠密

开源大语言模型长上下文处理 Apache2.0协议人类偏好对齐魔搭社区

查看详情

Hugging Face开源SmolLM3：3B参数性能直逼4B，多优势赋能多场景

Hugging Face开源SmolLM3：3B参数性能直逼4B，多优势赋能多场景

AI妹 5 个月前 15 0

近日，Hugging Face正式推出全新开源语言模型 SmolLM3，一款拥有3B参数的轻量级大语言模型（LLM），以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越

Ruler64k测试长上下文任务处理 SmolLM3 小型模型大能量全球化应用场景

查看详情

2025年主流开源大模型架构特点、技术差异与趋势深度解析

2025年主流开源大模型架构特点、技术差异与趋势深度解析

AI妹 5 个月前 22 0

近年來，大型語言模型（LLM）的快速發展推動了人工智能技術的邊界，特別是在開源領域，模型架構的創新成爲業界關注的焦點。AIbase綜合近期網絡信息，深入剖析了Llama3.2、Qwen3-4B、S

推理速度 DeepSeek-V3 Kimi-K2 多模态应用长上下文处理

查看详情

2025年主流开源大模型核心架构差异与技术趋势深度剖析

2025年主流开源大模型核心架构差异与技术趋势深度剖析

AI妹 5 个月前 19 0

近年来，大型语言模型（LLM）的快速发展推动了人工智能技术的边界，特别是在开源领域，模型架构的创新成为业界关注的焦点。AIbase综合近期网络信息，深入剖析了Llama3.2、Qwen3-4B、S

性能与效率平衡部署难度 MoE架构硬件要求上下文长度

查看详情

开发者遇Replit AI误删数据库事故平台反思后将推隔离恢复功能

开发者遇Replit AI误删数据库事故平台反思后将推隔离恢复功能

AI妹 5 个月前 18 0

近日，一位名叫 Jason 的开发者经历了一场令人瞠目结舌的 “删库” 事故，他的数据库在无预警的情况下被清空，令他感到无比沮丧。这场事故发生在 Jason 使用 Replit 的 Code

Replit Code Agent 单元测试错误 AI局限性一键恢复机制 B2B应用开发

查看详情



资讯姬

文章数量13543

总阅读量238.071k

总评论量0

会员数量2

本站由emlog驱动