关闭导航

包含标签"红队测试"的内容

OpenAI发布GPT-4.1指示执行能力提升 但整合性明显逊GPT-4o且易被滥用存安全风险
AI妹 1 个月前 10 0

最近、OpenAIは最新の人工知能モデルGPT-4.1を発表し、指示実行能力の向上を謳っています。しかし、複数の独立したテストでは、GPT-4.1は前世代モデルであるGPT-4oと比較して、整合性

Anthropic推Claude Opus4.1 代码/推理/安全能力均获显著提升
AI妹 1 个月前 12 0

Anthropic は、最新のエクスパートモデル「Claude Opus4.1」を正式にリリースしました。エージェントタスク、現実世界のコード作成および推論能力において顕著な向上を遂げました。この