Skip to content

模型选择指南

本文档将帮助您了解 NekroAgent 中的不同场景下最适合使用的模型,并提供详细的性能、价格和适用性分析。目前主要提供 NekroAgent 官方中转 供应的模型选择信息,后续会逐步增加其他来源模型。

评级说明

在推荐模型中,我们使用以下评级标准:

评级对应等级说明
👑⭐⭐⭐⭐⭐极佳
🥇⭐⭐⭐⭐优秀
🥈⭐⭐⭐良好
🥉⭐⭐一般
较差

注意

以下推荐结果仅供参考,不同来源的相同模型可能因渠道转化策略、配置设定不同、并发情况、即时状态等原因,其最终性能可能存在差异,我们鼓励您根据实际使用情况多方尝试包括不在以下表单中的模型,选择最适合您的模型!

以下量表中的模型来自 NekroAgent 官方中转 - 可用模型列表,如果您认为以下量表与实际体验有较大差异,欢迎联系我们反馈,我们将持续维护并更新量表以更符合实际体验

部分模型 弃用 & 停用 请查看 模型弃用

NekroAgent 主应用

聊天对话流程

NekroAgent 的聊天会话流程 (不包括插件功能) 主要受到三个配置项影响,分别是 主模型组(USE_MODEL_GROUP)调试/Agent 迁移模型组(DEBUG_MIGRATION_MODEL_GROUP)备用模型组(FALLBACK_MODEL_GROUP),具体调度策略为:

  1. 一次对话流程开始时,先使用 主模型组 中的模型进行生成
  2. 主模型组 生成的代码触发了 Agent 类型方法,或者产生程序报错时,本次流程的后续调用均使用 调试/Agent 迁移模型组 中的模型进行迭代
  3. 如果 主模型组调试/Agent 迁移模型组 任一模型调用失败,则使用 备用模型组 中的模型进行生成
  4. 如果 备用模型组 也调用失败,则本次响应流程以失败结束

以下是 聊天对话流程 中推荐使用的模型列表:

本列表更新 2026 年 4 月 18 日

模型名称质量速度稳定性价比视觉内置思维备注
claude-4-5-sonnet-latest👑🥈🥈🥈👁️Anthropic 的最新主力模型,综合能力最强但供应有限,适合主力模型
gemini-3.1-pro-preview👑🥈🥇🥉👁️🧠谷歌 3.1 代高质量主力模型,目前性能最顶尖,支持思考签名和思考等级 ⚠️ 预览版模型
gemini-3-flash-preview🥇🥇🥇👑👁️综合体验极佳的平衡型模型,速度快且逻辑能力强,建议作为主力模型使用
gemini-2.5-pro🥇🥇🥇🥈👁️🧠逻辑能力稳定,具备自适应思考能力 ⚠️ 预计于 2026 年 6 月 17 日停用
gpt-4.1🥇🥈🥇🥈👁️GPT 系列较新主力模型,AI 特征较明显,逻辑能力尚可
gemini-3.1-flash-lite-preview🥈👑🥇👑👁️极速小模型,推理成本极低,适合简单任务或快速迭代 ⚠️ 预览版模型
claude-4-5-haiku🥈🥇🥇🥉👁️Anthropic 的快速模型,适合对生成风格有特定要求的场景
gemini-2.5-flash🥇🥇🥇👑👁️性价比较高,即将被 gemini-3-flash 替代 ⚠️ 预计于 2026 年 6 月 17 日停用
deepseek-chat (v3)🥇🥉🥇🥈经典的国产模型、中文能力优秀、语言风格鲜明
doubao-1.5-vision-pro-32k-250115🥈🥈👑🥈👁️字节提供的国产模型、稳定性极佳、多模态能力强、适合备用模型
gemini-2.0-flash🥈👑🥇🥇👁️极低成本的小模型 ⚠️ 预计于 2026 年 6 月 1 日停用
gpt-4o🥇🥈🥇🥈👁️生产力场景常用模型,API 稳定性高
gpt-4o-mini🥈🥈🥇🥇👁️经典的 GPT 系列小模型
grok-3🥈🥈🥇🥉👁️xAI 推出的语言模型,个性鲜明,AI 味较低

注意:

  • 在 NekroAgent 中对话流程首次使用的模型 (一般是主模型) 的 外置思维链 开关会影响到后续本次对话流程的思维链使用情况,例如主模型开启 外置思维链,迭代/调试模型也会产生 开启外置思维链 的效果
  • 通常来说支持 内置思维 的模型不推荐开启 外置思维链,否则可能会降低模型生成速度
  • 由于提示词迭代机制实现,不推荐混用 支持视觉不支持视觉 的模型,否则可能导致请求格式出错

插件开发

NekroAgent 的 插件编辑器 中的生成修改建议模型使用 插件代码生成模型组(PLUGIN_GENERATE_MODEL_GROUP),用来为用户的需求生成代码解决方案,推荐使用强编码能力、高质量的模型,以下是推荐模型列表:

模型名称质量速度稳定性价比视觉思维备注
claude-4-5👑🥈🥈🥈👁️🧠Anthropic 的最新高质量主力编码模型
gemini-3.1-pro-preview👑🥈🥇🥉👁️🧠谷歌最新一代主力模型,编程领域表现极佳,逻辑极其严密 ⚠️ 预览版模型
gemini-2.5-pro🥇🥇🥇🥈👁️🧠经典主力模型,编程能力稳定,支持自适应思考 ⚠️ 预计于 2026 年 6 月 17 日停用

在生成模型生成修改建议后,我们还需要通过 插件代码应用模型组(PLUGIN_APPLY_MODEL_GROUP) 来在当前插件编辑器中应用修改建议,推荐使用强提示词遵循能力、生成速度快的模型,以下是推荐模型列表:

模型名称质量速度稳定性价比视觉思维备注
gemini-3-flash-preview🥇👑🥇👑👁️推荐的快速逻辑应用模型
gemini-2.5-flash🥈👑🥇🥈👁️⚠️ 预计于 2026 年 6 月 17 日停用

内置插件

表情包插件

表情包插件需要使用一个 向量嵌入模型 来提供表情包搜索能力,强烈建议使用 text-embedding-v3 模型:

模型名称质量速度稳定性价比视觉维度备注
text-embedding-v3👑👑👑👑1024阿里云提供的非常便宜且高效的文本嵌入模型
multimodal-embedding-v1👑🥇👑👑1024阿里云提供的多模态嵌入模型,但对输入限制较多,仅推荐特殊用途使用

绘图 (学会画画)

绘图插件支持 OpenAI 标准绘图 API (例如 DALL-E 3) 和任意支持对话生成图像的 OpenAI 聊天补全 API,以下是推荐模型列表:

模型名称质量速度稳定性价比图生图格式备注
gemini-3.1-flash-image-preview👑🥇🥇🥇聊天模式Gemini 3.1 绘图模型,具备极高的理解能力与视觉质量
gemini-3-pro-image-preview👑🥇🥈🥉聊天模式Gemini 3 旗舰绘图模型,细节表现丰富
sora_image🥇🥇🥈聊天模式与 ChatGPT 官网 4o 绘图一致,逻辑遵循好但速度较慢
Kolors🥈👑👑🥇图像生成模式国内经典绘图模型,适合 CG 风格任务

注意事项

  1. 模型性能可能会随时间更新而变化
  2. 价格信息仅供参考,实际价格请以官方报价为准
  3. 建议根据实际使用情况定期评估模型选择
  4. 实验性模型(exp/preview):这些模型为实验性质,可能随时更新或关闭,建议:
    • 定期关注 Google Gemini API 版本说明 获取最新更新
    • 生产环境使用时应准备备用方案
    • 优先考虑使用稳定版(GA)模型
    • 部分预览版模型会自动重定向到稳定版,建议直接使用稳定版模型名称以避免重定向带来的延迟
  5. 模型重定向:部分已关闭的预览版模型会自动重定向到对应的稳定版,例如:
    • gemini-3-pro-previewgemini-3.1-pro-preview
    • gemini-2.5-flash-image-previewgemini-3.1-flash-image-preview
    • gemini-2.5-pro-preview-06-05gemini-2.5-pro

重要提示

在使用任何生成式人工智能服务时,请务必注意遵守相关服务条款和法律法规