AI 产品定价策略
面向专业产品经理的完整定价框架,覆盖从成本结构、计费模型、免费层设计到企业化商业策略的关键决策点。
更新说明:本文按 2026-05-15 的公开价格与行业实践重写了行业案例。AI 产品价格、模型名、使用额度变化很快,涉及具体美元价格的内容只应作为当期参考,落地前必须以各产品官网为准。
目录
1. AI 产品定价的独特性
1.1 可变成本主导 vs 固定成本主导
传统 SaaS 的定价逻辑建立在 “高固定成本 + 边际成本趋近于零” 之上。一旦软件开发完成,每增加一个用户的边际成本通常较低,这使得传统 SaaS 可以采用较激进的免费增值策略。
AI 产品则不完全适用这个假设。每一次模型推理、图像生成、语音转写、Agent 工具调用都可能消耗真实算力,边际成本 不为零,且会随模型能力、上下文长度、输出长度、并发需求、工具链复杂度上升。
| 维度 | 传统 SaaS | AI 产品 |
|---|---|---|
| 成本结构 | 高固定成本,低边际成本 | 高固定成本 + 高可变成本 |
| 边际成本趋势 | 随规模摊薄 | 随 token、任务、Agent 步骤线性或阶梯增长 |
| 定价弹性 | 免费层可较慷慨 | 免费层必须强控成本与滥用 |
| 单位经济学 | 用户数 / 席位数 | token、图片、音视频分钟、工具调用、Agent 运行 |
| 利润天花板 | 主要取决于获客与留存 | 同时受推理成本、模型路由、限额设计约束 |
核心洞见:AI 产品经理必须像运营一个“有制造成本的数字产品”一样思考定价。你卖的每一次回答、每张图、每段代码、每个 Agent 运行,都有真实成本。
1.2 从“三边约束”到“四边约束”
AI 产品定价不再只是“用户愿意付多少钱”的问题,而是一个多约束优化问题:
┌──────────────┐
│ 用户支付意愿 │
└──────┬───────┘
│
┌────────────┼────────────┐
│ │ │
▼ ▼ ▼
┌──────────┐ ┌──────────┐ ┌──────────┐
│ 模型成本 │ │ 产品价值 │ │ 竞品锚点 │
└────┬─────┘ └────┬─────┘ └────┬─────┘
│ │ │
└────────────┼────────────┘
▼
┌──────────────┐
│ 风险与合规成本 │
└──────────────┘四个关键约束分别是:
- 用户支付意愿:目标用户愿意为 AI 能力多付多少钱?是个人订阅、团队预算,还是企业采购预算?
- 模型与算力成本:输入、输出、缓存、图像、音频、工具调用、Agent 步数分别消耗多少?
- 产品价值感知:用户为“省时间、提质量、降风险、增收入”付费,而不是为 token 付费。
- 竞争与合规成本:竞品价格形成锚点,企业客户还会为安全、审计、数据隔离、SLA 支付溢价。
1.3 成本透明度悖论
AI 产品有一个特殊矛盾:
- 完全隐藏成本:用户不知道每次请求的成本,容易过度使用,导致产品必须限流、降速或降低模型质量。
- 完全暴露成本:用户看到 token、credit、GPU 分钟后,可能变得“抠门”,不敢充分使用 AI,反而降低产品价值感。
因此,现代 AI 产品越来越常用 “用户看得懂的配额单位”:
| 用户看到的单位 | 背后可能对应的成本 |
|---|---|
| 消息 / 次数 | token + 输出长度 + 工具调用 |
| AI credits | token、模型等级、工具调用、Agent 步骤的抽象封装 |
| Fast GPU hours | 图片/视频生成的 GPU 时间 |
| Premium requests | 高级模型调用、长上下文、复杂任务 |
| Agent runs | 多步骤推理 + 检索 + 工具执行 + 写回动作 |
1.4 2026 年以后更重要的新变量:Agent 成本
早期 AI 产品主要按“单次聊天”或“单次生成”计算成本。现在 Agent 产品会连续执行多个步骤:检索资料、读数据库、调用工具、写文档、发通知、生成代码、跑测试。
这意味着成本从:
一次请求成本 = 输入 token + 输出 token变成:
一次 Agent 成本 = 多轮模型调用 + 检索成本 + 工具调用成本 + 写入/执行成本 + 失败重试成本因此,Agent 产品定价不应简单承诺“无限使用”,而应设计为:
- 订阅费覆盖基础使用;
- included usage 覆盖正常工作量;
- 超额用 credit / usage-based billing;
- 企业客户可购买承诺用量、池化额度、私有部署或专属容量。
2. 主要定价模式详解
2.1 按 Token / 用量计费 (Usage-Based Pricing)
适用场景:API、开发者平台、模型服务、企业后台批处理、可量化消耗的 AI 基础设施。
典型代表:OpenAI API、Claude API、Google Gemini API、各类模型网关。
优点:
- 收入与成本天然对齐;
- 对开发者透明,便于成本核算;
- 低门槛进入,适合按需扩展。
缺点:
- 用户难以预测账单;
- 用户可能抑制使用;
- ARR 预测不如席位订阅稳定;
- 对 C 端用户理解门槛高。
设计要点:
| 参数 | 策略 | 注意事项 |
|---|---|---|
| 输入 / 输出分价 | 输出通常更贵 | 长回答、代码生成、报告生成成本高 |
| 缓存输入 | 对重复上下文降价 | 适合知识库、代码库、长上下文应用 |
| 批处理 / 慢速模式 | 低价换延迟 | 适合离线任务、非实时场景 |
| 数据驻留 / 区域处理 | 溢价 | 企业合规需求强时可单独收费 |
| 用量上限 | 硬上限 + 告警 | 避免账单冲击 |
| 预付费 / 承诺消费 | 换取折扣 | 提高收入确定性 |
定价公式参考:
单次请求成本 = 输入 token × 输入单价
+ 缓存输入 token × 缓存单价
+ 输出 token × 输出单价
+ 工具 / 图像 / 音频等额外成本
月账单 = Σ(所有请求成本) + 固定订阅费(如有)实战案例:OpenAI API 成本估算(2026-05)
以一次典型对话为例:10 轮来回,每轮约 500 输入 token + 200 输出 token。
总输入 = 10 × 500 = 5,000 token
总输出 = 10 × 200 = 2,000 token按 OpenAI 公布的标准处理价,GPT-5.4 为 $2.50 / 1M 输入 token、$15 / 1M 输出 token;GPT-5.4 mini 为 $0.75 / 1M 输入 token、$4.50 / 1M 输出 token;GPT-5.5 为 $5 / 1M 输入 token、$30 / 1M 输出 token。
| 模型 | 输入成本 | 输出成本 | 单会话估算 |
|---|---|---|---|
| GPT-5.4 mini | 5,000 × $0.75 / 1M = $0.00375 | 2,000 × $4.50 / 1M = $0.009 | $0.01275 |
| GPT-5.4 | 5,000 × $2.50 / 1M = $0.0125 | 2,000 × $15 / 1M = $0.03 | $0.0425 |
| GPT-5.5 | 5,000 × $5 / 1M = $0.025 | 2,000 × $30 / 1M = $0.06 | $0.085 |
如果每月 100 万活跃用户,每人每月 100 次这样的会话:
GPT-5.4 mini: 100M 会话 × $0.01275 ≈ $1.275M / 月
GPT-5.4: 100M 会话 × $0.0425 ≈ $4.25M / 月
GPT-5.5: 100M 会话 × $0.085 ≈ $8.5M / 月这解释了为什么 C 端免费层必须依赖小模型、缓存、限额、降速与模型路由,而不能让所有用户无限使用最贵模型。
2.2 按席位订阅 (Per-Seat Subscription)
适用场景:AI 是工作流增强能力,用户按人购买,尤其适合企业协作工具、办公套件、知识库、代码 IDE。
典型代表:ChatGPT Business、Claude Team、Microsoft 365 Copilot Business、GitHub Copilot Business、Cursor Teams。
优点:
- 收入稳定,方便企业采购;
- 用户不需要理解 token;
- 便于和权限、审计、团队管理、安全功能打包。
缺点:
- 重度用户可能让成本失控;
- 轻度用户会觉得不值;
- 席位价必须和 included usage、超额计费配合。
定价计算公式:
目标席位价 = 预期月均推理成本 / (1 - 目标毛利率)
例:
如果一个席位月均推理成本为 $5,目标毛利率 70%,
目标席位价 = $5 / (1 - 70%) = $16.67现实中,越来越多 AI SaaS 不是纯席位订阅,而是:
席位订阅费 + 包含用量 + 超额按量 / credits + 企业治理能力2.3 按任务 / 输出计费 (Output-Based Pricing)
适用场景:输出物边界清晰,用户能直观看到结果价值。
典型代表:图片生成、视频生成、语音转写、自动报告、代码审查、数据分析任务、后台 Agent 运行。
优点:
- 用户为“结果”付费,而不是为 token 付费;
- 定价更容易理解;
- 适合包装成 credit、任务包、GPU 时间包。
缺点:
- “一次任务”的边界难定义;
- 失败重试、反复修改会放大成本;
- 需要防止自动化滥用和并发刷量。
设计要点:
| 任务类型 | 常见定价单位 | 成本控制 |
|---|---|---|
| 文生图 | 张数、GPU 分钟、Fast hours | 并发限制、队列优先级、Relax 模式 |
| 视频生成 | 秒 / 分钟、分辨率、队列等级 | 分辨率限制、生成时长限制 |
| 代码生成 | premium requests、agent runs、AI credits | 高级模型限额、项目级用量池 |
| 自动报告 | 报告份数、数据量、刷新频率 | 数据行数、上下文长度、缓存 |
| Agent 自动化 | run、step、credit | 步骤上限、工具白名单、失败重试上限 |
| 语音 / 转写 | 分钟数、字符数 | 批处理、低优先级队列 |
2.4 混合模式:订阅 + 用量 + 免费层
这是 2026 年最常见的 AI 产品定价结构:
免费层:基础模型 + 限额 + 慢速 / 低优先级
入门层:固定月费 + 更多消息 / 更多上传 / 更多模型
专业层:更强模型 + 更长上下文 + 更多 Agent / Codex / Deep Research 用量
团队层:席位 + 管理后台 + SSO + 数据保护 + 团队上下文
企业层:自定义报价 + 用量承诺 + 审计 + 合规 + 私有化 / 专属容量混合模式的关键思想:
- 对轻度用户:固定订阅让用户买“安心”;
- 对重度用户:用量或 credit 防止成本失控;
- 对企业用户:治理、安全、合规、数据连接能力本身就是价值;
- 对平台方:通过模型路由、缓存、批处理、队列优先级来管理毛利率。
3. 定价决策框架:四维分析表
3.1 四维矩阵
| 维度 | 子问题 | 对定价的影响 |
|---|---|---|
| 1. 产品类型 | 核心 AI 产品还是 AI 辅助功能? | 核心 → 用量 / 任务 / 订阅混合;辅助 → 捆绑 / 席位 |
| 2. 用户群体 | 开发者、知识工作者、创作者、大众消费者、企业? | 开发者 → API 用量;知识工作者 → 席位;创作者 → 任务包;企业 → 合约 |
| 3. 使用频率 | 高频低价值还是低频高价值? | 高频 → 订阅 + 限额;低频 → 按次 / credit |
| 4. 成本结构 | 推理成本、工具调用、数据连接、合规成本占比如何? | 成本高 → 严控免费层;成本低 → 可扩大免费体验 |
3.2 决策树
[产品类型]
│
├── AI 原生产品
│ ├── C 端助手 → Freemium + Plus/Pro + usage caps
│ ├── 开发者 API → Token / 用量计费 + 承诺消费
│ ├── 创作工具 → 任务 / GPU 时间 / credits
│ └── Agent 平台 → 席位 + Agent runs / credits
│
└── AI 辅助功能
├── 企业工具 → 席位订阅 + 管理 / 安全 / 合规
├── 办公套件 → 原有订阅加购 / 高级层打包
└── 垂直 SaaS → 按业务价值打包进套餐3.3 定价策略速查表
| 场景画像 | 定价建议 | 参考月费 / 计费方式 | 毛利率关注点 |
|---|---|---|---|
| 大众聊天助手 | Freemium + Plus/Pro | $20 / $100 / $200 常见锚点 | 重度用户成本与限额 |
| 编程助手 | 免费层 + 个人订阅 + 团队席位 + 高级模型限额 | $10-40/人/月 + 超额 | Agent 与高级模型成本 |
| 企业知识库 AI | 席位 + 数据连接 + 企业安全 | $20-100+/席位/月 | 检索、上下文、合规成本 |
| 图像生成 | GPU 时间 / credits + 订阅 | $10-120/月 | 并发、队列、失败重试 |
| API 服务 | 纯用量 + 承诺消费 | 按 1M token / 分钟 / 图片 | 模型成本、缓存命中率 |
| 垂直 AI Agent | 订阅 + 每任务 / 每结果 | $5-200/任务或按月打包 | 工具调用与人工替代价值 |
4. 免费层设计
4.1 免费额度给多少?
免费层的目标不是“越慷慨越好”,而是:
让用户完成 1-3 个完整工作流,并体验到核心价值,同时把单位经济学控制在可承受范围内。不要在文档里写死“每天 X 条 GPT-4o / Claude 多少条”这样的额度,因为模型和限额变化极快。更稳妥的写法是:
| 产品类型 | 免费层目标 | 推荐限制方式 |
|---|---|---|
| 聊天助手 | 让用户完成若干次真实问题求解 | 低成本模型 + 动态消息上限 + 高峰限流 |
| 编程助手 | 体验补全、问答、一次简单 agent 任务 | 补全限额 + 高级模型请求限额 |
| 图像生成 | 生成 1-3 张满意作品 | 低速队列 + 水印 / 分辨率限制 |
| 企业知识库 | 让团队完成一个小型知识库问答试点 | 限文档数、成员数、检索次数 |
| Agent 自动化 | 体验一次自动化闭环 | 限 run 数、step 数、触发频率 |
免费层成本估算公式:
免费用户月成本 = 日均请求数 × 30 × 单次平均成本
+ 文件 / 图像 / 工具调用成本
+ 滥用与失败重试成本示例:
如果免费用户每天 10 次低成本模型请求,单次成本 $0.001:
月成本 = 10 × 30 × $0.001 = $0.30 / 用户 / 月
如果有 100 万免费活跃用户:
月成本 = $300,000如果单次成本从 $0.001 上升到 $0.01,月成本会直接变成 $3,000,000。因此,免费层必须优先做模型路由与成本保护。
4.2 免费层的成本控制策略
| 策略 | 描述 | 效果 |
|---|---|---|
| 模型路由 | 简单任务走小模型,复杂任务走强模型 | 降低整体平均成本 |
| 动态限额 | 根据负载、账号信誉、历史行为调整额度 | 平衡体验与成本 |
| 高峰降级 | 高峰时免费用户排队或慢速响应 | 平滑 GPU 负载 |
| 输出长度限制 | 限制免费层输出 token | 控制最贵的输出成本 |
| 上下文窗口限制 | 免费层减少历史上下文和文件大小 | 降低输入与检索成本 |
| 缓存优先 | 高频问题、模板回答、公开知识优先缓存 | 降低重复请求成本 |
| 滥用检测 | 限制批量注册、脚本刷量、自动化调用 | 防止成本被攻击 |
| Agent step 上限 | 限制工具调用次数与重试次数 | 控制 Agent 成本尾部风险 |
4.3 从免费到付费的转换设计
转换触发点:
- 额度触达:你今天的高级模型 / Agent / 图片额度已用完。
- 质量对比:付费层提供更强模型、更长上下文、更稳定响应。
- 时间对比:付费用户高峰期优先队列。
- 工作流锁定:用户把项目、文档、团队知识库、自动化流程放进产品后,迁移成本上升。
- 团队扩展:个人试用后,需要多人协作、权限、审计、共享上下文。
典型转化漏斗:
注册用户: 100%
├─ 首次价值体验: 40-60%
│ ├─ 7 日留存: 20-30%
│ │ ├─ 触达限制 / 高级需求: 10-15%
│ │ │ ├─ 付费转化: 2-5%
│ │ │ └─ 暂停 / 流失: 8-12%
│ │ └─ 低频继续免费: 10-15%
│ └─ 未留存: 20-30%
└─ 未激活: 40-60%A/B 测试重点:
- 免费额度:低额度高转化 vs 高额度高留存;
- 限制策略:锁死、慢速、降模型、看广告、购买 credit;
- 付费墙文案:强调“更强模型”还是“完成任务”;
- 套餐结构:Plus / Pro / Team 是否形成清晰升级路径。
5. 企业定价策略
5.1 企业定价维度
| 维度 | C 端 | B 端 / 企业 |
|---|---|---|
| 定价模式 | 月付订阅 / credits | 席位 + 用量 + 合同承诺 |
| 合同周期 | 月付为主 | 年付,常见 1-3 年 |
| 价格锚点 | $20-$200/月 | $10K-$500K+/年 |
| 采购决策者 | 个人 | IT、财务、法务、业务负责人 |
| 关注点 | 体验、功能、价格 | ROI、安全、合规、SLA、数据控制 |
| 谈判空间 | 小 | 大,尤其是多席位与承诺消费 |
5.2 企业版常见收费项
企业客户购买的不只是“更高额度”,还包括治理与风险降低能力:
| 收费项 | 价值 |
|---|---|
| SSO / SCIM | 身份统一、入离职管理 |
| 审计日志 | 安全追踪、合规检查 |
| 数据保留策略 | 满足内部合规与监管要求 |
| 零训练承诺 / 数据隔离 | 降低数据泄露和模型训练风险 |
| 管理后台 | 控制模型、插件、连接器、使用权限 |
| 用量分析 | 控制成本,衡量 ROI |
| SLA / 专属支持 | 提高业务连续性 |
| 私有部署 / 专属容量 | 高敏数据、本地化、低延迟、稳定容量 |
5.3 私有部署与专属容量溢价
企业客户可能要求私有云、本地部署、专属 GPU、数据驻留或区域处理。这类需求会显著提高交付成本。
定价策略参考:
私有部署 / 专属容量价格 = SaaS 等价价格 × 1.5 - 3.0
+ 一次性实施费
+ 年度运维 / 支持费加价理由:
- 专属算力占用;
- 部署、监控、升级、故障响应;
- 安全与合规评估;
- 定制连接器与内部系统集成;
- SLA 与客户成功成本。
5.4 企业用量折扣
| 月消费 / 承诺用量 | 常见策略 | 适用对象 |
|---|---|---|
| < $1K | 标准价 | 小团队、实验项目 |
| $1K-$10K | 小幅折扣 / 技术支持 | 中型团队 |
| $10K-$100K | 阶梯折扣 + 客户成功 | 大型企业部门 |
| $100K+ | 协商价 + 专属容量 / 私有部署 | 集团级客户 |
5.5 长期合同设计
1 年合同:换取 10-20% 折扣
2 年合同:换取 20-30% 折扣
3 年合同:换取 30%+ 折扣,但建议绑定最低用量承诺与价格重估条款AI 模型成本和能力变化很快,长期合同最好加入:
- 模型升级条款;
- 用量超额计费规则;
- 价格重估窗口;
- 数据保护与审计责任;
- 供应商模型替换机制;
- 最低可用 SLA 和故障赔偿。
6. 真实行业参考(2026-05)
注意:本章只作为“定价结构参考”,不要把具体价格写进长期不维护的产品文档中。推荐在正文使用“截至 2026-05”这样的时间标注,并在文末保留官网来源。
6.1 OpenAI / ChatGPT:从固定订阅走向多层额度与 flexible usage
| 维度 | 分析 |
|---|---|
| 用户侧订阅 | ChatGPT 仍采用 Free / Go / Plus / Pro / Business / Enterprise 分层。Plus 仍是 $20/月锚点,Pro 分为更高使用量层级。 |
| 模型口径 | 不应再写 GPT-4o 或 GPT-4.1 作为 ChatGPT Plus 主能力;截至 2026-05,Plus 的核心卖点已经转向 GPT-5.5 limits、GPT-5.5 Thinking、Deep Research、Codex 等。 |
| API 计费 | API 仍按 token 计费,并区分输入、缓存输入、输出、批处理、优先处理等。 |
| 定价逻辑 | C 端用订阅做心理锚点,B 端和 API 用 flexible pricing / usage-based pricing 控制成本。 |
| PM 洞察 | 不要把“具体模型名 + 无限使用”写死,应该写“高级模型额度、推理模式、工具额度随套餐提升”。 |
关键洞察:ChatGPT 的定价已经不是简单的“$20 无限聊天”,而是 订阅层级 + 高级模型额度 + 工具额度 + flexible usage 的组合。
6.2 Anthropic / Claude:Pro、Max、Team、Enterprise 与 API 并存
| 维度 | 分析 |
|---|---|
| 个人版 | Claude Pro 为日常生产力;Max 面向重度用户,提供 5x / 20x 使用量层级。 |
| 团队版 | Team 面向 5-150 人团队,分标准席位和高级席位。 |
| 企业版 | Enterprise 采用席位价 + usage at API rates,更明确地把“使用量成本”暴露给企业客户。 |
| API 计费 | Opus、Sonnet、Haiku 按 MTok 计费,且有 prompt caching write/read 价格。 |
| PM 洞察 | “无限使用”是危险表述,应改成“更高用量、限额适用、重度用户可升级”。 |
关键洞察:Claude 的定价越来越清晰地把“人均订阅”和“真实模型消耗”拆开,适合企业采购时做成本归因。
6.3 Microsoft 365 Copilot:办公套件加购 + Chat 免费入口 + Agent 计量
| 维度 | 分析 |
|---|---|
| 免费入口 | Microsoft 365 Copilot Chat 对符合条件的 Microsoft 365 商业 / 企业客户提供,无额外费用。 |
| 付费层 | Microsoft 365 Copilot Business 作为 Business 订阅的 add-on,需要符合条件的 Microsoft 365 许可证。 |
| Agent 计费 | 自定义 Agent 可按 metered basis 使用,Azure / Copilot Studio 容量可能参与计费。 |
| 模型口径 | 页面已强调使用最新 OpenAI models,而不是旧的 GPT-4o 口径。 |
| PM 洞察 | 大型办公软件的 AI 定价不是单独卖“聊天”,而是卖“嵌入工作流 + 组织数据 + 企业治理”。 |
关键洞察:Microsoft 的策略是用 Copilot Chat 做入口,用 Office 工作流和企业数据上下文做付费转化,用 Agent metering 控制自动化成本。
6.4 Cursor:从“高级调用次数”转向“订阅 + included model usage + on-demand”
| 维度 | 分析 |
|---|---|
| 个人版 | Hobby 免费,Pro 起步,另有 Pro+ / Ultra 面向更高频 Agent 用户。 |
| 团队版 | Teams 按用户收费,增加团队上下文、规则、自动化、安全审查、SSO、用量分析等。 |
| 超额使用 | 每个计划包含一定 model usage,超过后可用 on-demand usage,按欠费后结算。 |
| PM 洞察 | 编程助手已经从“补全工具”变成“Agent 工作台”,定价必须覆盖长期运行的 Agent 成本。 |
关键洞察:不要再写“500 次高级调用 + 小模型无限”这类旧口径,应该写“包含模型用量 + 超额按量 + Agent 用户分层”。
6.5 GitHub Copilot:个人、团队、企业与 premium requests
| 版本 | 价格 / 结构 | 核心差异 |
|---|---|---|
| Copilot Free | 免费 | 有限补全、聊天和 premium requests |
| Copilot Pro | $10/月 | 更高 premium requests,个人开发者主力层 |
| Copilot Pro+ | $39/月 | 更高 premium requests,适合高级模型和重度使用 |
| Copilot Business | $19/席位/月 | 组织管理、策略控制、企业数据保护 |
| Copilot Enterprise | $39/席位/月 | 更高 premium requests、企业级集成与治理 |
关键洞察:编程类 AI 产品越来越采用 基础订阅 + premium requests + 高级模型 / Agent 额度,而不是简单“无限补全”。
6.6 Notion AI:从独立 AI 加购转向 Business / Enterprise 内置 + Custom Agent credits
| 维度 | 分析 |
|---|---|
| Notion AI | Notion AI 已更多地与 Business / Enterprise 计划绑定,核心 AI 功能如 Notion Agent、AI Meeting Notes、Enterprise Search 被打包进高阶计划。 |
| Custom Agents | 从 2026-05-04 起,Custom Agents 使用 Notion credits,$10 / 1,000 credits,按任务复杂度消耗。 |
| 成本控制 | Credits 共享在 workspace 层级,月度重置,不结转;可设置 agent credit limits。 |
| PM 洞察 | 对知识库 SaaS 来说,普通 AI 助手适合打包进高阶套餐,自动化 Agent 更适合单独 credit 化。 |
关键洞察:Notion 的变化说明,AI 功能会从“单独加购”逐渐变成“套餐内置”,但高成本、后台自动运行的 Agent 会被 credit 化。
6.7 Midjourney:不是简单按张数,而是订阅 + GPU 时间 + 队列优先级
| 维度 | 分析 |
|---|---|
| 套餐 | Basic、Standard、Pro、Mega 四档订阅。 |
| 计费核心 | Fast GPU time、Relax Mode、并发任务、Stealth Mode 等,而不是单纯“多少张图”。 |
| PM 洞察 | 图像生成产品可以把成本抽象为 GPU 时间,让用户更容易理解“速度、优先级、并发”的价值。 |
关键洞察:创作类 AI 的核心不是“每张图多少钱”,而是“创作吞吐量 + 等待时间 + 商业使用控制”。
6.8 行业价格汇总表(建议每季度复核)
| 产品 | 免费层 | 入门 / Pro | 团队 / 企业 | 核心定价模式 |
|---|---|---|---|---|
| ChatGPT | 有 | Plus $20,Pro 更高用量 | Business / Enterprise | Freemium + 订阅 + flexible usage |
| Claude | 有 | Pro / Max | Team / Enterprise | 订阅 + 更高用量 + API 用量 |
| Gemini | 有 | Google AI Pro / Ultra | Workspace / Enterprise | 订阅 + Google 生态打包 |
| Microsoft 365 Copilot | Copilot Chat | Copilot Business add-on | 企业合约 | 办公套件加购 + Agent metering |
| Cursor | Hobby | Pro / Pro+ / Ultra | Teams / Enterprise | 订阅 + included usage + on-demand |
| GitHub Copilot | Free | Pro / Pro+ | Business / Enterprise | 订阅 + premium requests |
| Notion AI | 试用 / 限量 | Business 内置 | Enterprise + credits | 高阶套餐内置 + Custom Agent credits |
| Midjourney | 通常无长期免费层 | Basic / Standard / Pro / Mega | — | 订阅 + GPU 时间 |
| Perplexity | 有 | Pro | Enterprise | 搜索 / 研究订阅 |
| Grammarly / Superhuman | 有 | Pro | Enterprise | 写作 AI + 团队协作 + 企业治理 |
7. 附录:定价工具箱
7.1 定价检查清单
发布 AI 产品定价前,请逐项检查:
- [ ] 单位经济学:单次请求、单次任务、单次 Agent run 的真实成本是多少?
- [ ] 模型路由策略:不同用户、任务、套餐分别走什么模型?
- [ ] 毛利率验证:扣除推理、检索、工具、存储、支持后的毛利是否达标?
- [ ] 免费层成本上限:最坏情况下免费用户会烧多少钱?
- [ ] 滥用防护:批量注册、脚本调用、自动化刷量是否可控?
- [ ] 转化路径:用户什么时候遇到限制?限制是否自然触发付费?
- [ ] 企业能力:是否有 SSO、SCIM、审计、数据保留、用量分析?
- [ ] 账单保护:是否有预算上限、告警、暂停机制?
- [ ] 降本预案:模型成本下降 50% 时,是否调整价格、额度或毛利?
- [ ] 季度复核:竞品价格、模型成本、用户用量结构是否已更新?
7.2 常见定价错误
| 错误 | 后果 | 如何避免 |
|---|---|---|
| 免费层太慷慨 | 成本失控,免费用户不转化 | 按“完成 1-3 个工作流”设计免费额度 |
| 承诺无限高级模型 | 重度用户造成亏损 | 使用 fair use、credits、优先级和动态限额 |
| 只按席位不看用量 | 高使用组织亏损 | 席位 + included usage + 超额计费 |
| 只按用量计费 | 用户焦虑,使用被抑制 | 把 token 抽象成 messages / credits / runs |
| 套餐差异不清晰 | 用户不知道为什么升级 | 差异化模型、上下文、速度、工具、治理能力 |
| 不做账单保护 | 客户因意外账单流失 | 预算上限、提醒、自动暂停 |
| 文档写死模型名 | 文章很快过时 | 写模型等级与能力,不写长期会变的具体限额 |
7.3 定价变更策略
AI 行业变化快,定价需要持续优化:
1. 涨价策略
前提:模型升级、功能增加、成本上涨、使用量超预期
方法:新用户新价,老用户锁价 3-12 个月
风险:用户流失和舆论反弹
2. 降价策略
前提:推理成本下降、竞争加剧、获客需要
方法:直接降价、增加额度、推出低价层
风险:老用户要求补偿,价格锚点降低
3. 重构策略
前提:从聊天变 Agent,从单模型变多模型,从个人产品变团队产品
方法:订阅 + credits / usage 的混合迁移
风险:用户理解成本高,需要清晰迁移说明7.4 推荐监控指标
| 指标 | 健康值 | 预警值 |
|---|---|---|
| 月毛利率 | > 65% | < 50% |
| 免费 → 付费转化率 | > 3% | < 1% |
| 付费用户月留存 | > 90% | < 80% |
| 平均每付费用户推理成本 | < 订阅价 30% | > 订阅价 50% |
| 免费用户月成本 | < $0.50 | > $2.00 |
| 高级模型请求占比 | 可控且下降 | 持续上升 |
| Agent run 成功率 | > 90% | < 75% |
| Agent 平均步骤数 | 稳定 | 快速上升 |
| 企业客户 LTV/CAC | > 5x | < 3x |
| 账单超额投诉率 | < 1% | > 3% |
7.5 文档维护建议
AI 定价文章非常容易过时,建议采用以下维护规则:
- 具体价格集中放在第 6 章和参考来源,不要散落在全文;
- 每季度复核一次行业价格表;
- 正文尽量描述定价结构,而不是写死具体额度;
- 所有案例标注日期,例如“截至 2026-05”;
- 当模型名变化时,优先改成能力层级,例如“旗舰模型 / mini 模型 / reasoning 模型 / agent 模型”。
8. 参考来源
以下来源用于更新第 2、4、6 章的价格与套餐口径。价格、额度、模型可用性可能随地区、时间、账户类型变化,落地前请以官网为准。
- OpenAI API Pricing: https://openai.com/api/pricing/
- ChatGPT Pricing: https://openai.com/chatgpt/pricing/
- OpenAI Help Center — What is ChatGPT Plus: https://help.openai.com/en/articles/6950777-what-is-chatgpt-plus
- Claude Pricing: https://claude.com/pricing
- Microsoft 365 Copilot Pricing: https://www.microsoft.com/en-sg/microsoft-365-copilot/pricing
- Cursor Pricing: https://cursor.com/pricing
- GitHub Docs — Plans for GitHub Copilot: https://docs.github.com/en/copilot/get-started/plans
- Notion Help Center — Custom Agent pricing: https://www.notion.com/help/custom-agent-pricing
- Midjourney Docs — Comparing Midjourney Plans: https://docs.midjourney.com/hc/en-us/articles/27870484040333-Comparing-Midjourney-Plans
- Google AI Pro & Ultra: https://gemini.google/subscriptions/
结语:AI 产品定价不是一次性决策,而是持续优化过程。最成功的 AI 产品经理,既要理解成本结构,也要理解用户心理;既要会算 token 成本,也要会把成本包装成用户能感知的价值。真正好的定价,不是“便宜”或“贵”,而是在成本、价值、体验、竞争和增长之间找到可持续的平衡。