Skip to content

AI 产品定价策略

面向专业产品经理的完整定价框架,覆盖从成本结构、计费模型、免费层设计到企业化商业策略的关键决策点。

更新说明:本文按 2026-05-15 的公开价格与行业实践重写了行业案例。AI 产品价格、模型名、使用额度变化很快,涉及具体美元价格的内容只应作为当期参考,落地前必须以各产品官网为准。


目录

  1. AI 产品定价的独特性
  2. 主要定价模式详解
  3. 定价决策框架:四维分析表
  4. 免费层设计
  5. 企业定价策略
  6. 真实行业参考(2026-05)
  7. 附录:定价工具箱
  8. 参考来源

1. AI 产品定价的独特性

1.1 可变成本主导 vs 固定成本主导

传统 SaaS 的定价逻辑建立在 “高固定成本 + 边际成本趋近于零” 之上。一旦软件开发完成,每增加一个用户的边际成本通常较低,这使得传统 SaaS 可以采用较激进的免费增值策略。

AI 产品则不完全适用这个假设。每一次模型推理、图像生成、语音转写、Agent 工具调用都可能消耗真实算力,边际成本 不为零,且会随模型能力、上下文长度、输出长度、并发需求、工具链复杂度上升。

维度传统 SaaSAI 产品
成本结构高固定成本,低边际成本高固定成本 + 高可变成本
边际成本趋势随规模摊薄随 token、任务、Agent 步骤线性或阶梯增长
定价弹性免费层可较慷慨免费层必须强控成本与滥用
单位经济学用户数 / 席位数token、图片、音视频分钟、工具调用、Agent 运行
利润天花板主要取决于获客与留存同时受推理成本、模型路由、限额设计约束

核心洞见:AI 产品经理必须像运营一个“有制造成本的数字产品”一样思考定价。你卖的每一次回答、每张图、每段代码、每个 Agent 运行,都有真实成本。

1.2 从“三边约束”到“四边约束”

AI 产品定价不再只是“用户愿意付多少钱”的问题,而是一个多约束优化问题:

text
              ┌──────────────┐
              │  用户支付意愿  │
              └──────┬───────┘

        ┌────────────┼────────────┐
        │            │            │
        ▼            ▼            ▼
  ┌──────────┐ ┌──────────┐ ┌──────────┐
  │ 模型成本  │ │ 产品价值  │ │ 竞品锚点  │
  └────┬─────┘ └────┬─────┘ └────┬─────┘
       │            │            │
       └────────────┼────────────┘

             ┌──────────────┐
             │  风险与合规成本 │
             └──────────────┘

四个关键约束分别是:

  1. 用户支付意愿:目标用户愿意为 AI 能力多付多少钱?是个人订阅、团队预算,还是企业采购预算?
  2. 模型与算力成本:输入、输出、缓存、图像、音频、工具调用、Agent 步数分别消耗多少?
  3. 产品价值感知:用户为“省时间、提质量、降风险、增收入”付费,而不是为 token 付费。
  4. 竞争与合规成本:竞品价格形成锚点,企业客户还会为安全、审计、数据隔离、SLA 支付溢价。

1.3 成本透明度悖论

AI 产品有一个特殊矛盾:

  • 完全隐藏成本:用户不知道每次请求的成本,容易过度使用,导致产品必须限流、降速或降低模型质量。
  • 完全暴露成本:用户看到 token、credit、GPU 分钟后,可能变得“抠门”,不敢充分使用 AI,反而降低产品价值感。

因此,现代 AI 产品越来越常用 “用户看得懂的配额单位”

用户看到的单位背后可能对应的成本
消息 / 次数token + 输出长度 + 工具调用
AI creditstoken、模型等级、工具调用、Agent 步骤的抽象封装
Fast GPU hours图片/视频生成的 GPU 时间
Premium requests高级模型调用、长上下文、复杂任务
Agent runs多步骤推理 + 检索 + 工具执行 + 写回动作

1.4 2026 年以后更重要的新变量:Agent 成本

早期 AI 产品主要按“单次聊天”或“单次生成”计算成本。现在 Agent 产品会连续执行多个步骤:检索资料、读数据库、调用工具、写文档、发通知、生成代码、跑测试。

这意味着成本从:

text
一次请求成本 = 输入 token + 输出 token

变成:

text
一次 Agent 成本 = 多轮模型调用 + 检索成本 + 工具调用成本 + 写入/执行成本 + 失败重试成本

因此,Agent 产品定价不应简单承诺“无限使用”,而应设计为:

  • 订阅费覆盖基础使用;
  • included usage 覆盖正常工作量;
  • 超额用 credit / usage-based billing;
  • 企业客户可购买承诺用量、池化额度、私有部署或专属容量。

2. 主要定价模式详解

2.1 按 Token / 用量计费 (Usage-Based Pricing)

适用场景:API、开发者平台、模型服务、企业后台批处理、可量化消耗的 AI 基础设施。

典型代表:OpenAI API、Claude API、Google Gemini API、各类模型网关。

优点

  • 收入与成本天然对齐;
  • 对开发者透明,便于成本核算;
  • 低门槛进入,适合按需扩展。

缺点

  • 用户难以预测账单;
  • 用户可能抑制使用;
  • ARR 预测不如席位订阅稳定;
  • 对 C 端用户理解门槛高。

设计要点

参数策略注意事项
输入 / 输出分价输出通常更贵长回答、代码生成、报告生成成本高
缓存输入对重复上下文降价适合知识库、代码库、长上下文应用
批处理 / 慢速模式低价换延迟适合离线任务、非实时场景
数据驻留 / 区域处理溢价企业合规需求强时可单独收费
用量上限硬上限 + 告警避免账单冲击
预付费 / 承诺消费换取折扣提高收入确定性

定价公式参考

text
单次请求成本 = 输入 token × 输入单价
             + 缓存输入 token × 缓存单价
             + 输出 token × 输出单价
             + 工具 / 图像 / 音频等额外成本

月账单 = Σ(所有请求成本) + 固定订阅费(如有)

实战案例:OpenAI API 成本估算(2026-05)

以一次典型对话为例:10 轮来回,每轮约 500 输入 token + 200 输出 token。

text
总输入 = 10 × 500 = 5,000 token
总输出 = 10 × 200 = 2,000 token

按 OpenAI 公布的标准处理价,GPT-5.4 为 $2.50 / 1M 输入 token、$15 / 1M 输出 token;GPT-5.4 mini 为 $0.75 / 1M 输入 token、$4.50 / 1M 输出 token;GPT-5.5 为 $5 / 1M 输入 token、$30 / 1M 输出 token。

模型输入成本输出成本单会话估算
GPT-5.4 mini5,000 × $0.75 / 1M = $0.003752,000 × $4.50 / 1M = $0.009$0.01275
GPT-5.45,000 × $2.50 / 1M = $0.01252,000 × $15 / 1M = $0.03$0.0425
GPT-5.55,000 × $5 / 1M = $0.0252,000 × $30 / 1M = $0.06$0.085

如果每月 100 万活跃用户,每人每月 100 次这样的会话:

text
GPT-5.4 mini: 100M 会话 × $0.01275 ≈ $1.275M / 月
GPT-5.4:      100M 会话 × $0.0425  ≈ $4.25M / 月
GPT-5.5:      100M 会话 × $0.085   ≈ $8.5M / 月

这解释了为什么 C 端免费层必须依赖小模型、缓存、限额、降速与模型路由,而不能让所有用户无限使用最贵模型。

2.2 按席位订阅 (Per-Seat Subscription)

适用场景:AI 是工作流增强能力,用户按人购买,尤其适合企业协作工具、办公套件、知识库、代码 IDE。

典型代表:ChatGPT Business、Claude Team、Microsoft 365 Copilot Business、GitHub Copilot Business、Cursor Teams。

优点

  • 收入稳定,方便企业采购;
  • 用户不需要理解 token;
  • 便于和权限、审计、团队管理、安全功能打包。

缺点

  • 重度用户可能让成本失控;
  • 轻度用户会觉得不值;
  • 席位价必须和 included usage、超额计费配合。

定价计算公式

text
目标席位价 = 预期月均推理成本 / (1 - 目标毛利率)

例:
如果一个席位月均推理成本为 $5,目标毛利率 70%,
目标席位价 = $5 / (1 - 70%) = $16.67

现实中,越来越多 AI SaaS 不是纯席位订阅,而是:

text
席位订阅费 + 包含用量 + 超额按量 / credits + 企业治理能力

2.3 按任务 / 输出计费 (Output-Based Pricing)

适用场景:输出物边界清晰,用户能直观看到结果价值。

典型代表:图片生成、视频生成、语音转写、自动报告、代码审查、数据分析任务、后台 Agent 运行。

优点

  • 用户为“结果”付费,而不是为 token 付费;
  • 定价更容易理解;
  • 适合包装成 credit、任务包、GPU 时间包。

缺点

  • “一次任务”的边界难定义;
  • 失败重试、反复修改会放大成本;
  • 需要防止自动化滥用和并发刷量。

设计要点

任务类型常见定价单位成本控制
文生图张数、GPU 分钟、Fast hours并发限制、队列优先级、Relax 模式
视频生成秒 / 分钟、分辨率、队列等级分辨率限制、生成时长限制
代码生成premium requests、agent runs、AI credits高级模型限额、项目级用量池
自动报告报告份数、数据量、刷新频率数据行数、上下文长度、缓存
Agent 自动化run、step、credit步骤上限、工具白名单、失败重试上限
语音 / 转写分钟数、字符数批处理、低优先级队列

2.4 混合模式:订阅 + 用量 + 免费层

这是 2026 年最常见的 AI 产品定价结构:

text
免费层:基础模型 + 限额 + 慢速 / 低优先级
入门层:固定月费 + 更多消息 / 更多上传 / 更多模型
专业层:更强模型 + 更长上下文 + 更多 Agent / Codex / Deep Research 用量
团队层:席位 + 管理后台 + SSO + 数据保护 + 团队上下文
企业层:自定义报价 + 用量承诺 + 审计 + 合规 + 私有化 / 专属容量

混合模式的关键思想

  • 对轻度用户:固定订阅让用户买“安心”;
  • 对重度用户:用量或 credit 防止成本失控;
  • 对企业用户:治理、安全、合规、数据连接能力本身就是价值;
  • 对平台方:通过模型路由、缓存、批处理、队列优先级来管理毛利率。

3. 定价决策框架:四维分析表

3.1 四维矩阵

维度子问题对定价的影响
1. 产品类型核心 AI 产品还是 AI 辅助功能?核心 → 用量 / 任务 / 订阅混合;辅助 → 捆绑 / 席位
2. 用户群体开发者、知识工作者、创作者、大众消费者、企业?开发者 → API 用量;知识工作者 → 席位;创作者 → 任务包;企业 → 合约
3. 使用频率高频低价值还是低频高价值?高频 → 订阅 + 限额;低频 → 按次 / credit
4. 成本结构推理成本、工具调用、数据连接、合规成本占比如何?成本高 → 严控免费层;成本低 → 可扩大免费体验

3.2 决策树

text
[产品类型]

    ├── AI 原生产品
    │    ├── C 端助手 → Freemium + Plus/Pro + usage caps
    │    ├── 开发者 API → Token / 用量计费 + 承诺消费
    │    ├── 创作工具 → 任务 / GPU 时间 / credits
    │    └── Agent 平台 → 席位 + Agent runs / credits

    └── AI 辅助功能
         ├── 企业工具 → 席位订阅 + 管理 / 安全 / 合规
         ├── 办公套件 → 原有订阅加购 / 高级层打包
         └── 垂直 SaaS → 按业务价值打包进套餐

3.3 定价策略速查表

场景画像定价建议参考月费 / 计费方式毛利率关注点
大众聊天助手Freemium + Plus/Pro$20 / $100 / $200 常见锚点重度用户成本与限额
编程助手免费层 + 个人订阅 + 团队席位 + 高级模型限额$10-40/人/月 + 超额Agent 与高级模型成本
企业知识库 AI席位 + 数据连接 + 企业安全$20-100+/席位/月检索、上下文、合规成本
图像生成GPU 时间 / credits + 订阅$10-120/月并发、队列、失败重试
API 服务纯用量 + 承诺消费按 1M token / 分钟 / 图片模型成本、缓存命中率
垂直 AI Agent订阅 + 每任务 / 每结果$5-200/任务或按月打包工具调用与人工替代价值

4. 免费层设计

4.1 免费额度给多少?

免费层的目标不是“越慷慨越好”,而是:

text
让用户完成 1-3 个完整工作流,并体验到核心价值,同时把单位经济学控制在可承受范围内。

不要在文档里写死“每天 X 条 GPT-4o / Claude 多少条”这样的额度,因为模型和限额变化极快。更稳妥的写法是:

产品类型免费层目标推荐限制方式
聊天助手让用户完成若干次真实问题求解低成本模型 + 动态消息上限 + 高峰限流
编程助手体验补全、问答、一次简单 agent 任务补全限额 + 高级模型请求限额
图像生成生成 1-3 张满意作品低速队列 + 水印 / 分辨率限制
企业知识库让团队完成一个小型知识库问答试点限文档数、成员数、检索次数
Agent 自动化体验一次自动化闭环限 run 数、step 数、触发频率

免费层成本估算公式

text
免费用户月成本 = 日均请求数 × 30 × 单次平均成本
              + 文件 / 图像 / 工具调用成本
              + 滥用与失败重试成本

示例:

text
如果免费用户每天 10 次低成本模型请求,单次成本 $0.001:
月成本 = 10 × 30 × $0.001 = $0.30 / 用户 / 月

如果有 100 万免费活跃用户:
月成本 = $300,000

如果单次成本从 $0.001 上升到 $0.01,月成本会直接变成 $3,000,000。因此,免费层必须优先做模型路由与成本保护。

4.2 免费层的成本控制策略

策略描述效果
模型路由简单任务走小模型,复杂任务走强模型降低整体平均成本
动态限额根据负载、账号信誉、历史行为调整额度平衡体验与成本
高峰降级高峰时免费用户排队或慢速响应平滑 GPU 负载
输出长度限制限制免费层输出 token控制最贵的输出成本
上下文窗口限制免费层减少历史上下文和文件大小降低输入与检索成本
缓存优先高频问题、模板回答、公开知识优先缓存降低重复请求成本
滥用检测限制批量注册、脚本刷量、自动化调用防止成本被攻击
Agent step 上限限制工具调用次数与重试次数控制 Agent 成本尾部风险

4.3 从免费到付费的转换设计

转换触发点

  1. 额度触达:你今天的高级模型 / Agent / 图片额度已用完。
  2. 质量对比:付费层提供更强模型、更长上下文、更稳定响应。
  3. 时间对比:付费用户高峰期优先队列。
  4. 工作流锁定:用户把项目、文档、团队知识库、自动化流程放进产品后,迁移成本上升。
  5. 团队扩展:个人试用后,需要多人协作、权限、审计、共享上下文。

典型转化漏斗

text
注册用户: 100%
  ├─ 首次价值体验: 40-60%
  │    ├─ 7 日留存: 20-30%
  │    │    ├─ 触达限制 / 高级需求: 10-15%
  │    │    │    ├─ 付费转化: 2-5%
  │    │    │    └─ 暂停 / 流失: 8-12%
  │    │    └─ 低频继续免费: 10-15%
  │    └─ 未留存: 20-30%
  └─ 未激活: 40-60%

A/B 测试重点

  • 免费额度:低额度高转化 vs 高额度高留存;
  • 限制策略:锁死、慢速、降模型、看广告、购买 credit;
  • 付费墙文案:强调“更强模型”还是“完成任务”;
  • 套餐结构:Plus / Pro / Team 是否形成清晰升级路径。

5. 企业定价策略

5.1 企业定价维度

维度C 端B 端 / 企业
定价模式月付订阅 / credits席位 + 用量 + 合同承诺
合同周期月付为主年付,常见 1-3 年
价格锚点$20-$200/月$10K-$500K+/年
采购决策者个人IT、财务、法务、业务负责人
关注点体验、功能、价格ROI、安全、合规、SLA、数据控制
谈判空间大,尤其是多席位与承诺消费

5.2 企业版常见收费项

企业客户购买的不只是“更高额度”,还包括治理与风险降低能力:

收费项价值
SSO / SCIM身份统一、入离职管理
审计日志安全追踪、合规检查
数据保留策略满足内部合规与监管要求
零训练承诺 / 数据隔离降低数据泄露和模型训练风险
管理后台控制模型、插件、连接器、使用权限
用量分析控制成本,衡量 ROI
SLA / 专属支持提高业务连续性
私有部署 / 专属容量高敏数据、本地化、低延迟、稳定容量

5.3 私有部署与专属容量溢价

企业客户可能要求私有云、本地部署、专属 GPU、数据驻留或区域处理。这类需求会显著提高交付成本。

定价策略参考

text
私有部署 / 专属容量价格 = SaaS 等价价格 × 1.5 - 3.0
                         + 一次性实施费
                         + 年度运维 / 支持费

加价理由:

  • 专属算力占用;
  • 部署、监控、升级、故障响应;
  • 安全与合规评估;
  • 定制连接器与内部系统集成;
  • SLA 与客户成功成本。

5.4 企业用量折扣

月消费 / 承诺用量常见策略适用对象
< $1K标准价小团队、实验项目
$1K-$10K小幅折扣 / 技术支持中型团队
$10K-$100K阶梯折扣 + 客户成功大型企业部门
$100K+协商价 + 专属容量 / 私有部署集团级客户

5.5 长期合同设计

text
1 年合同:换取 10-20% 折扣
2 年合同:换取 20-30% 折扣
3 年合同:换取 30%+ 折扣,但建议绑定最低用量承诺与价格重估条款

AI 模型成本和能力变化很快,长期合同最好加入:

  • 模型升级条款;
  • 用量超额计费规则;
  • 价格重估窗口;
  • 数据保护与审计责任;
  • 供应商模型替换机制;
  • 最低可用 SLA 和故障赔偿。

6. 真实行业参考(2026-05)

注意:本章只作为“定价结构参考”,不要把具体价格写进长期不维护的产品文档中。推荐在正文使用“截至 2026-05”这样的时间标注,并在文末保留官网来源。

6.1 OpenAI / ChatGPT:从固定订阅走向多层额度与 flexible usage

维度分析
用户侧订阅ChatGPT 仍采用 Free / Go / Plus / Pro / Business / Enterprise 分层。Plus 仍是 $20/月锚点,Pro 分为更高使用量层级。
模型口径不应再写 GPT-4o 或 GPT-4.1 作为 ChatGPT Plus 主能力;截至 2026-05,Plus 的核心卖点已经转向 GPT-5.5 limits、GPT-5.5 Thinking、Deep Research、Codex 等。
API 计费API 仍按 token 计费,并区分输入、缓存输入、输出、批处理、优先处理等。
定价逻辑C 端用订阅做心理锚点,B 端和 API 用 flexible pricing / usage-based pricing 控制成本。
PM 洞察不要把“具体模型名 + 无限使用”写死,应该写“高级模型额度、推理模式、工具额度随套餐提升”。

关键洞察:ChatGPT 的定价已经不是简单的“$20 无限聊天”,而是 订阅层级 + 高级模型额度 + 工具额度 + flexible usage 的组合。

6.2 Anthropic / Claude:Pro、Max、Team、Enterprise 与 API 并存

维度分析
个人版Claude Pro 为日常生产力;Max 面向重度用户,提供 5x / 20x 使用量层级。
团队版Team 面向 5-150 人团队,分标准席位和高级席位。
企业版Enterprise 采用席位价 + usage at API rates,更明确地把“使用量成本”暴露给企业客户。
API 计费Opus、Sonnet、Haiku 按 MTok 计费,且有 prompt caching write/read 价格。
PM 洞察“无限使用”是危险表述,应改成“更高用量、限额适用、重度用户可升级”。

关键洞察:Claude 的定价越来越清晰地把“人均订阅”和“真实模型消耗”拆开,适合企业采购时做成本归因。

6.3 Microsoft 365 Copilot:办公套件加购 + Chat 免费入口 + Agent 计量

维度分析
免费入口Microsoft 365 Copilot Chat 对符合条件的 Microsoft 365 商业 / 企业客户提供,无额外费用。
付费层Microsoft 365 Copilot Business 作为 Business 订阅的 add-on,需要符合条件的 Microsoft 365 许可证。
Agent 计费自定义 Agent 可按 metered basis 使用,Azure / Copilot Studio 容量可能参与计费。
模型口径页面已强调使用最新 OpenAI models,而不是旧的 GPT-4o 口径。
PM 洞察大型办公软件的 AI 定价不是单独卖“聊天”,而是卖“嵌入工作流 + 组织数据 + 企业治理”。

关键洞察:Microsoft 的策略是用 Copilot Chat 做入口,用 Office 工作流和企业数据上下文做付费转化,用 Agent metering 控制自动化成本。

6.4 Cursor:从“高级调用次数”转向“订阅 + included model usage + on-demand”

维度分析
个人版Hobby 免费,Pro 起步,另有 Pro+ / Ultra 面向更高频 Agent 用户。
团队版Teams 按用户收费,增加团队上下文、规则、自动化、安全审查、SSO、用量分析等。
超额使用每个计划包含一定 model usage,超过后可用 on-demand usage,按欠费后结算。
PM 洞察编程助手已经从“补全工具”变成“Agent 工作台”,定价必须覆盖长期运行的 Agent 成本。

关键洞察:不要再写“500 次高级调用 + 小模型无限”这类旧口径,应该写“包含模型用量 + 超额按量 + Agent 用户分层”。

6.5 GitHub Copilot:个人、团队、企业与 premium requests

版本价格 / 结构核心差异
Copilot Free免费有限补全、聊天和 premium requests
Copilot Pro$10/月更高 premium requests,个人开发者主力层
Copilot Pro+$39/月更高 premium requests,适合高级模型和重度使用
Copilot Business$19/席位/月组织管理、策略控制、企业数据保护
Copilot Enterprise$39/席位/月更高 premium requests、企业级集成与治理

关键洞察:编程类 AI 产品越来越采用 基础订阅 + premium requests + 高级模型 / Agent 额度,而不是简单“无限补全”。

6.6 Notion AI:从独立 AI 加购转向 Business / Enterprise 内置 + Custom Agent credits

维度分析
Notion AINotion AI 已更多地与 Business / Enterprise 计划绑定,核心 AI 功能如 Notion Agent、AI Meeting Notes、Enterprise Search 被打包进高阶计划。
Custom Agents从 2026-05-04 起,Custom Agents 使用 Notion credits,$10 / 1,000 credits,按任务复杂度消耗。
成本控制Credits 共享在 workspace 层级,月度重置,不结转;可设置 agent credit limits。
PM 洞察对知识库 SaaS 来说,普通 AI 助手适合打包进高阶套餐,自动化 Agent 更适合单独 credit 化。

关键洞察:Notion 的变化说明,AI 功能会从“单独加购”逐渐变成“套餐内置”,但高成本、后台自动运行的 Agent 会被 credit 化。

6.7 Midjourney:不是简单按张数,而是订阅 + GPU 时间 + 队列优先级

维度分析
套餐Basic、Standard、Pro、Mega 四档订阅。
计费核心Fast GPU time、Relax Mode、并发任务、Stealth Mode 等,而不是单纯“多少张图”。
PM 洞察图像生成产品可以把成本抽象为 GPU 时间,让用户更容易理解“速度、优先级、并发”的价值。

关键洞察:创作类 AI 的核心不是“每张图多少钱”,而是“创作吞吐量 + 等待时间 + 商业使用控制”。

6.8 行业价格汇总表(建议每季度复核)

产品免费层入门 / Pro团队 / 企业核心定价模式
ChatGPTPlus $20,Pro 更高用量Business / EnterpriseFreemium + 订阅 + flexible usage
ClaudePro / MaxTeam / Enterprise订阅 + 更高用量 + API 用量
GeminiGoogle AI Pro / UltraWorkspace / Enterprise订阅 + Google 生态打包
Microsoft 365 CopilotCopilot ChatCopilot Business add-on企业合约办公套件加购 + Agent metering
CursorHobbyPro / Pro+ / UltraTeams / Enterprise订阅 + included usage + on-demand
GitHub CopilotFreePro / Pro+Business / Enterprise订阅 + premium requests
Notion AI试用 / 限量Business 内置Enterprise + credits高阶套餐内置 + Custom Agent credits
Midjourney通常无长期免费层Basic / Standard / Pro / Mega订阅 + GPU 时间
PerplexityProEnterprise搜索 / 研究订阅
Grammarly / SuperhumanProEnterprise写作 AI + 团队协作 + 企业治理

7. 附录:定价工具箱

7.1 定价检查清单

发布 AI 产品定价前,请逐项检查:

  • [ ] 单位经济学:单次请求、单次任务、单次 Agent run 的真实成本是多少?
  • [ ] 模型路由策略:不同用户、任务、套餐分别走什么模型?
  • [ ] 毛利率验证:扣除推理、检索、工具、存储、支持后的毛利是否达标?
  • [ ] 免费层成本上限:最坏情况下免费用户会烧多少钱?
  • [ ] 滥用防护:批量注册、脚本调用、自动化刷量是否可控?
  • [ ] 转化路径:用户什么时候遇到限制?限制是否自然触发付费?
  • [ ] 企业能力:是否有 SSO、SCIM、审计、数据保留、用量分析?
  • [ ] 账单保护:是否有预算上限、告警、暂停机制?
  • [ ] 降本预案:模型成本下降 50% 时,是否调整价格、额度或毛利?
  • [ ] 季度复核:竞品价格、模型成本、用户用量结构是否已更新?

7.2 常见定价错误

错误后果如何避免
免费层太慷慨成本失控,免费用户不转化按“完成 1-3 个工作流”设计免费额度
承诺无限高级模型重度用户造成亏损使用 fair use、credits、优先级和动态限额
只按席位不看用量高使用组织亏损席位 + included usage + 超额计费
只按用量计费用户焦虑,使用被抑制把 token 抽象成 messages / credits / runs
套餐差异不清晰用户不知道为什么升级差异化模型、上下文、速度、工具、治理能力
不做账单保护客户因意外账单流失预算上限、提醒、自动暂停
文档写死模型名文章很快过时写模型等级与能力,不写长期会变的具体限额

7.3 定价变更策略

AI 行业变化快,定价需要持续优化:

text
1. 涨价策略
   前提:模型升级、功能增加、成本上涨、使用量超预期
   方法:新用户新价,老用户锁价 3-12 个月
   风险:用户流失和舆论反弹

2. 降价策略
   前提:推理成本下降、竞争加剧、获客需要
   方法:直接降价、增加额度、推出低价层
   风险:老用户要求补偿,价格锚点降低

3. 重构策略
   前提:从聊天变 Agent,从单模型变多模型,从个人产品变团队产品
   方法:订阅 + credits / usage 的混合迁移
   风险:用户理解成本高,需要清晰迁移说明

7.4 推荐监控指标

指标健康值预警值
月毛利率> 65%< 50%
免费 → 付费转化率> 3%< 1%
付费用户月留存> 90%< 80%
平均每付费用户推理成本< 订阅价 30%> 订阅价 50%
免费用户月成本< $0.50> $2.00
高级模型请求占比可控且下降持续上升
Agent run 成功率> 90%< 75%
Agent 平均步骤数稳定快速上升
企业客户 LTV/CAC> 5x< 3x
账单超额投诉率< 1%> 3%

7.5 文档维护建议

AI 定价文章非常容易过时,建议采用以下维护规则:

  1. 具体价格集中放在第 6 章和参考来源,不要散落在全文;
  2. 每季度复核一次行业价格表
  3. 正文尽量描述定价结构,而不是写死具体额度
  4. 所有案例标注日期,例如“截至 2026-05”;
  5. 当模型名变化时,优先改成能力层级,例如“旗舰模型 / mini 模型 / reasoning 模型 / agent 模型”。

8. 参考来源

以下来源用于更新第 2、4、6 章的价格与套餐口径。价格、额度、模型可用性可能随地区、时间、账户类型变化,落地前请以官网为准。


结语:AI 产品定价不是一次性决策,而是持续优化过程。最成功的 AI 产品经理,既要理解成本结构,也要理解用户心理;既要会算 token 成本,也要会把成本包装成用户能感知的价值。真正好的定价,不是“便宜”或“贵”,而是在成本、价值、体验、竞争和增长之间找到可持续的平衡。

MIT License