Skip to content

AI PM 作品集构建指南

一份优秀的 AI PM 作品集是你能力的直接证明。本文档提供作品集的结构框架、内容建议和示例模板,帮助你系统性地展示 AI 产品案例、PRD 作品、评估报告和 Side Project。


目录


为什么需要作品集?

原因说明
求职差异化AI PM 岗位竞争激烈,作品集让你从简历文字中脱颖而出
能力证明展示你从需求发现到产品上线的完整思考过程
沟通工具面试时可以打开作品集逐页讲解,比空谈更有说服力
职业总结定期整理作品集本身就是很好的复盘和成长总结

作品集推荐结构

结构框架

第一部分:个人简介
├── 一句话介绍(你是谁,专注于什么)
├── 核心能力标签(3-5 个)
├── 工作经历时间线
└── 联系方式

第二部分:核心产品案例(2-3 个)
├── 每个案例包含:背景 → 问题 → 方案 → 过程 → 结果 → 反思
└── 附截图/GIF/Demo 链接

第三部分:PRD 作品(1-2 份)
├── 精选最具代表性的 PRD
├── 展示结构、思考深度、技术细节

第四部分:评估报告(1-2 份)
├── 模型评估 / Agent 评估 / A/B 测试报告
└── 展示数据分析和判断能力

第五部分:Side Project(可选)
├── 个人动手做的 AI 项目
├── 表明你的技术理解和动手能力

第六部分:技术写作(可选)
├── 博客 / 公众号 / 知乎文章
└── 展示你的思考深度和表达能力

第七部分:成果数据 + 推荐信(可选)
├── 关键成果指标(数字最好)
└── 前同事/领导推荐

页数与格式建议

  • 总页数:10-20 页 PDF,或 Notion/Astro/个人网站
  • 格式:PDF 最适合投递,个人网站适合社交分享
  • 更新频率:每季度更新一次

模块一:个人简介与能力概览

示例

markdown
### 张三 · AI 产品经理

**一句话**: 专注于 AI Agent 和 RAG 产品,2 年 AI PM 经验

**核心能力**:
- 🧠 LLM 产品设计:RAG、Agent、Chatbot
- ✍️ Prompt Engineering:System Prompt 设计、Chain-of-Thought
- 📊 模型评估:自动化评估 Pipeline、LLM-as-Judge
- 🤝 跨团队协作:算法 + 工程 + 设计 + 业务

**工作经历**:
- 2024-2025 | XX科技 | AI PM
- 2022-2024 | YY公司 | 产品经理(负责推荐系统)

**联系方式**:
- 📧 example@email.com
- 🔗 linkedin.com/in/example
- 🐙 github.com/example

技巧

  • 每个核心能力配一个图标或 emoji,增强视觉识别
  • 能力标签不超过 5 个,聚焦最有竞争力的方向
  • 如果转行做 AI PM,强调 AI 相关的学习和项目经历

模块二:核心产品案例

案例框架(STAR 升级版)

### 案例名称:[产品名] — [一句话介绍]

**背景**(Context)
- 产品的定位和目标用户是什么
- 为什么要做这个 AI 功能/产品
- 团队规模和角色

**问题**(Problem)
- 用户的痛点是什么
- 竞品是怎么做的
- 技术上的挑战是什么

**方案**(Solution)
- AI 技术架构(RAG / Fine-tuning / Agent)
- 核心产品决策(为什么要这么设计)
- Prompt 设计思路(如有)
- 评估方案和验收标准

**过程**(Action)
- 需求分析和用户研究过程
- 技术选型的关键讨论和决策
- 迭代过程中的关键调整

**结果**(Result)
- 量化数据:准确率提升、用户留存、成本降低等
- 定性反馈:用户评价、团队复盘结论
- 数据截图/图表

**反思**(Reflection)
- 如果重来一次会怎么做
- 学到了什么
- 后续迭代方向

案例示例(简版)

markdown
### 案例:智能客服 Agent — 企业级 7×24 小时 AI 客服

**背景**:公司主营 SaaS 客服系统,需要在原有工单系统上增加 AI 客服功能

**问题**
- 客户对响应速度要求高(< 10秒),但夜间无人值班
- 客服知识库碎片化,FAQ 更新频繁
- 用户问题多样,需要既能问答也能执行简单操作

**方案**
- 采用 RAG + Agent 架构
- 设计 System Prompt 包含角色、决策树、安全护栏
- 使用 LangChain 做工具调用(查询订单、修改信息)
- 建立自动评估 Pipeline(BLEU + LLM-as-Judge)

**过程**
- 前 2 周:梳理 500+ 常见问题和知识库
- 第 3-4 周:Prompt 设计和原型验证
- 第 5-6 周:评估数据集构建和模型选型(GPT-4 vs Claude)
- 第 7-8 周:人工评估和上线

**结果**
- 首次响应时间从 15 分钟降至 5 秒
- 人工客服转接率降至 25%
- 客户满意度(CSAT)保持在 4.2/5.0
- 月度节省客服成本约 ¥20,000

**反思**
- 初版对边界情况考虑不足,需要更完善的评估数据集
- 安全护栏的 Prompt 设计需要和法务团队共同参与

模块三:PRD 作品展示

展示要点

  1. 精选 PRD:选择 1-2 份最代表你能力的 PRD
    • 一份标准功能 PRD(展现基本功)
    • 一份 AI 特性 PRD(展现 AI 理解)
  2. 展示结构
    • 首页:PRD 概览(产品名、版本、作者、日期)
    • 核心内容页:摘录 2-3 个最能体现思考深度的章节
    • 附录:评估标准、验收条件
  3. PRD 推荐结构
markdown
# PRD:[功能名称]

## 1. 概述
- 产品背景
- 目标用户
- 成功标准(OKR/KPI)

## 2. 需求描述
- 用户故事(User Story)
- 功能流程(流程图)
- 输入/输出规范
- 边界条件和异常处理

## 3. 技术需求
- AI 选型建议(模型、框架)
- 数据需求(训练数据、评估数据)
- Prompt 初稿(如适用)
- 性能要求(延迟、吞吐量)

## 4. 评估标准
- 评估指标
- 评估数据集
- 验收标准(Pass/Fail 条件)

## 5. 上线计划
- 灰度策略
- 监控指标
- 回滚方案

## 6. 附录
- 竞品分析
- 用户调研摘要
- 风险评估

展示技巧

  • 只展示关键页,不用把 20 页 PRD 全放上
  • 用注释标注你的思考("这里我为什么这样设计?")
  • 如果涉及机密信息,做脱敏处理

模块四:模型评估报告

报告结构

markdown
## 模型评估报告:[场景名称]

### 评估目标
- 评估什么(模型输出质量?回答准确率?)
- 评估场景(客服问答、代码生成、内容总结)
- 使用的模型(GPT-4, Claude 3, 开源模型)

### 评估方法
- 评估数据集:数量、来源、标注方式
- 评估指标:自动化指标 + 人工指标
- 评估流程:评估 Pipeline 图示

### 评估结果
- 总体得分和对比表格
- 分场景/分类别的详细结果
- 关键发现(模型优势、弱点、边界情况)

### 改进建议
- 模型选型建议
- Prompt 优化方向
- 需要补充的数据和场景

### 附录
- 评估 Dataset 样例
- 评估 Prompt 模板
- 人工评估标注规范

评估报告示例(简版)

markdown
## RAG 问答系统模型评估报告

### 评估目标
对比 GPT-4 和 Claude 3 在内部知识库问答场景的表现

### 评估数据集
- 100 对 Q&A,覆盖 5 个产品品类
- 人工标注参考答案(由 3 位领域专家完成)

### 评估指标
- 主要:回答准确率(人工评分 1-5)
- 辅助:回答完整性、引用准确率
- 效率:首 Token 延迟、总响应时间

### 结果
| 指标          | GPT-4    | Claude 3 | 胜出 |
|---------------|----------|----------|------|
| 准确率 (4-5分)| 78%      | 82%      | Claude|
| 完整性        | 4.1/5.0  | 4.3/5.0  | Claude|
| 引用准确率    | 92%      | 95%      | Claude|
| 平均延迟      | 1.2s     | 0.8s     | Claude|
| 单次调用成本  | $0.03    | $0.02    | Claude|

### 关键发现
1. Claude 在中文问答场景表现整体优于 GPT-4
2. GPT-4 在需要多步推理的复杂问题上略优
3. 两者在边界问法(模糊问题)上都有提升空间

### 建议
- 推荐使用 Claude 3 作为主模型
- 对复杂推理问题补充 Few-shot 示例
- 增加约 50 个边界情况到评估数据集

模块五:Side Project

Side Project 类型

类型说明推荐方向
RAG 应用用个人知识库搭一个问答系统读书笔记问答、个人文档检索
AI Agent做一个能自动完成任务的 Agent自动邮件回复、个人助手
Prompt 实验系统性地对比和优化 PromptPrompt 模板库、评估报告
数据项目用 AI 做数据分析和可视化智能报表生成、趋势分析
自动化工具用 AI API 写一个效率工具AI 翻译、AI 摘要、AI 会议纪要

Side Project 展示模板

markdown
### 项目:[项目名]

**目标**:我想要解决什么问题?
**技术栈**:用了什么模型、框架、工具?
**我的角色**:PM 视角下我关注了什么?

**过程要点**
- 产品定位:目标用户和核心需求
- 技术选型:为什么选这个模型/框架
- 迭代过程:从 v1 到 v2 改进了什么

**成果展示**
- Demo 链接 / 截图 / 视频
- 关键数据和效果

**学到的 PM 启示**
- 这个项目如何影响了我对 AI 产品的理解

💡 提示:Side Project 不要追求完美。一个能跑但简单的 Demo,比一个半途而废的大项目更有价值。


模块六:技术写作与影响力

建议内容方向

方向示例
产品深度分析分析某 AI 产品的架构和产品决策
评估方法论分享你搭建模型评估体系的经验
Prompt 技巧系统性地介绍某类 Prompt 的最佳实践
竞品分析对比多个 AI 产品的功能和技术方案
行业观察对 AI 行业趋势的分析和预判

展示方式

  • 在作品集中列出 3-5 篇代表作
  • 每篇文章附上链接、阅读量、互动数据
  • 标注写作时间,展示持续输出的能力

模块七:推荐与成果数据

成果数据整理建议

用数字说话,每段经历提取 3-5 个关键成果:

markdown
### 成果亮点
- 🎯 产品上线后用户月活增长 **150%**(3 个月内)
- ⏱ 客服响应时间降低 **95%**(15 分钟 → 30 秒)
- 💰 年度节省运营成本 **¥50 万+**
- 📈 模型准确率提升 **12%**(通过 Prompt 优化)
- 🔄 产品迭代周期从 **4 周缩短至 2 周**(搭建评估 Pipeline)

推荐信/评价

  • 请前领导或同事写一段专业评价
  • 用 LinkedIn 推荐的截图
  • 展示团队合作和领导力的正面反馈

不同场景的作品集策略

场景重点篇幅
求职面试2-3 个核心案例 + 1 份 PRD + 1 份评估报告12-15 页
内部晋升成果数据 + 领导力案例 + 方法论输出8-10 页
社交展示个人网站 + Side Project + 技术文章无限(在线)
转行入局学习项目 + Side Project + 课程证书10-12 页

工具与模板推荐

作品集制作工具

工具适合特点
Notion在线分享免费、编辑方便、支持协作
Google Slides / KeynotePDF 投递模板丰富、排版自由
Figma设计感强的作品集像素级控制,但耗时
Astro / Next.js个人网站技术感强,展示 Side Project 方便
LinkedIn社交展示官方 profile + 作品链接

推荐模板


最后一点:作品集是活的文档。每完成一个项目、每个季度结束时,花 30 分钟更新它。让作品集成为你的 AI PM 成长日记。

MIT License