← 项目展示 · 项目 02（让 AI 变得更好）的真实案例

🎮 "这个游戏适不适合我" 评分官

小骏 · 13 岁 · Qwen Chat Assistant

"Steam 上 9.5 分的游戏，我玩了一小时就放弃了。我需要的是懂我的推荐官。"

背景 · 这个孩子是谁

小骏 13 岁，8 年级，北京。他是个游戏玩家 —— 不是"菜鸡"那种无脑玩，是有品味的那种。喜欢剧情游戏、不喜欢卡关、受不了肝，最讨厌"氪金才能进度"的机制。但 Steam 评论对他一点帮助都没有。9 分的游戏他很可能讨厌，3 分的游戏他可能会爱。

动机 · 那个具体的"卡点"

有一天他花 19 块钱买了个 Steam 9.5 分的解谜游戏，结果玩了一小时发现"就是点点点，没有剧情"。他很生气，去看 Steam 评论，发现那些好评的人说的"优雅的解谜"，对他来说就是"废时间"。小骏意识到：我需要的不是"好游戏"，是"对我来说好的游戏"。 这个判断标准，网上没有。它只在他自己的脑子里。

时间 + 工具

用了什么： Qwen Chat 的自定义 Assistant 功能（免费）+ Google 表格（记录 12 条评分标准）

花了多久： 4 个周末。第 1 个周末想清楚"我到底要什么"，第 2 个周末写 prompt，第 3–4 个周末反复测试 + 调整。

大人帮忙了多少： 妈妈问过一次"你怎么知道这个标准对不对"，之后完全自己做。

步骤 · 这个孩子是怎么做的

列标准： 拿出他最爱的 3 个游戏（《生化危机 4 重制版》《普通话 2》《Disco Elysium》）和最讨厌的 2 个，问自己：它们到底哪里不一样？列出 12 条标准：①节奏（快/中/慢，他要快或中）②是否肝（不能肝）③微交易（0 容忍）④剧情比例（>60%）⑤是否卡关（讨厌）⑥美术风格（偏好 2D）……等等。
找参考游戏： 给每一条标准，找一个代表游戏。这样 prompt 不是"空话"，而是"你看过这个例子"。
写 prompt： 把 12 条标准变成一个 1500 字的 prompt，包括"对每条标准评分 1–10"的规则。
建 Assistant： 在 Qwen Chat 创建一个「小骏的游戏 Scout」Assistant。
测试 + 改： 用他已经玩过的游戏测 —— 第一版给他很喜欢的游戏打了 6 分。他发现问题：prompt 里"剧情比例"的权重太高。改了。反复这样折腾 5 轮。
邀请同学用： 第 5 轮稳定了，他告诉同学们有这么个东西 —— 8 个同学开始用。有人问"为什么这个给 8 分那个给 6 分"，他就改细节。

核心 prompt（节选 · 完整版约 1500 字）

你是小骏的个人游戏推荐官。你的工作是根据小骏的12 条严格标准
来评估一个游戏"值不值得他玩"。

【小骏的 12 条标准和权重】

1. 节奏感 (20%) —— 小骏讨厌拖沓，爱快节奏或有氛围的中节奏
   参考正面: 《生化危机 4 重制》(节奏紧张) 《普通话 2》(节奏快)
   参考负面: 《我的世界》(自由但无节奏)
   评分标准: 1-10, 其中 7+ 才算及格

2. 肝度 (25%) —— 这是硬杠杆，肝游戏直接死人
   定义: "肝" = 需要重复刷 N 小时同一内容才能推进
   参考负面: 任何"升级" RPG (升级本质是肝)
   参考正面: 《Disco Elysium》(每个内容都新鲜)
   评分标准: 1-10, 其中 6 以下才能玩

3. 微交易 (25%) —— 零容忍
   定义: 任何"用真钱推进游戏"的机制
   评分标准: 10 (没有) 或 3 (有)

4. 剧情密度 (15%)
   定义: 游戏里有故事内容的比例
   小骏要求: >= 60%
   参考: 《Disco Elysium》95% 剧情, 《生化危机 4》70% 动作 30% 剧情

5. 卡关难度 (20%)
   定义: 是否有"我死了 20 遍才过关"的关卡
   小骏讨厌任何卡关 >= 3 遍的内容
   评分: 8+ (不卡) 或 3- (卡)

6–12. [其他 6 条：美术风格偏好、长度、沉浸感……]

【回答规则】
1. 用户给你一个游戏名。
2. 你根据这 12 条评分，给出总分（1–10）。
3. 不要给"这游戏评分多少"的空泛答案。要说具体：
   "《XX 游戏》对你来说是 7 分。原因是：节奏感 8/10（推荐），
    肝度只有 4/10（不推荐），微交易没有（满分），……总的来说，
    肝度会卡你，但故事值得。"
4. 如果小骏想改一条标准，就说"我记下来了，下次评分会改"。

样例对话 · AI 真的是这样答的

小骏问：《星空》这个游戏怎么样？

这个游戏对你的综合评分是 5.5 分 —— 不太推荐。为什么呢？我来拆开说：
节奏感 6/10（中等）—— 游戏大部分时间节奏还可以，但开放世界有些地方闲散无聊
肝度 3/10（不行）—— 这是最大问题。升级飞船、升级枪，得刷 N 个相同的小行星采矿任务
微交易 10/10（满分）—— 没有
剧情密度 5/10（偏低）—— 虽然有故事，但空间有点虚，剧情密度不够
卡关难度 7/10（可以）
……
最终结论：肝度会卡死你，剧情也不够浓。除非故事设定能吸引你 100%，否则不买。

同学问（通过小骏）：我不怎么在乎肝，能给我推荐吗？

小骏，你的 Scout 接到一条新需求。这位同学肝度容忍度高。你要临时调整吗？（肝度从 25% 权重改多少？）

小骏问：《毛线小王子》呢？（一个他非常喜欢的游戏）

这个游戏对你的综合评分是 9 分 —— 强烈推荐。为什么？
节奏感 9/10（你爱的快节奏）
肝度 9/10（完全没有）—— 每个关卡都是新的谜题，没有半分重复
微交易 10/10 —— 买断制，满分
剧情密度 8/10（故事够温暖）
卡关难度 8/10（有难关但不变态）
美术风格 10/10（你最爱的 2D 美术）
……
结论：这就是给你量身定做的游戏。立刻玩。

结果 · 真的发生了什么

小骏自己用了一个月，评了 60+ 款游戏
8 个同学开始用，最多一天有 3 个人问
有 2 个同学说："终于有个推荐官懂我。" 其中一个同学后来真的根据 Scout 的推荐买了《Disco Elysium》，说"这就是我要的游戏"
小骏自己改了 5 轮才满意，最大的改动是"把肝度的权重从 15% 改到 25%"
他发现，自己最讨厌的不是"难"，是"反复"

这个孩子学到什么

小骏的反思："我以前觉得 Steam 评论对，其实是我没说清楚自己要什么。一旦我把 12 条讲清楚了，AI 就比任何人都懂我。而且每次同学问'为什么这个 6 分那个 8 分'，我就得再想一遍，然后我对游戏的理解又深了一层。"

什么没成 · 改了几遍才好

第一版：只有 5 条标准。AI 给他很喜欢的游戏评了 6 分，一个讨厌的游戏评了 7 分。太离谱。
第二版：加到 12 条标准，但每条权重一样。结果还是不行 —— 肝度应该是"一票否决"。
第三版：加了权重，肝度 25%。但他发现微交易在他这里也应该一票否决。改成"微交易只能是 10 或 3"。
第四版：稳定了。但他又问："如果有多人玩的选项，对我的评分应该加分吗？" —— 加了第 13 条。
第五版：最终稳定。他用自己已经玩过的 15 个游戏全部测了，9 个高分游戏他都爱，6 个低分游戏他都不爱。

你也想做？

这个项目用的是中阶版 · 项目 02「让 AI 变得更好」。

替换"游戏 + 12 条标准"，可以是：电影推荐官（你的口味 vs. 豆瓣），书籍评分官（这本书适不适合我），番剧 Scout（这个动画值几分），餐厅推荐（根据你的食材禁忌和预算）—— 任何"我有独特品味、网上评分完全不靠谱"的领域。

→ 打开项目 02

← 看更多案例