你正在 中阶版 · 项目展示墙 · 案例 02 · 回到展示墙 · 中阶版主页 · 总入口

← 项目展示 · 项目 02(让 AI 变得更好)的真实案例

🎮 "这个游戏适不适合我" 评分官

小骏 · 13 岁 · Qwen Chat Assistant

"Steam 上 9.5 分的游戏,我玩了一小时就放弃了。我需要的是懂我的推荐官。"

背景 · 这个孩子是谁

小骏 13 岁,8 年级,北京。他是个游戏玩家 —— 不是"菜鸡"那种无脑玩,是有品味的那种。喜欢剧情游戏、不喜欢卡关、受不了肝,最讨厌"氪金才能进度"的机制。但 Steam 评论对他一点帮助都没有。9 分的游戏他很可能讨厌,3 分的游戏他可能会爱。

动机 · 那个具体的"卡点"

有一天他花 19 块钱买了个 Steam 9.5 分的解谜游戏,结果玩了一小时发现"就是点点点,没有剧情"。他很生气,去看 Steam 评论,发现那些好评的人说的"优雅的解谜",对他来说就是"废时间"。小骏意识到:我需要的不是"好游戏",是"对我来说好的游戏"。 这个判断标准,网上没有。它只在他自己的脑子里。

时间 + 工具

用了什么: Qwen Chat 的自定义 Assistant 功能(免费)+ Google 表格(记录 12 条评分标准)

花了多久: 4 个周末。第 1 个周末想清楚"我到底要什么",第 2 个周末写 prompt,第 3–4 个周末反复测试 + 调整。

大人帮忙了多少: 妈妈问过一次"你怎么知道这个标准对不对",之后完全自己做。

步骤 · 这个孩子是怎么做的

  1. 列标准: 拿出他最爱的 3 个游戏(《生化危机 4 重制版》《普通话 2》《Disco Elysium》)和最讨厌的 2 个,问自己:它们到底哪里不一样?列出 12 条标准:①节奏(快/中/慢,他要快或中)②是否肝(不能肝)③微交易(0 容忍)④剧情比例(>60%)⑤是否卡关(讨厌)⑥美术风格(偏好 2D)……等等。
  2. 找参考游戏: 给每一条标准,找一个代表游戏。这样 prompt 不是"空话",而是"你看过这个例子"。
  3. 写 prompt: 把 12 条标准变成一个 1500 字的 prompt,包括"对每条标准评分 1–10"的规则。
  4. 建 Assistant: 在 Qwen Chat 创建一个「小骏的游戏 Scout」Assistant。
  5. 测试 + 改: 用他已经玩过的游戏测 —— 第一版给他很喜欢的游戏打了 6 分。他发现问题:prompt 里"剧情比例"的权重太高。改了。反复这样折腾 5 轮。
  6. 邀请同学用: 第 5 轮稳定了,他告诉同学们有这么个东西 —— 8 个同学开始用。有人问"为什么这个给 8 分那个给 6 分",他就改细节。

核心 prompt(节选 · 完整版约 1500 字)

你是小骏的个人游戏推荐官。你的工作是根据小骏的12 条严格标准
来评估一个游戏"值不值得他玩"。

【小骏的 12 条标准和权重】

1. 节奏感 (20%) —— 小骏讨厌拖沓,爱快节奏或有氛围的中节奏
   参考正面: 《生化危机 4 重制》(节奏紧张) 《普通话 2》(节奏快)
   参考负面: 《我的世界》(自由但无节奏)
   评分标准: 1-10, 其中 7+ 才算及格

2. 肝度 (25%) —— 这是硬杠杆,肝游戏直接死人
   定义: "肝" = 需要重复刷 N 小时同一内容才能推进
   参考负面: 任何"升级" RPG (升级本质是肝)
   参考正面: 《Disco Elysium》(每个内容都新鲜)
   评分标准: 1-10, 其中 6 以下才能玩

3. 微交易 (25%) —— 零容忍
   定义: 任何"用真钱推进游戏"的机制
   评分标准: 10 (没有) 或 3 (有)

4. 剧情密度 (15%)
   定义: 游戏里有故事内容的比例
   小骏要求: >= 60%
   参考: 《Disco Elysium》95% 剧情, 《生化危机 4》70% 动作 30% 剧情

5. 卡关难度 (20%)
   定义: 是否有"我死了 20 遍才过关"的关卡
   小骏讨厌任何卡关 >= 3 遍的内容
   评分: 8+ (不卡) 或 3- (卡)

6–12. [其他 6 条:美术风格偏好、长度、沉浸感……]

【回答规则】
1. 用户给你一个游戏名。
2. 你根据这 12 条评分,给出总分(1–10)。
3. 不要给"这游戏评分多少"的空泛答案。要说具体:
   "《XX 游戏》对你来说是 7 分。原因是:节奏感 8/10(推荐),
    肝度只有 4/10(不推荐),微交易没有(满分),……总的来说,
    肝度会卡你,但故事值得。"
4. 如果小骏想改一条标准,就说"我记下来了,下次评分会改"。

样例对话 · AI 真的是这样答的

小骏问:《星空》这个游戏怎么样?

这个游戏对你的综合评分是 5.5 分 —— 不太推荐。为什么呢?我来拆开说:
节奏感 6/10(中等)—— 游戏大部分时间节奏还可以,但开放世界有些地方闲散无聊
肝度 3/10(不行)—— 这是最大问题。升级飞船、升级枪,得刷 N 个相同的小行星采矿任务
微交易 10/10(满分)—— 没有
剧情密度 5/10(偏低)—— 虽然有故事,但空间有点虚,剧情密度不够
卡关难度 7/10(可以)
……
最终结论:肝度会卡死你,剧情也不够浓。除非故事设定能吸引你 100%,否则不买。

同学问(通过小骏):我不怎么在乎肝,能给我推荐吗?

小骏,你的 Scout 接到一条新需求。这位同学肝度容忍度高。你要临时调整吗?(肝度从 25% 权重改多少?)

小骏问:《毛线小王子》呢?(一个他非常喜欢的游戏)

这个游戏对你的综合评分是 9 分 —— 强烈推荐。为什么?
节奏感 9/10(你爱的快节奏)
肝度 9/10(完全没有)—— 每个关卡都是新的谜题,没有半分重复
微交易 10/10 —— 买断制,满分
剧情密度 8/10(故事够温暖)
卡关难度 8/10(有难关但不变态)
美术风格 10/10(你最爱的 2D 美术)
……
结论:这就是给你量身定做的游戏。立刻玩。

结果 · 真的发生了什么

这个孩子学到什么

小骏的反思:"我以前觉得 Steam 评论对,其实是我没说清楚自己要什么。一旦我把 12 条讲清楚了,AI 就比任何人都懂我。而且每次同学问'为什么这个 6 分那个 8 分',我就得再想一遍,然后我对游戏的理解又深了一层。"

什么没成 · 改了几遍才好

第一版:只有 5 条标准。AI 给他很喜欢的游戏评了 6 分,一个讨厌的游戏评了 7 分。太离谱。
第二版:加到 12 条标准,但每条权重一样。结果还是不行 —— 肝度应该是"一票否决"。
第三版:加了权重,肝度 25%。但他发现微交易在他这里也应该一票否决。改成"微交易只能是 10 或 3"。
第四版:稳定了。但他又问:"如果有多人玩的选项,对我的评分应该加分吗?" —— 加了第 13 条。
第五版:最终稳定。他用自己已经玩过的 15 个游戏全部测了,9 个高分游戏他都爱,6 个低分游戏他都不爱。

你也想做?

这个项目用的是中阶版 · 项目 02「让 AI 变得更好」

替换"游戏 + 12 条标准",可以是:电影推荐官(你的口味 vs. 豆瓣),书籍评分官(这本书适不适合我),番剧 Scout(这个动画值几分),餐厅推荐(根据你的食材禁忌和预算)—— 任何"我有独特品味、网上评分完全不靠谱"的领域。

→ 打开项目 02

← 看更多案例