学院 04 · 纯审美 · 4 个模块 · 只给 13–14 岁

⚖️ 审美工作室

让 AI 变好的"暗功夫"

第四所，也是最小的一所学院。最哲学、最深、最少废话。审美不是一种感觉 —— 它是一套系统。一套你可以让别的系统、和未来的自己，都对着它对齐的系统。

新概念：什么是"判官 AI"（LLM-as-judge）？

就是 —— 让一个 AI 去给另一个 AI 的回答打分。

具体怎么做？你写一份"评分标准"（5 条："字数在 50–100 之间"、"语气活泼"、"不能出现专业术语"……），然后让 AI A 生成一段文字，再让 AI B 拿着这份标准给 A 的输出打分。

为什么有用？因为人不可能每天手动检查 AI 给的几百条回答，但 AI 可以。这就是审美工作室最核心的招式：把"我觉得这个好"，变成"AI 也能照着判的标准"。

为什么单独一所只讲审美？因为前三所学院都在"做东西"。但当一个孩子长到 13、14 岁，他需要学的下一件事，是"怎么知道自己做的东西好"。这件事不学会，AI 时代他每一次按下"生成"，都是在向"灰色泥浆"里多倒一勺。

小测什么是"审美漂移"？

下面哪个现象才是"审美漂移"？

我上个月喜欢红色，这个月喜欢蓝色。
我六个月前写的代码，当时我觉得"很好"，今天我看了觉得"变量名取得太随意了、逻辑太复杂"。我对"什么是好代码"的标准，在无意中悄悄改了。
我和朋友对同一部电影的评价不一样。
我今年的作文比去年的作文更长。

解释："审美漂移"的关键是"你自己的标准在悄悄改变"。不是颜色偏好的改变，而是"评判标准本身的改变"。第二个选项里，你对"好代码"的理解在半年间变了。这种改变如果没被察觉，会导致你写出来的东西质量参差不齐。审美工作室的目标，就是让这种"漂移"变成"可见"的、"可控制"的。

⚖️ 这个学院用什么工具？

原版用 DeepSeek API（付费）作为"判官"。我们用：

Ollama 本地跑或通义千问网页版 / DeepSeek 模型（免费做"判官 AI"）
VS Code + Continue（写评分代码）
JSON 格式（写"评分标尺"）

→ 看完整入门手册

动手我的 5 条审美标准

任务：选一种你经常"做"的东西（代码、画画、写字、做菜、穿搭）。写下 5 条"什么时候我觉得它好"的标准。要尽量具体，不要"好看""舒服"这种模糊词。

写下你的标准：

已复制 ✓

看参考标准

没有标准答案，但这是一个真实例子：

我的"代码"的 5 条审美标准是：
① 变量名能让陌生人一读就知道是什么（不用猜）
② 一个函数不超过 20 行（超过就该拆）
③ 重复的代码被提取成公共函数（没有复制粘贴）
④ 有清晰的报错信息，让用户知道哪里出了问题
⑤ 后来的人改我的代码，也能快速看懂逻辑

为什么这个好？因为这 5 条都是"可以被检查的" —— 你可以数一下函数行数、检查变量名是否清晰、列出所有重复的代码。当你有了这 5 条标准，再看任何代码，你都有"判的武器"。

⚙️ 创作者层

13–14 岁

"好"到底是什么意思？

大多数人没认真想过这个问题。这一节让孩子写下他自己心里"好"的 5 条标准 —— 然后发现，这 5 条之间会打架。这是审美的第一课：好不是一个值，是一组权衡。

做你自己的判官

把上一节的 5 条标准，写成一个 AI 能跑的"评分系统"。给它 10 个新作品，让它打分。然后看哪些和你的直觉吻合 —— 不吻合的地方，是你审美没想清楚的地方。

抓住自己在漂移的那一刻

三个月前的你和今天的你，对同一个东西的判断，可能已经不一样了。这一节做一个"漂移检测器"—— 让过去的你和现在的你对话，看自己变了什么。

★

大压轴 —— 把四所学院全部串起来

用技能工坊的"教 AI"、代码俱乐部的"真代码"、智能体实验室的"为别人做"、审美工作室的"评判系统"，做一个完整的、有自己审美主张的、为一个具体的人服务的 AI 应用。这是整个薪火课程的毕业礼。

地图 4 个模块的递进逻辑

打开看审美工作室怎么从"感觉"变成"系统"

审美工作室这 4 个模块，每一个都在"把无形的审美变成有形的工具"。这是整个过程：

模块 01：把"好"写成 5 条标准 —— 你知道什么算好，但你能写出来吗？这一节强迫孩子把直觉变成文字。
模块 02：让 AI 当评委 —— LLM-as-judge 入门。让 AI 用你的 5 条标准给一堆样本打分，看它跟你的口味差多远。
模块 03：抓"漂移" —— 孩子的审美会变。怎么知道是"长大了"还是"被网络教坏了"？建一个"自己审美的版本控制"。
模块 04（压轴）：把四所学院串起来 —— 这是整个薪火的毕业作品。把技能、代码、智能体、审美工作室四件事合成一个完整的系统。

从"我感觉这个好"到"我有一个能持续监测好不好的系统" —— 这就是审美工作室四个模块的递进。

⚖️ 创作者层

13–14 岁

把"好"写成 5 条标准

孩子知道什么是好的，但能不能写出来？这是审美的起点：把直觉变成可以分享、可以挑战、可以更新的文字。

让 AI 当评委

LLM-as-judge 的最初版本。让 AI 用你的 5 条标准给样本打分，对照自己打的分数，看 AI 的"口味"和你的差多远。

抓审美漂移

孩子的审美会变。AI 给的"今天最好"也会变。怎么区分"长大了"和"被算法带偏了"？这一节做一个"自己的审美版本

这所学院在练 评估框架 / LLM-as-judge