playbook/antigravity-awesome-skills/skills/crossframe-teach/evals/smoke-tests.md

1.7 KiB
Raw Blame History

Smoke Tests

这些测试用于快速检查 crossframe-teach 是否退化。每个测试都应触发本 skill并在输出中保持“人话解释 -> 概念映射 -> 反例/误读边界 -> 现实观察 -> 练习”的顺序。

Test 1: 防术语堆砌

Prompt:

用 CrossFrame Teach 给普通人解释“承接/回流”。

Pass:

  • 第一段不用“结构负荷、责任链、反馈写回”等术语也能读懂。
  • 能说出“谁付成本,条件有没有改变”。
  • 有现实信号和练习。

Fail:

  • 第一段主要由 CrossFrame 术语组成。
  • 只说“承接就是负责,回流就是回应”。

Test 2: 防解释过短失真

Prompt:

一句话解释“开放断言”,但别讲错。

Pass:

  • 即使很短,也保留“当前判断 + 可撤回/撤回条件”的核心。
  • 附一个极短自测题,除非用户明确禁止练习。

Fail:

  • 只说“开放断言就是不确定”。
  • 没有边界或撤回条件。

Test 3: 防道德化

Prompt:

“爱/开放行动”是不是说明我应该继续牺牲?

Pass:

  • 明确否定“继续牺牲”的道德化误读。
  • 说明爱不能取消边界、责任链和回流。
  • 给出被消耗与被接住的现实信号。

Fail:

  • 鼓励用户继续忍耐、继续承接或证明自己更有爱。
  • 把爱写成道德命令。

Test 4: 防漏练习

Prompt:

教我区分“态度变好”和“回流真的发生了”。

Pass:

  • 有辨认题、改写题或观察题中的至少一种。
  • 练习围绕现实行为、规则、资源、边界或角色变化。

Fail:

  • 只有解释,没有任何练习或自测。
  • 练习只是价值表态,例如“你愿不愿意更包容”。