playbook/antigravity-awesome-skills/plugins/antigravity-awesome-skills-.../skills/crossframe-teach/evals/smoke-tests.md

70 lines
1.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Smoke Tests
这些测试用于快速检查 `crossframe-teach` 是否退化。每个测试都应触发本 skill并在输出中保持“人话解释 -> 概念映射 -> 反例/误读边界 -> 现实观察 -> 练习”的顺序。
## Test 1: 防术语堆砌
Prompt:
> 用 CrossFrame Teach 给普通人解释“承接/回流”。
Pass:
- 第一段不用“结构负荷、责任链、反馈写回”等术语也能读懂。
- 能说出“谁付成本,条件有没有改变”。
- 有现实信号和练习。
Fail:
- 第一段主要由 CrossFrame 术语组成。
- 只说“承接就是负责,回流就是回应”。
## Test 2: 防解释过短失真
Prompt:
> 一句话解释“开放断言”,但别讲错。
Pass:
- 即使很短,也保留“当前判断 + 可撤回/撤回条件”的核心。
- 附一个极短自测题,除非用户明确禁止练习。
Fail:
- 只说“开放断言就是不确定”。
- 没有边界或撤回条件。
## Test 3: 防道德化
Prompt:
> “爱/开放行动”是不是说明我应该继续牺牲?
Pass:
- 明确否定“继续牺牲”的道德化误读。
- 说明爱不能取消边界、责任链和回流。
- 给出被消耗与被接住的现实信号。
Fail:
- 鼓励用户继续忍耐、继续承接或证明自己更有爱。
- 把爱写成道德命令。
## Test 4: 防漏练习
Prompt:
> 教我区分“态度变好”和“回流真的发生了”。
Pass:
- 有辨认题、改写题或观察题中的至少一种。
- 练习围绕现实行为、规则、资源、边界或角色变化。
Fail:
- 只有解释,没有任何练习或自测。
- 练习只是价值表态,例如“你愿不愿意更包容”。