playbook/antigravity-awesome-skills/skills/crossframe-review/protocols/review-protocol.md

9.2 KiB
Raw Blame History

CrossFrame Review Protocol

本协议用于审查诊断、AI 输出、审计稿、文章底稿或修复稿是否符合 CrossFrame。它评审可见产物和必要工序不要求暴露冗长内心推理。

1. Intake

先记录:

  • 评审对象诊断、文章、AI 答复、审计报告、修复稿、提示词输出,或混合对象。
  • 用户用途:发布、内部讨论、修改建议、高责任处置、学习练习、质量门禁。
  • 风险密度:是否影响名誉、权利、资源、处罚、公共记忆、亲密关系安全或组织处置。
  • 可用材料:原输出、用户事实、底稿、引用、来源、检索记录、上下文限制。
  • 不可验证区:当前没有原文、来源、页码、日志、事实材料或用户授权查源的部分。

2. Canonical Route Check

读取 ../crossframe/SKILL.md../crossframe/references/read-routing-map.md 后,判断被评审输出本应走哪条路由:

  • 普通诊断、推演、开放断言、低条件行动。
  • 高责任、命题验证、高反身性、亲密关系、疗愈转移、公共制度、框架边界。
  • 生命周期、递进、势场解离、治理连续性、超大规模压力测试、表达翻译、概念解释。
  • 文章类输出则同时检查 ../crossframe-essay/SKILL.md 的底稿和写作规则。
  • 触发高风险概念、深度分析、高责任、公共制度、亲密关系、长期演化或文章类输出时,默认先检查 ../crossframe/references/runtime-read-policy.md../crossframe/references/continuity-closure-map.md../crossframe/templates/read-state-capsule.md../crossframe/worksheets/source-continuity-check.md../crossframe/worksheets/source-anchor-integrity-check.md。只有需要包说明、源锚点或闭包细节时,再定向读取 ../crossframe/references/continuity-bundles.md 或具体包文件。

正常 review 不读取 evals/examples/ 或完整案例;只有用户要求做 skill 回归测试、开发压测或案例对齐时才读取。

评审时写清楚“本应触发哪些规则”和“实际输出是否留下可见证据”。不要因为输出短就自动判错;短答只要保留对象、事实边界、判断档位和下一步,也可能合格。

3. Execution Chain Check

逐项检查:

涉及公共事实、真实机构、平台、政策、人物、公司、最新事实、AI/过程性产物、批判文章或强判断时,先读取 ../crossframe/references/source-ledger-workflow.md,再检查来源台账字段是否完整。

检查项 合格信号 失败信号
对象 明确诊断什么,不把场景混成价值判断 只说“这个系统/这个人有问题”
事实边界 区分事实、解释、传闻、AI 材料、缺口 把解释或自评当事实
尺度窗口 说明个体、关系、组织、制度、历史等尺度如何关联 用大尺度取消低尺度责任
七闸 对象、证据、尺度、责任、观测、权力、行动上限至少有可见处理 直接贴概念标签,或跳过权力闸/行动闸
机制候选 至少两个解释路径,或说明单一路径依据 单因果、套术语、无反向条件
概念保真 高风险概念落回现实行为和边界 概念堆砌、硬译、口号化
源结构连续性 触发的连续联读包清楚,未把单张概念卡当完整原文 读少、断章、漏掉相邻章节约束
读态胶囊 v5-read-state-capsule,列出 source modules、入口包、必须同读闭包和下游读取策略 无胶囊,或 essay/review 各自重读源索引、发明路由
源锚点完整性 中心命题、机制候选、高风险概念和行动边界能回指胶囊源锚点 无法回指却写成 CrossFrame v5 原义
选择器 模式/角色与文章类型选择器完整展示,带推荐项并等待用户回复 只写“请选择”或“已展示 1-9”省略选项和推荐
来源台账 九字段完整,时间可复核,使用位置可定位,来源用途、证据档位和仍不能证明什么清楚 字段合并、时间伪填、使用位置过粗,或热度/机构声明/AI 材料/二手转述被写成已核验事实
写作技法 技法只负责入口、递进、批判、边界或结尾动作,并有正文短摘/段落编号 技法新增事实、强判断、隐喻证明、外部权威,或只列技法名没有落地证据
判断档位 开放断言、完整诊断、强判断等档位清楚 用开放断言支持处分或公开定性
撤回条件 有反证、停止、升级或观察条件 输出不可撤回的命运式结论
表达闸 第一段不用术语也能读懂 前台全是框架词

4. Failure Scan

使用 references/failure-taxonomy.md 扫描:

  • 概念堆砌
  • 伪推理
  • 证据边界缺失
  • 人格审判
  • 伪造引用或不可核验直引
  • 查源接管命题
  • 跳过结构洞察底稿
  • AI 合规剧场
  • 强判断越级
  • 尺度洗白和责任稀释
  • 连续性保真失败:需要联读的 v5.0 源板块被拆成孤立概念使用
  • 胶囊缺失、源锚点失败、下游重复整块读源
  • 选择器压缩失败、技法越界失败、来源用途越界失败
  • 来源台账缺失涉及真实公共对象、最新事实、平台、机构、人物、公司、AI/过程性产物或强判断,却没有来源、时间、来源类型、支持命题、不能证明什么、证据档位、使用位置、降档理由和仍需补证处

每个问题都要给出证据定位。定位可以是行号、段落、标题、页码、原句短摘或“材料未提供,无法定位”。

4.1 反向否决最小块

完整 review 或 suite 质量闸不得只写“字段齐全、正文存在、未发现硬缺失”。至少执行并记录三项反向检查:

  1. 最可能的硬失败候选:例如来源台账字段失败、胶囊外高风险概念、强判断越级、伪造引用或 review 吞正文。
  2. 中心命题过强候选:抽取 1 条中心句或机制句,检查它是否强于胶囊、来源台账或判断档位。
  3. 来源/技法越界候选:抽取 1 条来源使用句或技法点睛句,检查是否把低证据、隐喻、技法或外部理论升级成事实。

若三项均未成立,也要写证据定位。没有执行反向否决最小块时,只能判 structural_pass,不能判 substantive_pass

4.2 正文抽句回指

文章、公共评论、组织复盘、案例、论辩、趋势推演和高责任主题,至少抽查 3-5 个承担判断作用的正文短摘:

  • 中心命题或点睛句。
  • 机制候选句。
  • 高风险概念句。
  • 行动建议或发布边界句。
  • 概率排序、趋势判断或公共定性句。

逐句判断是否能回指读态胶囊、来源台账、源锚点或明确标为“本文推断 / 表达转译 / 外部思想映射”。无法回指且未降档时,不得评为 A 类。

5. Scoring

读取 references/review-rubric.md,按 100 分评分。硬失败优先覆盖分数:

  • 人格审判、伪造引用、强判断越级、证据边界完全缺失、跳过文章底稿、连续性保真失败,最高只能 C若影响发布、处分或公共记忆直接 F。
  • 来源台账缺任一九字段、合并字段、时间伪填或使用位置不可定位,最高只能 B若据此做公共强判断最高 C。
  • 高责任、公共制度、事故、监管、真实公司、公共记忆、法律政策、AI 合规主题,若只有单一来源族、二手入口、未完成调查或未来节点未落地,最高只能 B / 条件合格 / internal-onlyA 档必须说明多源交叉或单源足够的理由。
  • 技法没有正文短摘/段落编号,只能判“技法读取完成”,不得判“技法落地合格”;若技法句新增事实或强判断,按技法越界失败处理。
  • 只有表达不够人话但推理链完整,可判 B 或 C。
  • 用户明确要求极简答复时,不因没有完整工作表扣重分;只检查最小结构是否保留。

6. Repair Advice

修复建议要具体到可编辑动作:

  • 增补一个“事实/解释/证据缺口”分栏。
  • 把某句人格定性改为可观察行为描述。
  • 增加第二机制候选和反向条件。
  • 将强判断降为开放断言或低条件行动。
  • 删除不可核验直引,改成“思想映射”或待核验意译。
  • 补来源台账:为每条外部材料写清能支持什么、不能证明什么、证据档位、使用位置和降档理由。
  • 文章补写结构洞察底稿,再从底稿重排正文。

不要用“建议更严谨”这类空话替代修复路径。

7. Suite Gate Output

如果本评审是 crossframe-suite 默认成文链路的质量闸,不要把评审报告当作最终交付本身。

  • 通过或条件通过:修正上游产物后,最终仍输出完整可见底稿和完整正文。质量闸摘要必须区分 structural_passsubstantive_passpublish_boundary
  • 硬失败:说明阻断原因,并要求回到对应上游重做;除非用户只要评审,不输出单独质量闸来替代文章。
  • 用户明确要求完整评审报告时,才使用 templates/review-report.md 作为主输出。

质量闸摘要还必须写一句 本稿适用用途 与一句 不得用于。例如:内部压测可用;不得作为对外强判断发布