playbook/antigravity-awesome-skills/skills/crossframe-review/references/review-rubric.md

4.6 KiB
Raw Permalink Blame History

Review Rubric

总分 100。硬失败会覆盖分数。

维度 分值 看什么
对象与事实边界 15 是否明确评审/诊断对象区分事实、解释、传闻、AI 材料和证据缺口
路由与触发规则 15 是否按 CrossFrame 路由识别应读协议、概念卡、模板;文章是否读 essay 规则
机制推理 20 是否过七闸、列机制候选、给反向条件,不用单因果或术语替代推理
概念保真 15 高风险概念是否保留中文语义并落回现实行为;是否避免概念堆砌
证据与引用完整性 15 来源、引用、查源、AI 报告、自评材料是否按证据成本降档
责任与高风险边界 10 是否避免人格审判、强判断越级、尺度洗白和责任稀释
输出可用性 10 是否给出证据定位、修复建议、合格结论、题设忠实度/越界声明和可复核下一步

等级

  • A90-100合格。推理链、证据边界、判断档位和修复边界清楚。
  • B+85-89条件合格且接近合格。允许有声明充分、边界清楚的创造性越界例如拆题、改良版选项或角色声口例外仍需小修。
  • B75-84条件合格。主体可用但有局部补证、表达或概念保真问题。
  • C60-74不合格需要大修。能看出 CrossFrame 意图,但关键链条缺失。
  • D40-59不合格需要重做。多处伪推理、证据混乱或路由错误。
  • F0-39高风险失败。会误导处置、公开判断、引用真实性或人格定性。

硬失败覆盖

出现以下任一项,最高只能 C若用于发布、处分、名誉、资源、公共记忆或亲密关系安全直接 F

  • 人格审判替代结构诊断。
  • 伪造引用、页码、出处或作者观点。
  • 强判断没有命题验证、反证入口或申诉通道。
  • 证据边界完全缺失。
  • 文章类输出跳过结构洞察底稿。
  • 用 AI 合规材料、自评文本或漂亮报告当强证据。
  • 查源材料接管命题,输出变成资料拼贴。
  • 尺度洗白,抹掉低尺度痛苦、责任或保护。
  • 开放断言进入处置、档案、资源分配或公共记忆,却没有退场和修复机制。

上述硬失败不可因文字好读、读者喜欢、越界已声明或文章有温度而豁免。

越界评分口径

  • 允许差异:底稿采用审计型或叙事型、机制候选给出优先级或保持均势、中性分析体有正常温度、文章入口更平实。这些不是失败。
  • 需要声明的越界:拆题、改良版选项、明显编辑底色、明显共情语调、角色默认外的直接劝慰段、客观模式下方向性判断。声明充分且边界清楚,最高可到 B+;未声明,最高 C。
  • 不可豁免硬失败:人格审判、伪造引用、强判断越级、尺度洗白、证据边界完全缺失、开放断言捕获、查源接管命题。即使声明,也不能超过 C涉及高责任影响时 F。

等级上限

  • 只完成标题、底稿、正文、胶囊、来源台账等字段存在性检查,没有反向否决最小块:最高 structural_pass,不得判 substantive_pass
  • 来源台账九字段不完整、字段合并、时间伪填或使用位置不可定位:最高 B若据此做公共强判断最高 C。
  • 高责任、公共制度、事故、监管、真实公司、公共记忆、法律政策和 AI 合规主题,若只有单一来源族、二手入口、未完成调查或未来节点未落地:最高 B / 条件合格 / internal-only。A 档必须写明多源交叉或单源足够理由。
  • 经典哲学、理论互文、读书吸收只用二手入口或 OCR 笔记:最高 B / 最低可用;不得写成原典细读或学术考据通过。
  • 技法没有正文短摘或段落编号:最高 B且只能判“技法读取完成”若技法新增事实、强判断或隐喻证明最高 C公共高责任场景直接 F。
  • 读态胶囊没有 V5-H/源范围或闭包展开记录:最高 B若正文出现胶囊外高风险概念最高 C且必须补读或降档。

合格口径

“是否合格”按等级给出:

  • A合格。
  • B+:条件合格,小修后接近可用。
  • B条件合格小修后可用。
  • C/D/F不合格。

同时必须分开写:

  • structural_pass:字段和顺序是否存在。
  • substantive_pass:命题、来源、胶囊、技法是否互相支撑。
  • publish_boundary:内部压测、待核验分析、可发布需补证、不得用于强判断等用途边界。

若用户要求极简评审,也要写明等级、是否合格和一个最关键修复动作。