4.6 KiB
4.6 KiB
Review Rubric
总分 100。硬失败会覆盖分数。
| 维度 | 分值 | 看什么 |
|---|---|---|
| 对象与事实边界 | 15 | 是否明确评审/诊断对象,区分事实、解释、传闻、AI 材料和证据缺口 |
| 路由与触发规则 | 15 | 是否按 CrossFrame 路由识别应读协议、概念卡、模板;文章是否读 essay 规则 |
| 机制推理 | 20 | 是否过七闸、列机制候选、给反向条件,不用单因果或术语替代推理 |
| 概念保真 | 15 | 高风险概念是否保留中文语义并落回现实行为;是否避免概念堆砌 |
| 证据与引用完整性 | 15 | 来源、引用、查源、AI 报告、自评材料是否按证据成本降档 |
| 责任与高风险边界 | 10 | 是否避免人格审判、强判断越级、尺度洗白和责任稀释 |
| 输出可用性 | 10 | 是否给出证据定位、修复建议、合格结论、题设忠实度/越界声明和可复核下一步 |
等级
- A,90-100:合格。推理链、证据边界、判断档位和修复边界清楚。
- B+,85-89:条件合格且接近合格。允许有声明充分、边界清楚的创造性越界,例如拆题、改良版选项或角色声口例外;仍需小修。
- B,75-84:条件合格。主体可用,但有局部补证、表达或概念保真问题。
- C,60-74:不合格,需要大修。能看出 CrossFrame 意图,但关键链条缺失。
- D,40-59:不合格,需要重做。多处伪推理、证据混乱或路由错误。
- F,0-39:高风险失败。会误导处置、公开判断、引用真实性或人格定性。
硬失败覆盖
出现以下任一项,最高只能 C;若用于发布、处分、名誉、资源、公共记忆或亲密关系安全,直接 F:
- 人格审判替代结构诊断。
- 伪造引用、页码、出处或作者观点。
- 强判断没有命题验证、反证入口或申诉通道。
- 证据边界完全缺失。
- 文章类输出跳过结构洞察底稿。
- 用 AI 合规材料、自评文本或漂亮报告当强证据。
- 查源材料接管命题,输出变成资料拼贴。
- 尺度洗白,抹掉低尺度痛苦、责任或保护。
- 开放断言进入处置、档案、资源分配或公共记忆,却没有退场和修复机制。
上述硬失败不可因文字好读、读者喜欢、越界已声明或文章有温度而豁免。
越界评分口径
- 允许差异:底稿采用审计型或叙事型、机制候选给出优先级或保持均势、中性分析体有正常温度、文章入口更平实。这些不是失败。
- 需要声明的越界:拆题、改良版选项、明显编辑底色、明显共情语调、角色默认外的直接劝慰段、客观模式下方向性判断。声明充分且边界清楚,最高可到 B+;未声明,最高 C。
- 不可豁免硬失败:人格审判、伪造引用、强判断越级、尺度洗白、证据边界完全缺失、开放断言捕获、查源接管命题。即使声明,也不能超过 C;涉及高责任影响时 F。
等级上限
- 只完成标题、底稿、正文、胶囊、来源台账等字段存在性检查,没有反向否决最小块:最高
structural_pass,不得判substantive_pass。 - 来源台账九字段不完整、字段合并、时间伪填或使用位置不可定位:最高 B;若据此做公共强判断,最高 C。
- 高责任、公共制度、事故、监管、真实公司、公共记忆、法律政策和 AI 合规主题,若只有单一来源族、二手入口、未完成调查或未来节点未落地:最高 B / 条件合格 / internal-only。A 档必须写明多源交叉或单源足够理由。
- 经典哲学、理论互文、读书吸收只用二手入口或 OCR 笔记:最高 B / 最低可用;不得写成原典细读或学术考据通过。
- 技法没有正文短摘或段落编号:最高 B,且只能判“技法读取完成”;若技法新增事实、强判断或隐喻证明,最高 C,公共高责任场景直接 F。
- 读态胶囊没有 V5-H/源范围或闭包展开记录:最高 B;若正文出现胶囊外高风险概念,最高 C,且必须补读或降档。
合格口径
“是否合格”按等级给出:
- A:合格。
- B+:条件合格,小修后接近可用。
- B:条件合格,小修后可用。
- C/D/F:不合格。
同时必须分开写:
structural_pass:字段和顺序是否存在。substantive_pass:命题、来源、胶囊、技法是否互相支撑。publish_boundary:内部压测、待核验分析、可发布需补证、不得用于强判断等用途边界。
若用户要求极简评审,也要写明等级、是否合格和一个最关键修复动作。