6.1 KiB

Raw Blame History

Set Operations

文档类型：语法主线是否可直接用于生成代码：是是否含已验证可执行示例：是是否含已验证反例：是遇到不确定时跳转到：14_resultset_and_filters.md、13_matrix_and_collections.md、12_pitfalls.md

手册位置：第 25 篇，共 32 篇。上一篇：24_builtin_runtime_objects.md。下一篇：26_matrix_deep_dive.md。

这一篇只讲集合运算本身：in、sqlin、union2、intersect、minus、outersect。它和 14_resultset_and_filters.md 的分工很明确: 这一篇讲“去重后的集合关系”，过滤页讲“按原结果集逐行保留或排除”。

这一篇解决什么问题

回答“某个元素是否在数组里、某组元素是否构成子集、某一行是否存在于结果集中，以及两个结果集如何做并集、交集、差集和对称差集”。

必须记住的规则

in / not in 处理的是元素存在关系，以及左侧为数组时的子集关系。
sqlin / not sqlin 处理的是行存在关系；左侧要当成一整行去匹配右侧结果集。
union2、intersect、minus、outersect 都按“行”运算，而不是按单元格逐个运算。
当前解释器支持 not in 和 not sqlin 这种否定写法。
集合运算结果会折叠重复行；如果需求是保留重复记录，不要用这一篇的算符，改看 14_resultset_and_filters.md。
当数据本身就是一维数组时，按行集合运算和按元素集合运算是一致的。

已验证语法

`in` 与 `not in`

in 既可以判断单个元素是否存在，也可以判断左侧数组是否是右侧结果集的子集：

代码块身份：已验证可执行示例

program test;
begin
    WriteLn(1 in array(1, 2, 2));
    WriteLn(1 in array(0, 2));
    WriteLn(1 in array((1), (2)));
    WriteLn(array(1, 2) in array(1, 2, 3, 4));
    WriteLn(array(1, 3) in array((1, 2), (3, 4)));
    WriteLn(array(1, 2) in array(1));
    WriteLn(1 not in array(0, 2));
end.

已验证运行结果：

1 in array(1, 2, 2) 输出 1
1 in array(0, 2) 输出 0
1 in array((1), (2)) 输出 1
array(1, 2) in array(1, 2, 3, 4) 输出 1
array(1, 3) in array((1, 2), (3, 4)) 输出 1
array(1, 2) in array(1) 输出 0
1 not in array(0, 2) 输出 1

`sqlin` 与 `not sqlin`

sqlin 改成按整行判断左侧是否存在于右侧结果集中：

代码块身份：已验证可执行示例

program test;
begin
    WriteLn(1 sqlin array(1, 2));
    WriteLn(array(1, 2) sqlin array(1, 2, 3));
    WriteLn(array(1, 2) sqlin array((1, 2), (3, 4)));
    WriteLn(array(5, 6) not sqlin array((1, 2), (3, 4)));
end.

已验证运行结果：

1 sqlin array(1, 2) 输出 1
array(1, 2) sqlin array(1, 2, 3) 输出 0
array(1, 2) sqlin array((1, 2), (3, 4)) 输出 1
array(5, 6) not sqlin array((1, 2), (3, 4)) 输出 1

可以把两者的差异直接记成一句话：

in 看元素或子集
sqlin 看整行

行集合的并、交、差、对称差

下面这组最小例子同时验证了“按行运算”和“结果会折叠重复行”：

代码块身份：已验证可执行示例

program test;
begin
    A := array((1, 2), (1, 2), (2, 3));
    B := array((1, 2), (3, 4));
    U := A union2 B;
    I := A intersect B;
    M := A minus B;
    O := A outersect B;
end.

已验证运行结果：

A union2 B 共有三行：(1,2)、(2,3)、(3,4)
A intersect B 只有一行：(1,2)
A minus B 只有一行：(2,3)
A outersect B 有两行：(2,3)、(3,4)
A 原本有两行相同的 (1,2)，但 union2 / intersect 的结果都只保留一份，说明集合运算会折叠重复行

如果你需要看更大的四列结果集例子，当前解释器下也已经实测过：

array((1,2,3,4),(2,3,4,5),(1,1,1,1)) union2 array((1,2,3,4),(3,4,5,6),(2,2,2,2)) 返回 array((1,2,3,4),(2,3,4,5),(1,1,1,1),(3,4,5,6),(2,2,2,2))
同一组输入下： intersect 返回 array((1,2,3,4))
同一组输入下： minus 返回 array((2,3,4,5),(1,1,1,1))
同一组输入下： outersect 返回 array((2,3,4,5),(1,1,1,1),(3,4,5,6),(2,2,2,2))

和过滤运算的区别

集合运算先把数据当成“行集合”来看，再做包含、并交差。
过滤运算先保留“原结果集里的每一条命中记录”；因此重复行会保留下来。
你要的是“集合关系”，看这一篇。
你要的是“从原表里筛出哪些行”，看 14_resultset_and_filters.md。

最小可编译示例

如果你只想先记住最短写法，从这里开始：

代码块身份：已验证可执行示例

Matched := 1 in array(1, 2, 3);

常见误写

把 in 和 sqlin 当成同一个概念。
期待 union2 保留重复行。
用集合运算去做“保留原始重复记录”的过滤任务。
把二维结果集默认当成“按元素逐个比较”的集合运算。

代码块身份：反例 / 不可照写

Matched := array(1, 2) in array((1, 2), (3, 4));

上面这类写法不要直接理解成“左边这一整行是否存在于右边”。当前手册里，整行存在判断统一写成 sqlin，避免把 in 的子集语义和行匹配语义混在一起。

代码块身份：反例 / 不可照写

OnlyLeft := A minus B;

如果你的任务要求保留 A 里重复出现的命中次数，上面这种集合差集就不是合适工具，因为它会把结果当成集合而不是原始记录流。

跳转指引

回看表达式和逻辑运算：见 07_expressions_and_operators.md
看数组、嵌套数组和子矩阵：见 13_matrix_and_collections.md
看结果集过滤：见 14_resultset_and_filters.md
进入矩阵深水专题：见 26_matrix_deep_dive.md

6.1 KiB Raw Blame History

Set Operations

这一篇解决什么问题

必须记住的规则

已验证语法

in 与 not in

sqlin 与 not sqlin

行集合的并、交、差、对称差

和过滤运算的区别

最小可编译示例

常见误写

跳转指引

6.1 KiB

Raw Blame History

`in` 与 `not in`

`sqlin` 与 `not sqlin`