435 lines
11 KiB
Markdown
435 lines
11 KiB
Markdown
# TSL 值与字面量
|
||
|
||
文档类型:语法主线
|
||
是否可直接用于生成代码:是
|
||
是否含可直接照写示例:是
|
||
是否含不可照写反例:是
|
||
遇到不确定时:先按本页候选页继续判断;[04_variables_and_constants.md](04_variables_and_constants.md)、[06_expressions_and_operators.md](06_expressions_and_operators.md)、[12_matrix_and_collections.md](12_matrix_and_collections.md)、[17_types_and_conversions.md](17_types_and_conversions.md);仍不命中时回到语法路由中心 [index.md](index.md);如果问题已经超出语法层,回到 TSL 总入口 [../index.md](../index.md)
|
||
|
||
这一篇整理基本类型、字面量、数组、字符串、字符串编码边界与基础值模型,避免把值规则分散在函数或金融示例里。
|
||
|
||
## 本篇职责
|
||
|
||
回答“基本类型怎么写、数组和字符串怎么索引、字符串编码边界怎么写、哪些值规则属于语言级事实”。矩阵、集合扩展和复杂容器不在本页展开;命中这些任务时跳到 [12_matrix_and_collections.md](12_matrix_and_collections.md) 或对应深水专题。
|
||
|
||
## 智能体值写法判断流程
|
||
|
||
1. 普通值优先从整数、实数、普通字符串、布尔和 `array(...)` 起手。
|
||
2. 字符串默认用普通字符串;只有编码、宽串、UTF8、原始字符串、字符码或 ASCII `0` 需求明确时,才使用本页字符串边界规则里的文档明确形态。
|
||
3. 看到 `array(...)` 时,先判断要顺序数组还是字符串键表:顺序数组用位置元素,字符串键表用 `"Key": value`。
|
||
4. 写下标前先判断对象类别:顺序数组和二进制缓冲区下标从 `0` 开始,字符串下标从 `1` 开始。
|
||
5. 写字符串区间前先确认 `s[start:end]` 的 `end` 会被包含;不要按半开区间推断。
|
||
6. 如果任务已经变成矩阵、集合扩展、结果集过滤或 TS-SQL 数据形态,不要留在值页硬拼写法;先跳到 [12_matrix_and_collections.md](12_matrix_and_collections.md)、[13_resultset_and_filters.md](13_resultset_and_filters.md) 或 [14_ts_sql.md](14_ts_sql.md)。
|
||
7. 没有对应代码块时不要发明值写法;尤其不要从 JSON、JavaScript、Pascal 或 C 字符串规则直接迁移。
|
||
|
||
## 核心规则
|
||
|
||
- 最先掌握的几类值是:整数、实数、普通字符串、布尔和 `array(...)`。
|
||
- 普通字符串既可以用双引号,也可以用单引号。
|
||
- 同类引号本身可以通过连续写两个同类引号放进字符串里。
|
||
- `\\`、`\"`、`\n` 这类基础转义可用。
|
||
- `\t` 和 `\xNN` 这类转义也可用。
|
||
- `\r`、`\r\n`、`\a`、`\b`、`\f`、`\v` 这些经典转义也可用。
|
||
- `array(...)` 既可以写顺序数组,也可以写字符串键表。
|
||
- 顺序数组下标从 `0` 开始。
|
||
- `binary(...)` 创建的二进制缓冲区也用 `[]` 访问,并且下标从 `0` 开始。
|
||
- 字符串下标从 `1` 开始。
|
||
- `s[0]` 在运行时会越界,不要把字符串当成 0 基下标。
|
||
- 字符串取子串用 `s[start:end]`,并且 `end` 是包含在结果里的。
|
||
- 字符串替换子串用 `s[start:end] := "..."`。
|
||
- 字符串删除子串,本质上就是 `s[start:end] := ""`。
|
||
- 字符串插入子串用 `s[index:0] := "..."`。
|
||
- 普通字符串、`L""` 宽串、`U""` UTF8 前缀串,以及 `%%` 原始字符串都属于文档明确写法。
|
||
- `%%` 原始字符串开头后必须先跟一个空白分隔符;可以带标识符,也支持多行。
|
||
- `L%% ...%%` 与 `U%% ...%%` 这两种带前缀的原始字符串也属于文档明确写法。
|
||
- 普通字符串里的 `\uXXXX` 不要直接按“单字符宽串”理解;`length("\u0041") = 2`,而 `length(L"\u0041") = 1`、`length(U"\u0041") = 1`。
|
||
- `U""` 不是宽串;需要在 UTF8、宽串、普通串之间显式转换时,继续用 `utf8ToUnicode(...)`、`utf8ToAnsi(...)`、`ansiToUtf8(...)`、`unicodeToUtf8(...)`、`string(...)`、`wideString(...)`。
|
||
- `#number` 可以直接把字符码拼进字符串。
|
||
- `\0` 和 `#0` 都能把 ASCII `0` 放进字符串,并且不会把字符串截断。
|
||
|
||
## 可直接照写示例
|
||
|
||
使用这些示例时遵守:
|
||
|
||
- 只复制任务需要的值、字面量、下标或字符串片段,不要把多个示例拼成未写入文档的新语法。
|
||
- 普通示例默认按 `.tsl` 脚本语句区书写;需要函数或类型时,放在后置声明区。
|
||
- 字符串编码、宽串和原始字符串边界不清楚时,优先看本页“字符串边界规则”。
|
||
|
||
最基础的值写法:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
count := 1;
|
||
price := 12.5;
|
||
name := "ABC";
|
||
flag1 := true;
|
||
flag2 := false;
|
||
items := array(1, 2, 3);
|
||
writeLn(count);
|
||
writeLn(price);
|
||
writeLn(name);
|
||
writeLn(flag1);
|
||
writeLn(flag2);
|
||
writeLn(items[1]);
|
||
```
|
||
|
||
代码块身份:输出片段
|
||
|
||
```text
|
||
1
|
||
12.5
|
||
ABC
|
||
1
|
||
0
|
||
2
|
||
```
|
||
|
||
代码块说明:`true` / `false` 可以直接写成布尔值;运行输出里分别表现为 `1` / `0`。
|
||
|
||
普通字符串字面量:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
writeLn("ABC");
|
||
writeLn('XYZ');
|
||
```
|
||
|
||
结果说明:
|
||
|
||
- 依次输出 `ABC`、`XYZ`
|
||
|
||
字符串内引号与基础转义:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
writeLn("A""B");
|
||
writeLn('A''B');
|
||
writeLn("A\\B");
|
||
writeLn("A\"B");
|
||
writeLn("A\nB");
|
||
```
|
||
|
||
结果说明:
|
||
|
||
- 依次输出 `A"B`、`A'B`、`A\B`
|
||
- `"A\nB"` 会分成两行输出 `A` 和 `B`
|
||
|
||
更多基础转义:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
writeLn("A\tB" = "A"#9"B");
|
||
writeLn("A\x30B" = "A0B");
|
||
```
|
||
|
||
结果说明:
|
||
|
||
- 两行都输出 `1`
|
||
- 说明 `\t` 可以表示制表符,`\x30` 这类写法可以按 ANSI 字节值插入字符
|
||
|
||
经典控制字符转义:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
writeLn("\r" = #13);
|
||
writeLn("\r\n" = #13#10);
|
||
writeLn(length("\r\n"));
|
||
writeLn("\a" = #7);
|
||
writeLn("\b" = #8);
|
||
writeLn("\f" = #12);
|
||
writeLn("\v" = #11);
|
||
```
|
||
|
||
结果说明:
|
||
|
||
- 依次输出 `1`、`1`、`2`、`1`、`1`、`1`、`1`
|
||
- 说明 `\r` / `\r\n` 可以直接表示回车和回车换行
|
||
- 说明 `\a`、`\b`、`\f`、`\v` 也属于可用的经典转义
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
items := array(10, 20, 30);
|
||
row := array("Code": "0001", "Price": 12.3);
|
||
s := "ABC";
|
||
writeLn(items[0]);
|
||
writeLn(items[1]);
|
||
writeLn(row["Code"]);
|
||
writeLn(s[1]);
|
||
writeLn(s[2]);
|
||
writeLn(s[3]);
|
||
```
|
||
|
||
代码块身份:输出片段
|
||
|
||
```text
|
||
10
|
||
20
|
||
0001
|
||
A
|
||
B
|
||
C
|
||
```
|
||
|
||
代码块说明:顺序数组 `items` 从 `0` 开始,字符串键表 `row` 用字符串键访问,字符串 `s` 从 `1` 开始。
|
||
|
||
### 字符串边界规则
|
||
|
||
原始字符串 `%%` 的空白分隔、标识符和多行:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
s1 := %% ABC%%;
|
||
s2 := %%tag A"B'C%%tag;
|
||
s3 := %%m
|
||
A
|
||
B%%m;
|
||
writeLn(s1);
|
||
writeLn(s2);
|
||
writeLn(s3);
|
||
```
|
||
|
||
结果说明:
|
||
|
||
- `s1` 输出 `ABC`
|
||
- `s2` 输出 `A"B'C`
|
||
- `s3` 输出两行 `A`、`B`
|
||
- 说明 `%%` 开头后的第一个空白只是分隔符,不属于正文
|
||
- 说明 `%%tag ...%%tag` 可以用标识符配对
|
||
- 也说明 `%%` 原始字符串支持直接跨行
|
||
|
||
代码块身份:输出片段
|
||
|
||
```text
|
||
ABC
|
||
A"B'C
|
||
A
|
||
B
|
||
```
|
||
|
||
带前缀的原始字符串:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
writeLn(L%% ABC%% = L"ABC");
|
||
writeLn(U%% ABC%% = "ABC");
|
||
```
|
||
|
||
结果说明:
|
||
|
||
- 依次输出 `1`、`1`
|
||
- 说明 `L%% ...%%` 和 `U%% ...%%` 都属于文档明确写法
|
||
|
||
`\uXXXX` 在普通串、宽串和 `U` 串里的边界:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
writeLn(length("\u0041"));
|
||
writeLn(length(L"\u0041"));
|
||
writeLn(length(U"\u0041"));
|
||
```
|
||
|
||
结果说明:
|
||
|
||
- 依次输出 `2`、`1`、`1`
|
||
- 因此不要把普通字符串里的 `"\u0041"` 直接理解成和 `L"\u0041"` 一样的“单字符”写法
|
||
|
||
字符串显式编码转换:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
utf8_s := U"\u5929\u8F6F";
|
||
utf8_s2 := unicodeToUtf8(L"\u5929\u8F6F");
|
||
wide_s := utf8ToUnicode(utf8_s);
|
||
ansi_s := utf8ToAnsi(utf8_s);
|
||
writeLn(ifWString(utf8_s));
|
||
writeLn(utf8_s = utf8_s2);
|
||
writeLn(wide_s = L"\u5929\u8F6F");
|
||
writeLn(ansi_s = string(L"\u5929\u8F6F"));
|
||
```
|
||
|
||
结果说明:
|
||
|
||
- 依次输出 `0`、`1`、`1`、`1`
|
||
- 说明 `U""` 不是宽串
|
||
- 说明 UTF8、宽串、普通串之间可以按示例显式转换
|
||
|
||
ASCII `0` 字符不会截断字符串:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
s1 := "A\0B";
|
||
s2 := "A"#0"B";
|
||
writeLn(length(s1));
|
||
writeLn(length(s2));
|
||
writeLn(s1 = s2);
|
||
writeLn(s1[2] = #0);
|
||
```
|
||
|
||
结果说明:
|
||
|
||
- 依次输出 `3`、`3`、`1`、`1`
|
||
- 说明 `\0` 和 `#0` 都可以把 ASCII `0` 放进字符串
|
||
- 也说明 TSL 字符串不是遇到 `#0` 就自动截断的 C 风格零结尾串
|
||
|
||
字符码拼接:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
writeLn("A"#48"B");
|
||
writeLn("A"#13#10"B");
|
||
```
|
||
|
||
结果说明:
|
||
|
||
- 第一行输出 `A0B`
|
||
- 第二组输出会分成两行 `A`、`B`
|
||
- 说明 `#48` 这类写法会按字符码直接参与字符串拼接,`#13#10` 可以直接表示换行
|
||
|
||
二进制缓冲区:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
b := binary("30");
|
||
writeLn(ifBinary(b));
|
||
writeLn(b[0] = "3");
|
||
writeLn(b[1] = "0");
|
||
b[1] := 0x31;
|
||
writeLn(b[1] = "1");
|
||
```
|
||
|
||
结果说明:
|
||
|
||
- 依次输出 `1`、`1`、`1`、`1`
|
||
- 说明 `binary(...)` 会得到二进制缓冲区
|
||
- 说明二进制缓冲区的 `[]` 下标从 `0` 开始
|
||
- 也说明二进制缓冲区项可以直接按单字节读写
|
||
|
||
字符串子串读取:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
s := "ABCDE";
|
||
writeLn(s[2:4]);
|
||
```
|
||
|
||
代码块身份:输出片段
|
||
|
||
```text
|
||
BCD
|
||
```
|
||
|
||
代码块说明:字符串区间 `2:4` 会包含结束位 `4`。
|
||
|
||
字符串替换子串:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
s := "ABCDE";
|
||
s[2:4] := "XYZ";
|
||
writeLn(s);
|
||
```
|
||
|
||
结果说明:
|
||
|
||
- 输出 `AXYZE`
|
||
|
||
字符串删除子串:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
s := "ABCDE";
|
||
s[2:4] := "";
|
||
writeLn(s);
|
||
```
|
||
|
||
结果说明:
|
||
|
||
- 输出 `AE`
|
||
|
||
字符串插入子串:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
s := "AAABBB";
|
||
s[4:0] := "111";
|
||
writeLn(s);
|
||
```
|
||
|
||
结果说明:
|
||
|
||
- 输出 `AAA111BBB`
|
||
- 这说明 `s[index:0] := ...` 是在指定位置插入,而不是删除或替换区间
|
||
|
||
## 默认生成模板
|
||
|
||
如果你只是要抓住“基本类型 + array”的第一层,用这个最短例子:
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
count := 1;
|
||
price := 12.5;
|
||
name := "ABC";
|
||
flag := true;
|
||
items := array(1, 2, 3);
|
||
```
|
||
|
||
## 禁止项
|
||
|
||
- 用 `s[0]` 访问字符串首字符。
|
||
- 误以为 `array(...)` 只能写顺序数组,不能写字符串键表。
|
||
- 误以为字符串区间和数组一样从 `0` 开始。
|
||
- 把 `s[index:0] := ...` 误解成“替换到第 0 位”。
|
||
- 把二进制缓冲区也按字符串的 `1` 基下标去理解。
|
||
- 在普通字符串示例里默认切到原始字符串、宽串 / UTF8 前缀、字符码或编码转换,却没有按本页字符串边界规则确认。
|
||
- 把普通字符串里的 `\uXXXX` 直接当成宽串单字符。
|
||
- 把 `U""` 当成宽串;需要宽串时按本页转换链处理。
|
||
- 把 `#0` / `\0` 当成 C 风格字符串终止符。
|
||
|
||
代码块身份:反例 / 不可照写
|
||
|
||
```text
|
||
s := "ABC";
|
||
writeLn(s[0]);
|
||
```
|
||
|
||
上面这类写法在运行时会报字符串下标越界。
|
||
|
||
代码块身份:输出片段
|
||
|
||
```text
|
||
String index out of bounds
|
||
```
|
||
|
||
代码块身份:可直接照写示例
|
||
|
||
```tsl
|
||
s := "ABCDE";
|
||
writeLn(s[1:3]);
|
||
```
|
||
|
||
不要把上面这个区间访问类比成数组切片的半开区间。按文档输出,它返回 `ABC`,不是 `AB`;字符串区间的结束位会被包含进结果。
|
||
|
||
代码块身份:输出片段
|
||
|
||
```text
|
||
ABC
|
||
```
|