# TSL 值与字面量

文档类型：语法主线
是否可直接用于生成代码：是
是否含可直接照写示例：是
是否含不可照写反例：是
遇到不确定时：先按本页候选页继续判断；[04_variables_and_constants.md](04_variables_and_constants.md)、[06_expressions_and_operators.md](06_expressions_and_operators.md)、[12_matrix_and_collections.md](12_matrix_and_collections.md)、[17_types_and_conversions.md](17_types_and_conversions.md)；仍不命中时回到语法路由中心 [index.md](index.md)；如果问题已经超出语法层，回到 TSL 总入口 [../index.md](../index.md)

这一篇整理基本类型、字面量、数组、字符串、字符串编码边界与基础值模型，避免把值规则分散在函数或金融示例里。

## 本篇职责

回答“基本类型怎么写、数组和字符串怎么索引、字符串编码边界怎么写、哪些值规则属于语言级事实”。矩阵、集合扩展和复杂容器不在本页展开；命中这些任务时跳到 [12_matrix_and_collections.md](12_matrix_and_collections.md) 或对应深水专题。

## 智能体值写法判断流程

1. 普通值优先从整数、实数、普通字符串、布尔和 `array(...)` 起手。
2. 字符串默认用普通字符串；只有编码、宽串、UTF8、原始字符串、字符码或 ASCII `0` 需求明确时，才使用本页字符串边界规则里的文档明确形态。
3. 看到 `array(...)` 时，先判断要顺序数组还是字符串键表：顺序数组用位置元素，字符串键表用 `"Key": value`。
4. 写下标前先判断对象类别：顺序数组和二进制缓冲区下标从 `0` 开始，字符串下标从 `1` 开始。
5. 写字符串区间前先确认 `s[start:end]` 的 `end` 会被包含；不要按半开区间推断。
6. 如果任务已经变成矩阵、集合扩展、结果集过滤或 TS-SQL 数据形态，不要留在值页硬拼写法；先跳到 [12_matrix_and_collections.md](12_matrix_and_collections.md)、[13_resultset_and_filters.md](13_resultset_and_filters.md) 或 [14_ts_sql.md](14_ts_sql.md)。
7. 没有对应代码块时不要发明值写法；尤其不要从 JSON、JavaScript、Pascal 或 C 字符串规则直接迁移。

## 核心规则

- 最先掌握的几类值是：整数、实数、普通字符串、布尔和 `array(...)`。
- 普通字符串既可以用双引号，也可以用单引号。
- 同类引号本身可以通过连续写两个同类引号放进字符串里。
- `\\`、`\"`、`\n` 这类基础转义可用。
- `\t` 和 `\xNN` 这类转义也可用。
- `\r`、`\r\n`、`\a`、`\b`、`\f`、`\v` 这些经典转义也可用。
- `array(...)` 既可以写顺序数组，也可以写字符串键表。
- 顺序数组下标从 `0` 开始。
- `binary(...)` 创建的二进制缓冲区也用 `[]` 访问，并且下标从 `0` 开始。
- 字符串下标从 `1` 开始。
- `s[0]` 在运行时会越界，不要把字符串当成 0 基下标。
- 字符串取子串用 `s[start:end]`，并且 `end` 是包含在结果里的。
- 字符串替换子串用 `s[start:end] := "..."`。
- 字符串删除子串，本质上就是 `s[start:end] := ""`。
- 字符串插入子串用 `s[index:0] := "..."`。
- 普通字符串、`L""` 宽串、`U""` UTF8 前缀串，以及 `%%` 原始字符串都属于文档明确写法。
- `%%` 原始字符串开头后必须先跟一个空白分隔符；可以带标识符，也支持多行。
- `L%% ...%%` 与 `U%% ...%%` 这两种带前缀的原始字符串也属于文档明确写法。
- 普通字符串里的 `\uXXXX` 不要直接按“单字符宽串”理解；`length("\u0041") = 2`，而 `length(L"\u0041") = 1`、`length(U"\u0041") = 1`。
- `U""` 不是宽串；需要在 UTF8、宽串、普通串之间显式转换时，继续用 `utf8ToUnicode(...)`、`utf8ToAnsi(...)`、`ansiToUtf8(...)`、`unicodeToUtf8(...)`、`string(...)`、`wideString(...)`。
- `#number` 可以直接把字符码拼进字符串。
- `\0` 和 `#0` 都能把 ASCII `0` 放进字符串，并且不会把字符串截断。

## 可直接照写示例

使用这些示例时遵守：

- 只复制任务需要的值、字面量、下标或字符串片段，不要把多个示例拼成未写入文档的新语法。
- 普通示例默认按 `.tsl` 脚本语句区书写；需要函数或类型时，放在后置声明区。
- 字符串编码、宽串和原始字符串边界不清楚时，优先看本页“字符串边界规则”。

最基础的值写法：

代码块身份：可直接照写示例

```tsl
count := 1;
price := 12.5;
name := "ABC";
flag1 := true;
flag2 := false;
items := array(1, 2, 3);
writeLn(count);
writeLn(price);
writeLn(name);
writeLn(flag1);
writeLn(flag2);
writeLn(items[1]);
```

代码块身份：输出片段

```text
1
12.5
ABC
1
0
2
```

代码块说明：`true` / `false` 可以直接写成布尔值；运行输出里分别表现为 `1` / `0`。

普通字符串字面量：

代码块身份：可直接照写示例

```tsl
writeLn("ABC");
writeLn('XYZ');
```

结果说明：

- 依次输出 `ABC`、`XYZ`

字符串内引号与基础转义：

代码块身份：可直接照写示例

```tsl
writeLn("A""B");
writeLn('A''B');
writeLn("A\\B");
writeLn("A\"B");
writeLn("A\nB");
```

结果说明：

- 依次输出 `A"B`、`A'B`、`A\B`
- `"A\nB"` 会分成两行输出 `A` 和 `B`

更多基础转义：

代码块身份：可直接照写示例

```tsl
writeLn("A\tB" = "A"#9"B");
writeLn("A\x30B" = "A0B");
```

结果说明：

- 两行都输出 `1`
- 说明 `\t` 可以表示制表符，`\x30` 这类写法可以按 ANSI 字节值插入字符

经典控制字符转义：

代码块身份：可直接照写示例

```tsl
writeLn("\r" = #13);
writeLn("\r\n" = #13#10);
writeLn(length("\r\n"));
writeLn("\a" = #7);
writeLn("\b" = #8);
writeLn("\f" = #12);
writeLn("\v" = #11);
```

结果说明：

- 依次输出 `1`、`1`、`2`、`1`、`1`、`1`、`1`
- 说明 `\r` / `\r\n` 可以直接表示回车和回车换行
- 说明 `\a`、`\b`、`\f`、`\v` 也属于可用的经典转义

代码块身份：可直接照写示例

```tsl
items := array(10, 20, 30);
row := array("Code": "0001", "Price": 12.3);
s := "ABC";
writeLn(items[0]);
writeLn(items[1]);
writeLn(row["Code"]);
writeLn(s[1]);
writeLn(s[2]);
writeLn(s[3]);
```

代码块身份：输出片段

```text
10
20
0001
A
B
C
```

代码块说明：顺序数组 `items` 从 `0` 开始，字符串键表 `row` 用字符串键访问，字符串 `s` 从 `1` 开始。

### 字符串边界规则

原始字符串 `%%` 的空白分隔、标识符和多行：

代码块身份：可直接照写示例

```tsl
s1 := %% ABC%%;
s2 := %%tag A"B'C%%tag;
s3 := %%m
A
B%%m;
writeLn(s1);
writeLn(s2);
writeLn(s3);
```

结果说明：

- `s1` 输出 `ABC`
- `s2` 输出 `A"B'C`
- `s3` 输出两行 `A`、`B`
- 说明 `%%` 开头后的第一个空白只是分隔符，不属于正文
- 说明 `%%tag ...%%tag` 可以用标识符配对
- 也说明 `%%` 原始字符串支持直接跨行

代码块身份：输出片段

```text
ABC
A"B'C
A
B
```

带前缀的原始字符串：

代码块身份：可直接照写示例

```tsl
writeLn(L%% ABC%% = L"ABC");
writeLn(U%% ABC%% = "ABC");
```

结果说明：

- 依次输出 `1`、`1`
- 说明 `L%% ...%%` 和 `U%% ...%%` 都属于文档明确写法

`\uXXXX` 在普通串、宽串和 `U` 串里的边界：

代码块身份：可直接照写示例

```tsl
writeLn(length("\u0041"));
writeLn(length(L"\u0041"));
writeLn(length(U"\u0041"));
```

结果说明：

- 依次输出 `2`、`1`、`1`
- 因此不要把普通字符串里的 `"\u0041"` 直接理解成和 `L"\u0041"` 一样的“单字符”写法

字符串显式编码转换：

代码块身份：可直接照写示例

```tsl
utf8_s := U"\u5929\u8F6F";
utf8_s2 := unicodeToUtf8(L"\u5929\u8F6F");
wide_s := utf8ToUnicode(utf8_s);
ansi_s := utf8ToAnsi(utf8_s);
writeLn(ifWString(utf8_s));
writeLn(utf8_s = utf8_s2);
writeLn(wide_s = L"\u5929\u8F6F");
writeLn(ansi_s = string(L"\u5929\u8F6F"));
```

结果说明：

- 依次输出 `0`、`1`、`1`、`1`
- 说明 `U""` 不是宽串
- 说明 UTF8、宽串、普通串之间可以按示例显式转换

ASCII `0` 字符不会截断字符串：

代码块身份：可直接照写示例

```tsl
s1 := "A\0B";
s2 := "A"#0"B";
writeLn(length(s1));
writeLn(length(s2));
writeLn(s1 = s2);
writeLn(s1[2] = #0);
```

结果说明：

- 依次输出 `3`、`3`、`1`、`1`
- 说明 `\0` 和 `#0` 都可以把 ASCII `0` 放进字符串
- 也说明 TSL 字符串不是遇到 `#0` 就自动截断的 C 风格零结尾串

字符码拼接：

代码块身份：可直接照写示例

```tsl
writeLn("A"#48"B");
writeLn("A"#13#10"B");
```

结果说明：

- 第一行输出 `A0B`
- 第二组输出会分成两行 `A`、`B`
- 说明 `#48` 这类写法会按字符码直接参与字符串拼接，`#13#10` 可以直接表示换行

二进制缓冲区：

代码块身份：可直接照写示例

```tsl
b := binary("30");
writeLn(ifBinary(b));
writeLn(b[0] = "3");
writeLn(b[1] = "0");
b[1] := 0x31;
writeLn(b[1] = "1");
```

结果说明：

- 依次输出 `1`、`1`、`1`、`1`
- 说明 `binary(...)` 会得到二进制缓冲区
- 说明二进制缓冲区的 `[]` 下标从 `0` 开始
- 也说明二进制缓冲区项可以直接按单字节读写

字符串子串读取：

代码块身份：可直接照写示例

```tsl
s := "ABCDE";
writeLn(s[2:4]);
```

代码块身份：输出片段

```text
BCD
```

代码块说明：字符串区间 `2:4` 会包含结束位 `4`。

字符串替换子串：

代码块身份：可直接照写示例

```tsl
s := "ABCDE";
s[2:4] := "XYZ";
writeLn(s);
```

结果说明：

- 输出 `AXYZE`

字符串删除子串：

代码块身份：可直接照写示例

```tsl
s := "ABCDE";
s[2:4] := "";
writeLn(s);
```

结果说明：

- 输出 `AE`

字符串插入子串：

代码块身份：可直接照写示例

```tsl
s := "AAABBB";
s[4:0] := "111";
writeLn(s);
```

结果说明：

- 输出 `AAA111BBB`
- 这说明 `s[index:0] := ...` 是在指定位置插入，而不是删除或替换区间

## 默认生成模板

如果你只是要抓住“基本类型 + array”的第一层，用这个最短例子：

代码块身份：可直接照写示例

```tsl
count := 1;
price := 12.5;
name := "ABC";
flag := true;
items := array(1, 2, 3);
```

## 禁止项

- 用 `s[0]` 访问字符串首字符。
- 误以为 `array(...)` 只能写顺序数组，不能写字符串键表。
- 误以为字符串区间和数组一样从 `0` 开始。
- 把 `s[index:0] := ...` 误解成“替换到第 0 位”。
- 把二进制缓冲区也按字符串的 `1` 基下标去理解。
- 在普通字符串示例里默认切到原始字符串、宽串 / UTF8 前缀、字符码或编码转换，却没有按本页字符串边界规则确认。
- 把普通字符串里的 `\uXXXX` 直接当成宽串单字符。
- 把 `U""` 当成宽串；需要宽串时按本页转换链处理。
- 把 `#0` / `\0` 当成 C 风格字符串终止符。

代码块身份：反例 / 不可照写

```text
s := "ABC";
writeLn(s[0]);
```

上面这类写法在运行时会报字符串下标越界。

代码块身份：输出片段

```text
String index out of bounds
```

代码块身份：可直接照写示例

```tsl
s := "ABCDE";
writeLn(s[1:3]);
```

不要把上面这个区间访问类比成数组切片的半开区间。按文档输出，它返回 `ABC`，不是 `AB`；字符串区间的结束位会被包含进结果。

代码块身份：输出片段

```text
ABC
```