数据类型
SQL 数据类型定义了列可以存储的数据类型。当您运行 DESC TABLE
命令时,你可以看到每列的数据类型。
字符串和二进制数据类型
类型名称 | 描述 | 大小 |
---|---|---|
String | UTF-8 编码的字符串。最多可容纳 2,147,483,647 字节的数据 | 字符串的长度 |
Binary | 变长二进制值。最多可容纳 2,147,483,647 字节的数据 | 数据的长度 + 2 字节 |
String
和 Binary
的最大容量取决于它们的编码方式以及存储引擎如何处理它们。例如,String
值被编码为 UTF-8,如果所有字符的长度为 3 个字节,该字段最 多可以存储 715,827,882 个字符。对于 Binary
类型,它们最多可以存储 2,147,483,647 字节。
数值数据类型
类型名称 | 描述 | 大小 |
---|---|---|
Int8 | -128 ~ 127 | 1 字节 |
Int16 | -32768 ~ 32767 | 2 字节 |
Int32 | -2147483648 ~ 2147483647 | 4 字节 |
Int64 | -9223372036854775808 ~ 9223372036854775807 | 8 字节 |
UInt8 | 0 ~ 255 | 1 字节 |
UInt16 | 0 ~ 65535 | 2 字节 |
UInt32 | 0 ~ 4294967295 | 4 字节 |
UInt64 | 0 ~ 18446744073709551615 | 8 字节 |
Float32 | 32 位 IEEE 754 浮点数 | 4 字节 |
Float64 | 双精度 IEEE 754 浮点数 | 8 字节 |
Decimal 类型
GreptimeDB 支持 decimal
类型,这是一种定点类型,表示为 decimal(precision, scale)
,其中 precision
是总位数,scale
是小数部分的位数。例如,123.45
的总位数为 5,小数位数为 2。
precision
可以在 [1, 38] 范围内。scale
可以在 [0, precision] 范围内。
如果未指定总位 数和比例,则默认的十进制数是 decimal(38, 10)
。
CREATE TABLE decimals(
d DECIMAL(3, 2),
ts TIMESTAMP TIME INDEX,
);
INSERT INTO decimals VALUES ('0.1',1000), ('0.2',2000);
SELECT * FROM decimals;
+------+---------------------+
| d | ts |
+------+---------------------+
| 0.10 | 1970-01-01T00:00:01 |
| 0.20 | 1970-01-01T00:00:02 |
+------+---------------------+
日期和时间类型
类型名称 | 描述 | 大小 |
---|---|---|
TimestampSecond | 64 位时间戳值,精度为秒 | 8 字节 |
TimestampMillisecond | 64 位时间戳值,毫秒精度 | 8 字节 |
TimestampMicroSecond | 64 位时间戳值,微秒精度 | 8 字节 |
TimestampNanosecond | 64 位时间戳值,纳秒精度 | 8 字节 |
Interval | 时间间隔 | YearMonth 占 4 字节,DayTime 占 8 字节,MonthDayNano 占 16 字节 |
Interval 类型详解
Interval
类型用于需要跟踪和操作时间间隔的场景。它的编写语法如下:
QUANTITY UNIT [QUANTITY UNIT...]
QUANTITY
:是一个数字(可能有符号),UNIT
:时间单位,可以是microsecond
(微秒)、millisecond
(毫秒)、second
(秒)、minute
(分钟)、hour
(小时)、day
(天)、week
(周)、month
(月)、year
(年)、decade
(十年)、century
(世纪)或这些单位的缩写或复数形式;
不同的时间单位将会被计算合并,每个单位的符号决定它是增加还是减少总间隔。例如,“1 年 -2 个月”导致净间隔为 10 个月。
遗憾的是,GreptimeDB 暂时还不支持以 ISO 8601 时间间隔格式编写间隔,例如 P3Y3M700DT133H17M36.789S
等。但它支持以这种格式输出。
让我们来看一些例子:
SELECT '2 years 15 months 100 weeks 99 hours 123456789 milliseconds'::INTERVAL;
+---------------------------------------------------------------------+
| Utf8("2 years 15 months 100 weeks 99 hours 123456789 milliseconds") |
+---------------------------------------------------------------------+
| P3Y3M700DT133H17M36.789S |
+---------------------------------------------------------------------+
55 分钟前:
SELECT '-1 hour 5 minute'::INTERVAL;
+--------------------------+
| Utf8("-1 hour 5 minute") |
+--------------------------+
| P0Y0M0DT0H-55M0S |
+--------------------------+
1 小时 5 分钟前:
SELECT '-1 hour -5 minute'::INTERVAL;
+---------------------------+
| Utf8("-1 hour -5 minute") |
+---------------------------+
| P0Y0M0DT-1H-5M0S |
+---------------------------+
当然,你可以通过算术运算来操作时间间隔。 获取 5 分钟前的时间:
SELECT now() - INTERVAL '5 minute';
+----------------------------------------------+
| now() - IntervalMonthDayNano("300000000000") |
+----------------------------------------------+
| 2024-06-24 21:24:05.012306 |
+----------------------------------------------+
注意到你也可以用 INTERVAL 'literal'
的方式来输入 interval 类型。'-1 hour -5 minute'::INTERVAL
这样的方式其实是一个CAST
函数调用。
GreptimeDB 还支持类似 3y2mon4h
这样不包含空格的简写形式:
SELECT INTERVAL '3y2mon4h';
SELECT '3y2mon4h'::INTERVAL;
+---------------------------------------------------------+
| IntervalMonthDayNano("3010670175542044842954670112768") |
+---------------------------------------------------------+
| P3Y2M0DT4H0M0S |
+---------------------------------------------------------+
+---------------------------------------------------------+
| IntervalMonthDayNano("3010670175542044842954670112768") |
+---------------------------------------------------------+
| P3Y2M0DT4H0M0S |
+---------------------------------------------------------+
同样也支持符号数:
SELECT INTERVAL '-1h5m';
SELECT '-1h5m'::INTERVAL;
+----------------------------------------------+
| IntervalMonthDayNano("18446740773709551616") |
+----------------------------------------------+
| P0Y0M0DT0H-55M0S |
+----------------------------------------------+
+----------------------------------------------+
| IntervalMonthDayNano("18446740773709551616") |
+----------------------------------------------+
| P0Y0M0DT0H-55M0S |
+----------------------------------------------+
支持的缩写包括:
缩写 | 全称 |
---|---|
y | years |
mon | months |
w | weeks |
d | days |
h | hours |
m | minutes |
s | seconds |
millis | milliseconds |
ms | milliseconds |
us | microseconds |
ns | nanoseconds |
JSON 类型
GreptimeDB 支持 JSON 类型,允许用户存储和查询 JSON 格式的数据。JSON 类型非常灵活,可以存储各种形式的结构化或非结构化数据,适合日志记录、分析和半结构化数据存储等场景。
CREATE TABLE json_data(
my_json JSON,
ts TIMESTAMP TIME INDEX
);
INSERT INTO json_data VALUES ('{"key1": "value1", "key2": 10}', 1000),
('{"name": "GreptimeDB", "open_source": true}', 2000);
SELECT * FROM json_data;
输出:
+------------------------------------------+---------------------+
| my_json | ts |
+------------------------------------------+---------------------+
| {"key1":"value1","key2":10} | 1970-01-01 00:00:01 |
| {"name":"GreptimeDB","open_source":true} | 1970-01-01 00:00:02 |
+------------------------------------------+---------------------+
- gRPC 协议不支持通过自动建表写入 JSON 数据。不过,您可以手动创建表,并将 JSON 数据列设置为 String 类型进行写入。
- 不支持通过 MySQL 协议预处理语句插入 JSON 数据。
查询 JSON 数据
您可以直接查询 JSON 数据,也可以使用 GreptimeDB 提供的 JSON 函数 提取特定字段。以下是一个示例:
SELECT json_get_string(my_json, '$.name') as name FROM json_data;
输出:
+---------------------------------------------------+
| name |
+---------------------------------------------------+
| NULL |
| GreptimeDB |
+---------------------------------------------------+
布尔类型
类型名称 | 描述 | 大小 |
---|---|---|
Boolean | 布尔值 | 1 字节 |
在 SQL 语句 中使用 TRUE
或 FALSE
表示布尔值。例如:
CREATE TABLE bools(
b BOOLEAN,
ts TIMESTAMP DEFAULT CURRENT_TIMESTAMP() TIME INDEX,
);
INSERT INTO bools(b) VALUES (TRUE), (FALSE);
与 MySQL 和 PostgreSQL 兼容的数据类型
类型别名
对于从 MySQL 或 PostgreSQL 迁移到 GreptimeDB 的用户,GreptimeDB 支持以下类型别名。
数据类型 | 别名 |
---|---|
String | Text , TinyText , MediumText , LongText , Varchar , Char |
Binary | Varbinary |
Int8 | TinyInt |
Int16 | SmallInt |
Int32 | Int |
Int64 | BigInt |
UInt8 | UnsignedInt |
UInt16 | UnsignedTinyInt |
UInt32 | UnsignedSmallInt |
UInt64 | UnsignedBigInt |
Float32 | Float |
Float64 | Double |
TimestampSecond | Timestamp_s , Timestamp_sec , Timestamp(0) |
TimestampMillisecond | Timestamp , Timestamp_ms , Timestamp(3) |
TimestampMicroSecond | Timestamp_us , Timestamp(6) |
TimestampNanosecond | Timestamp_ns , Timestamp(9) |
在创建表时也可以使用这些别名类型。
例如,使用 Varchar
代替 String
,使用 Double
代替 Float64
,使用 Timestamp(0)
代替 TimestampSecond
。
CREATE TABLE alias_types (
s TEXT,
i Double,
ts0 Timestamp(0) DEFAULT CURRENT_TIMESTAMP() TIME INDEX,
PRIMARY KEY(s)
);
日期和时间类型
除了在 GreptimeDB 中用作默认时间类型的 Timestamp
类型之外
GreptimeDB 还支持与 MySQL 和 PostgreSQL 兼容的 Date
和 DateTime
类型。
类型名称 | 描述 | 大小 |
---|---|---|
Date | 32 位日期值,表示自 UNIX Epoch 以来的天数 | 4 字节 |
DateTime | 64 位日期时间值,表示自 UNIX Epoch 以来的毫秒数 | 8 字节 |
示例
创建表
CREATE TABLE data_types (
s STRING,
vbi BINARY,
b BOOLEAN,
tint INT8,
sint INT16,
i INT32,
bint INT64,
utint UINT8,
usint UINT16,
ui UINT32,
ubint UINT64,
f FLOAT32,
d FLOAT64,
dm DECIMAL(3, 2),
dt DATE,
dtt DATETIME,
ts0 TIMESTAMPSECOND,
ts3 TIMESTAMPMILLISECOND,
ts6 TIMESTAMPMICROSECOND,
ts9 TIMESTAMPNANOSECOND DEFAULT CURRENT_TIMESTAMP() TIME INDEX,
PRIMARY KEY(s));
描述表结构
DESC TABLE data_types;
+--------+----------------------+------+------+---------------------+---------------+
| Column | Type | Key | Null | Default | Semantic Type |
+--------+----------------------+------+------+---------------------+---------------+
| s | String | PRI | YES | | TAG |
| vbi | Binary | | YES | | FIELD |
| b | Boolean | | YES | | FIELD |
| tint | Int8 | | YES | | FIELD |
| sint | Int16 | | YES | | FIELD |
| i | Int32 | | YES | | FIELD |
| bint | Int64 | | YES | | FIELD |
| utint | UInt8 | | YES | | FIELD |
| usint | UInt16 | | YES | | FIELD |
| ui | UInt32 | | YES | | FIELD |
| ubint | UInt64 | | YES | | FIELD |
| f | Float32 | | YES | | FIELD |
| d | Float64 | | YES | | FIELD |
| dm | Decimal(3, 2) | | YES | | FIELD |
| dt | Date | | YES | | FIELD |
| dtt | DateTime | | YES | | FIELD |
| ts0 | TimestampSecond | | YES | | FIELD |
| ts3 | TimestampMillisecond | | YES | | FIELD |
| ts6 | TimestampMicrosecond | | YES | | FIELD |
| ts9 | TimestampNanosecond | PRI | NO | current_timestamp() | TIMESTAMP |
+--------+----------------------+------+------+---------------------+---------------+