数据库 2023-07-15

如何提高跨数据库联表查询的效率 (跨数据库联表查询效率)

在实际开发中，经常出现需要将多个数据库中的表进行联表查询，而跨数据库联表查询的效率往往较低。本文将从优化SQL语句、创建索引和使用分布式数据库等方面，探讨。

一、优化SQL语句

1.减少子查询和联合查询。

在跨数据库联表查询中，子查询和联合查询往往是效率较低的因素之一。因此，在编写SQL语句时，应减少使用这两种查询方式，尽可能使用更简单的方式进行联表查询。

2.合理使用GROUP BY和ORDER BY。

GROUP BY和ORDER BY语句影响了查询结果的排序和分组，但同时也会影响查询的性能。因此，在编写SQL语句时，应根据实际情况合理使用这两个语句，尽量减少不必要的排列、排序和分组操作，提升查询效率。

3.使用LIMIT语句进行分页查询。

在处理大数据量的查询时，使用LIMIT语句进行分页查询可以有效提高查询效率。但需要注意的是，LIMIT语句在每次执行查询时都会扫描全表，因此，应在代码中定期对LIMIT语句进行优化，避免出现无法承受的性能下降。

二、创建索引

1.创建唯一性索引。

唯一性索引能够限制表中每个值的重复次数，可以优化跨数据库联表查询的效率。在创建索引时，应针对常用的表字段进行操作，避免创建过多无用的索引占用资源。

2.创建联合索引。

联合索引可以针对多个表字段进行操作，提高查询效率。在创建联合索引时，应根据实际需求合理选择索引字段，以减少索引数量和索引存储占用空间。

3.定期优化索引。

在跨数据库联表查询中，索引的使用非常重要。因此，在开发过程中和使用过程中，需要对索引进行定期优化，尽量减少索引出现异常或失效的情况，以达到更优化的查询效果。

三、使用分布式数据库

跨数据库联表查询的效率受到数据库的性能和数据存储的数量、大小等因素的影响。因此，使用分布式数据库能够有效提高查询效率，减少单个数据库的压力。

在使用分布式数据库时，需要进行良好的数据分片和负载均衡，确保查询效率的同时，保持数据的一致性和完整性。

跨数据库联表查询是数据库开发中常见的操作，但由于数据量大、查询条件复杂等原因，往往需要进行优化以提高查询效率。优化SQL语句、创建索引和使用分布式数据库是提高跨数据库联表查询效率的重要手段，开发人员需要根据实际情况灵活运用，以达到更优化的查询效果。

相关问题拓展阅读：

大量数据多表联合查询时时，使用视图，是不是比直接查询速度要快！有高手请给讲讲，如何提高查询速度

大量数据多表联合查询时时，使用视图，是不是比直接查询速度要快！有高手请给讲讲，如何提高查询速度

1、简化应用程序。

视图做为数据库中的一种实体，实际上存在的只是它的脚本，而它的内容并不真正的单独存在一份。一般，可以对复杂的应用程序从功能角度进行分析，将可以与其它的应用程序共用的那一部分，分离出来。对这部分功能，视具体情况可做成不同的数据库实体（如过程），有些是可以做成视图的。这样，上层的应用程序就可以从视图中取数据了。还有，可以把对远地数据库的访问封装在视图中，使之对上层应用程序透明。2、可以对 UNION 后的记录集排序。

直接对以下语句的结果排序，是不可能的。 select a.id id from a

union

select b.id id from b;

所以把以上语句作成视图后，就可以了。设视图名为A_B:

select id from A_B order by id;3、可以实现一定的权限控制。

可以根据需要，对表中的一部分内容做一个视图，以供一定的角色使用。可以对表中的一部分记录做一个视图（纵向），也可以对一个表中的一部分字段做一个视图（横向），或二者兼而有之。

视图是一个虚拟表，其内容由查询定义。同真实的表一样，视图包含一系列带有名称的列和行数据。但是，视图并不在数据库中以存储的数据值集形式存在。行和列数据来自由定义视图的查询所引用的表，并且在引用视图时动态生成。

对其中所引用的基础表来说，视图的作用类似于筛选。定义视图的筛选可以来自当前或其它数据库的一个或多个表，或者其它视图。分布式查询也可用于定义使用多个异类源数据的视图。如果有几台不同的服务器分别存储组织中不同地区的数据，而您需要将这些服务器上相似结构的数据组合起来，这种方式就很有用。一、视图的作用简单性。看到的就是需要的。视图不仅可以简化用户对数据的理解，也可以简化他们的操作。那些被经常使用的查询可以被定义为视图，从而使得用户不必为以后的操作每次指定全部的条件。安全性。通过视图用户只能查询和修改他们所能见到的数据。数据库中的其它数据则既看不见也取不到。数据库授权命令可以使每个用户对数据库的检索限制到特定的数据库对象上，但不能授权到数据库特定行和特定的列上。通过视图，用户可以被限制在数据的不同子集上：使用权限可被限制在基表的行的子集上。

使用权限可被限制在基表的列的子集上。

使用权限可被限制在基表的行和列的子集上。

使用权限可被限制在多个基表的连接所限定的行上。

使用权限可被限制在基表中的数据的统计汇总上。

使用权限可被限制在另一视图的一个子集上，或是一些视图和基表合并后的子集上。逻辑数据独立性。视图可帮助用户屏蔽真实表结构变化带来的影响。二、视图的优点 (1)视图能简化用户的操作

(2)视图机制可以使用户以不同的方式查询同一数据

(3)视图对数据库重构提供了一定程度的逻辑独立性

(4)视图可以对机密的数据隐氏好提供安全保护三、视图的安全性视图的安全性可以防止未授权用户查看特定的行或列，是用户只能看到表中特定行的方法如下： 1 在表中增加一个标志用户名的列；

2 建立视图，是用户只能看到标有自己用户名的行；

3 把视图授权给其他用户。四、逻辑数据独立性视图可以使应用程序和数据库表在一定程度上独立。如果没有视图，应用一定是建立在表上的。有了视图之后，程序可以建立在视图之上，从而程序与数据库表被视图分割开来。视图可以在以下几个方面使程序与数据独立： 1 如果应用建立在数据库表上，当数据库表发生变化时，可以在表上建立视图，通过视图屏蔽表的变化，从而应用程序可以不动。

2 如果应用建立在数据库表上，当应用发生变化时，可以在表上建立视图，通过视图灶铅屏蔽应用的变化，从而使数据库表不动。

3 如果应用建立在视图上，当数据库表发生变化时，可以在表上修改视图，通过视图屏蔽表的变化，从而应用程序可以不动。

4 如果应用建立在视图核桐上，当应用发生变化时，可以在表上修改视图，通过视图屏蔽应用的变化，从而数据库可以不动。五、视图的书写格式 CREATE VIEW

DROP VIEW 注意：视图可以和基本表一样被查询，但是利用视图进行数据增，删，改操作，会受到一定的限制。（1）由两个以上的基本表导出的视图

（2）视图的字段来自字段表达式函数

（3）视图定义中有嵌套查询

（4）在一个不允许更新的视图上定义的视图

不会快，因为宴迅纤最终执行的语句是一样的。要想提高速度，结合一下自己的经验：1，多加条件约束，多用and，尽量把要查的东西精确晌仿定位出来，少用like in这样的昌手语句；2，越少列越好，查询结果尽量要那些字段就查那些字段，少用*，查询全部，查询一列，比查询全部要快很多。3，各表要定义

主键

，这样在数据的检索上会快很多！

MySQL 8.0 推出了histogram，也叫柱状图或者直方图。先来解释下什么叫直方图。

关于直方图

我们知道，在DB中，优化器负责将SQL转换为很多个不同的执行计划，完了从中选择一个更优的来实际执行。但是有时候优化器选择的最终计划有可能随着DB环境的变化不是更优的，这就导致了查询性能不是很好。比如，优猛祥化器无法准确的知道每张表的实际行数以及参与过滤条件的列有多少个不同的值。那其实有时候有人就说了，索引不是可以解决这个问题吗？是的，不同类型的索引可以解决这个问题，但是你不能每个列都建索引吧？如果一张表有1000个字段，那全字段索引将会拖死对这张表的写入。而此时，直方逗陪图就是相对来说，开销较小的方法。

直方图就是在 MySQL 中为某张表的枝指搏某些字段提供了一种数值分布的统计信息。比如字段NULL的个数，每个不同值出现的百分比、更大值、最小值等等。如果我们用过了 MySQL 的分析型引擎brighthouse，那对这个概念太熟悉了。

MySQL的直方图有两种，等宽直方图和等高直方图。等宽直方图每个桶（bucket）保存一个值以及这个值累积频率；等高直方图每个桶需要保存不同值的个数，上下限以及累计频率等。MySQL会自动分配用哪种类型的直方图，我们无需参与。

MySQL 定义了一张meta表column_statistics 来存储直方图的定义，每行记录对应一个字段的直方图，以json保存。同时，新增了一个参数histogram_generation_max_mem_size来配置建立直方图内存大小。

不过直方图有以下限制：

1. 不支持几何类型以及json。2. 不支持加密表和临时表。3. 不支持列值完全唯一。4. 需要手工的进行键值分布。

那我们来举个简单的例子说明直方图对查询的效果提升。

举例

表相关定义以及行数信息等：

mysql> show create table t2\G

*************************** 1. row ***************************

Table: t2

Create Table: CREATE TABLE `t2` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`rank1` int(11) DEFAULT NULL,

`rank2` int(11) DEFAULT NULL,

`rank3` int(11) DEFAULT NULL,

`log_date` date DEFAULT NULL,

PRIMARY KEY (`id`),

KEY `idx_rank1` (`rank1`),

KEY `idx_log_date` (`log_date`)

) ENGINE=InnoDB AUTO_INCREMENT=49140 DEFAULT CHARSET=utf8mb4 \

COLLATE=utf8mb4_0900_ai_ci STATS_PERSISTENT=1 STATS_AUTO_RECALC=0

1 row in set (0.00 sec)

mysql> select count(*) from t2;

| count(*) |

1 row in set (0.00 sec)

同时对t2克隆了一张表t3

mysql> create table t3 like t2;

Query OK, 0 rows affected (0.13 sec)

mysql> insert into t3 select * from t2;

Query OK,rows affected (1.94 sec)

Records:Duplicates: 0 Warnings: 0

给表t3列rank1和log_date 添加histogram

mysql> yze table t3 update histogram on rank1,log_date;+++++| Table | Op | Msg_type | Msg_text |+++++| ytt.t3 | histogram | status | Histogram statistics created for column ‘log_date’. || ytt.t3 | histogram | status | Histogram statistics created for column ‘rank1’. |+++++2 rows in set (0.19 sec)

我们来看看histogram的分布状况

mysql> select json_pretty(histogram) result from information_schema.column_statistics where table_name = ‘t3’ and column_name = ‘log_date’\G*************************** 1. row ***************************result: { “buckets”: , … , >, “data-type”: “date”, “null-values”: 0.0, “collation-id”: 8, “last-updated”: “:43:01.910185”, “sampling-rate”: 1.0, “histogram-type”: “equi-height”, “number-of-buckets-specified”: 100}1 row in set (0.03 sec)

MySQL自动为这个字段分配了等高直方图，默认为100个桶。SQL A：

select count(*) from t2/t3 where (rank1 between 1 and 10) and log_date select count(*) from t2/t3 where (rank1 between 1 and 10) and log_date explain format=json select count(*) from t2 where (rank1 between 1 and 10) and log_date explain format=json select count(*) from t3 where (rank1 between 1 and 10) and log_date , “key”: “idx_log_date”, “used_key_parts”: , “key_length”: “4”, “rows_examined_per_scan”: 1, “rows_produced_per_join”: 1, “filtered”: “100.00”, “index_condition”: “(`ytt`.`t3`.`log_date` , “attached_condition”: “(`ytt`.`t3`.`rank1` between 1 and 10)” } }}1 row in set, 1 warning (0.00 sec)

跨数据库联表查询效率的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于跨数据库联表查询效率,如何提高跨数据库联表查询的效率,大量数据多表联合查询时时，使用视图，是不是比直接查询速度要快！有高手请给讲讲，如何提高查询速度的信息别忘了在本站进行查找喔。

数据运维技术 » 如何提高跨数据库联表查询的效率 (跨数据库联表查询效率)

分享到：

大量数据多表联合查询时时， 使用视图，是不是比直接查询速度要快！ 有高手请给讲讲，如何提高查询速度

相关推荐

大量数据多表联合查询时时，使用视图，是不是比直接查询速度要快！有高手请给讲讲，如何提高查询速度