云数据仓库 GaussDB(DWS)_标签_开发者

博客(1.3k)
视频(41)
论坛(0)
云声(73)
代码示例(8)

突破SQL最大Stream数量的限制

DWS SQL的最大50个Stream的限制是由于DWS SQL的并行度限制所导致的。要突破这个限制，可以考虑以下几种方法： 1. 使用更高配置的DWS实例： DWS实例的配置越高，其并行度也越高，可以支持更多的Stream。 2. 优化SQL语句：通过优化SQL语句，减少数据的传输量和计算量，可以降低Stream的数量。 3. 使用分布式表：将数据分散到多个分布式表中，可以增加并行度，从而支持更多的Stream。 4. 使用分区表：将数据按照某个字段进行分区，可以将数据分散到多个分区中，从而增加并行度，支持更多的Stream。 5. 使用分布式事务：使用分布式事务可以将事务分散到多个节点中，从而增加并行度，支持更多的Stream。

yd_283757406 发表于2023-11-01 19:28:34 2023-11-01 19:28:34 最后回复 yd_283757406 0
82 0

云数据仓库 GaussDB(DWS)
预估内存过大

预估内存过大的危害： 1. 系统性能下降：会导致系统运行缓慢，甚至崩溃。 2. 系统稳定性下降：会导致系统出现异常，甚至崩溃。 3. 用户体验下降：会导致用户体验变差，应用响应变慢，甚至崩溃。DWS 预估内存过大，可以从以下几个方面进行优化: 1. 检查有没有重复计算的子句如窗口函数中，在每一行上都会计算的表达式，可以通过使用子查询或 JOIN 实现，避免重复计算。 2. 使用更高效的算法和数据结构如使用哈希表存储查询结果，而不是使用数组，这样可以显著减少内存使用。 3. 对于大型数据集，可以使用分布式计算框架来进行预处理如Spark，然后使用 DWS 进行查询，这样可以显著减少 DWS 的查询内存使用。 4. 对于需要大量内存的查询，可以使用内存数据库来存储查询结果如Redis，这样可以显著减少 DWS 的内存使用。 5. 对于需要大量计算的查询，可以使用分布式计算框架来进行计算如Spark，这样可以显著减少 DWS 的计算内存使用。

yd_283757406 发表于2023-11-01 19:26:32 2023-11-01 19:26:32 最后回复 yd_283757406 0
129 0

云数据仓库 GaussDB(DWS)
[其他问题] DWS pg_stat_activity 中查询到的 application_name 是 ComputePoolMonitor 是做什么的

DWS pg_stat_activity 中查询到的 application_name 是 ComputePoolMonitor 是做什么的？具体在那些版本中存在这个？

纯純莼蒓靐窠㦡 发表于2023-11-01 11:30:59 2023-11-01 11:30:59 最后回复 fxy0224 2023-11-01 11:44:11
149 2

云数据仓库 GaussDB(DWS)
[其他] DWS管控面之弹性变更规格

【问题现象】仅限HCS形态下问题场景,在操作弹性变更规格时无法选择创建集群时的已有的其他规格。【常见版本】HCS8.2.1以上弹性变更规格仅8.1.1.300及以上集群版本支持。当前仅支持离线变更规格，变更时间大约需要10分钟左右。变更规格目前仅支持ECS+EVS形态的标准数仓或实时数仓集群。【定位思路】 1、登录DWS的RMS库登录方式请搜索其他案例或维护手册，此处省略。 2、查找集群规格id和目标规格id 2.1、集群规格id: select specid from rds_instance where clusterid = 'xxx'; (xxx表示要变更规格的集群id) 2.2、目标规格id: select specId from rds_resspecattr where attrCode='flavor'and value='xx.xxlarge.x'; (xx.xxlarge.x表示目标规格) 3、通过步骤2中查到的两个id替换到如下SQL中，再插入数据 insert into rds_spec_change (id, type, source_id, change_id) values (uuid(), 'flavor-resize', '集群规格id', '目标规格id); 4、插入数据后刷新页面即可

德莱文 发表于2023-11-01 11:01:41 2023-11-01 11:01:41 最后回复德莱文 0
156 0

云数据仓库 GaussDB(DWS)
[问题求助] GaussDB(DWS)如何与其他华为产品和服务集成？

GaussDB(DWS)如何与其他华为产品和服务集成，包括大数据平台、云计算服务、AI和物联网等方面，以及如何通过这些集成实现更高效的数据处理、分析和应用开发。

皮牙子抓饭 发表于2023-10-31 17:35:30 2023-10-31 17:35:30 最后回复加油O幸福 2023-10-31 21:04:34
257 2

云数据仓库 GaussDB(DWS)
[问题求助] GaussDB(DWS)如何优化资源利用和管理？

GaussDB(DWS)如何进行资源分配和调度，以及如何优化存储和计算资源以减少浪费和提高效率。

皮牙子抓饭 发表于2023-10-31 17:34:52 2023-10-31 17:34:52 最后回复半岛里有个小铁盒 2023-11-02 10:42:13
60 2

云数据仓库 GaussDB(DWS)
[问题求助] GaussDB(DWS)如何支持实时数据分析和决策？

GaussDB(DWS)如何支持实时数据分析，包括实时数据捕获、处理、查询和分析等方面，以及如何与其他数据分析工具集成以提供更全面的决策支持。

皮牙子抓饭 发表于2023-10-31 17:34:31 2023-10-31 17:34:31 最后回复半岛里有个小铁盒 2023-11-02 10:44:39
292 2

云数据仓库 GaussDB(DWS)
[问题求助] GaussDB(DWS)如何保障数据安全性和隐私保护？

GaussDB(DWS)提供哪些安全机制和隐私保护技术来保护我们的数据，以及如何管理和监控这些设置以确保数据的安全性和隐私保护。

皮牙子抓饭 发表于2023-10-31 17:33:36 2023-10-31 17:33:36 最后回复加油O幸福 2023-10-31 21:03:07
68 2

云数据仓库 GaussDB(DWS)
[问题求助] GaussDB(DWS)在数据仓库方面的性能如何？

GaussDB(DWS)在数据查询、写入、聚合等操作方面的性能表现，以及与其他同类产品相比的优势和劣势。

皮牙子抓饭 发表于2023-10-31 17:33:06 2023-10-31 17:33:06 最后回复加油O幸福 2023-10-31 21:02:10
370 2

云数据仓库 GaussDB(DWS)
[互动交流] DGC如何与其他华为数据产品集成？如DWS

如何与其他华为数据产品（DWS）集成，以及如何实现数据共享、交换和协同工作以提高效率和减少冗余。

皮牙子抓饭 发表于2023-10-31 16:51:56 2023-10-31 16:51:56 最后回复雨落无痕 2023-11-02 15:16:57
171 2

数据湖云数据仓库 GaussDB(DWS)
[问题求助] dws如何进行脱敏处理

dws如何进行脱敏处理

皮牙子抓饭 发表于2023-10-31 16:40:08 2023-10-31 16:40:08 最后回复加油O幸福 2023-10-31 21:05:29
69 2

云数据仓库 GaussDB(DWS)
[运维管理] HCS DWS OS故障替换主机

有一个困扰，纯软形态下，DWS主机OS故障且不可修复后，可通过手动安装OS、配置好IP后再进行gs_replace修复。但HCS中的BMS形态部署的DWS集群，如果某台主机OS故障且无法修复的情况下，如何进行主机替换呢？有以下几点考虑，但不知道如何解决：1. 新的主机进行bms入云初始化后，如何成为故障主机对应的裸金属实例，即部署dws服务前的纯净节点？2. 因为bms形态下的dws集群是自动下发的OS及dws服务实例，里面的ip配置是从cidr地址池中获取的，此时是直接修改为故障主机的ip么？包括内大网地址、interMgntSubnet、internalSubnet、managerSubnet、业务vpc地址及主机名-裸机实例名，改这些如何实现，会有其他影响么？3. 前述完成后再如纯软形态下执行gs_replace修复，该主机上的管控面插件又如何恢复部署？

yd_234518757 发表于2023-10-30 21:07:02 2023-10-30 21:07:02 最后回复 yd_234518757 2023-10-31 17:09:35
255 3

云数据仓库 GaussDB(DWS)
如何选择分布键

选择分布键是设计分布式表的重要决策之一。如果表没有主键，可以考虑使用序列或轮询作为分布键。序列分布键序列分布键是根据某个列的值进行哈希分布，这样相同值的行将被分配到同一个分区中。这种方式适用于具有高度重复值的列，例如日期或状态列。使用序列分布键可以提高查询性能，因为相关数据在同一个分区中，减少了数据的移动和网络传输。轮询分布键轮询分布键是按照顺序将行分配到不同的分区中。这种方式适用于没有明显的重复值的列，例如自增主键。使用轮询分布键可以实现数据的均匀分布，避免了数据倾斜的问题。哪种方式更优取决于具体的业务需求和数据特点。如果表中的数据具有明显的重复值，使用序列分布键可能更合适。如果数据没有明显的重复值，使用轮询分布键可以实现更均匀的数据分布。需要注意的是，选择分布键时还需要考虑数据的增长和变化情况，以及查询的频率和类型。最好进行测试和评估，根据实际情况选择最优的分布键策略。

yd_283757406 发表于2023-10-30 19:34:27 2023-10-30 19:34:27 最后回复 yd_283757406 0
98 0

云数据仓库 GaussDB(DWS)
DWS分区过多的危害

危害1：DWS分区过多会导致锁等待问题的出现主要原因是分区过多会增加锁的竞争，从而导致锁等待的情况。当一个事务需要访问多个分区时，需要获取多个分区的锁，如果这些分区的锁被其他事务占用，就会出现锁等待的情况，从而导致事务的阻塞和性能下降。危害2：分区过多还会导致存储空间的浪费和查询性能的下降分区过多会增加元数据的存储空间，从而导致存储空间的浪费。同时，查询时需要扫描更多的分区，从而导致查询性能的下降。因此，在设计DWS分区时，需要根据实际情况合理划分分区，避免分区过多导致的问题。一般来说，可以根据数据的访问模式、数据量、查询需求等因素来确定分区策略，以达到最优的性能和存储效率。

yd_283757406 发表于2023-10-30 19:30:29 2023-10-30 19:30:29 最后回复 yd_283757406 2023-10-30 19:30:29
117 0

云数据仓库 GaussDB(DWS)
SQL高并发压测性能优化

1. 数据库设计优化：在设计数据库时，应考虑表的结构、索引、数据类型和分区等因素，以确保数据库能够快速响应大量并发请求。2. SQL语句优化：应使用合适的索引、避免使用不必要的JOIN语句和子查询、避免使用过多的函数和表达式等。3. 数据库分区：将大表分成多个小表，以减少查询时的数据量，提高查询速度。4. 数据库服务器优化：应调整服务器参数，如内存、CPU、磁盘和网络等，以提高服务器的吞吐量和响应时间。5. 数据库缓存优化：应使用适当的缓存策略，如缓存数据、查询结果和查询计划等，以减少数据库访问时间。6. 数据库连接池优化：应设置合理的连接池大小和超时时间，以确保数据库连接的可用性和响应时间。7. 负载均衡优化：应使用适当的负载均衡策略，如轮询、权重和故障转移等，以确保请求的平衡分发和高可用性。8. 监控和调试优化：应使用适当的监控工具，如性能监视器和日志分析器等，以及适当的调试技术，如断点和日志记录等，以快速诊断和解决性能问题。

yd_283757406 发表于2023-10-30 18:44:23 2023-10-30 18:44:23 最后回复 yd_283757406 0
88 0

云数据仓库 GaussDB(DWS)

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript