云存储_标签_开发者

博客(108)
视频(61)
论坛(332)
云声(0)
代码示例(0)

【话题交流】谈谈大家对2024的总结和对2025的展望

2024年在转眼间就来到了年末，马上将要迎接全新的2025。过几天就是元旦啦，提前祝大家新年快乐！这一整年，我们都在努力生活，认真工作，得到了时间，也收获了成长。这一年，我们经历了无数次想放弃，无数次想换岗位的纠结。这一年，我们开心的聚会，快乐的团建。这一年，在华为云社区的陪伴下我们收获了许许多多……一晃就要到了2025年，新的一年又有新的计划，新的打算。2024的征程尚未远去，那一路的奋斗与荣耀如同璀璨星光仍在心头闪耀。而此刻，我们已站在新的起点，2025像一场盛大的冒险在前方张开怀抱，让我们带着过去的热情与经验，无畏地冲向新的一年！2024如同一条奔腾不息的河流，载着我们的梦想与努力流过岁月。如今，站在这河流的交汇处，我们眺望2025，那是一片等待我们开拓与耕耘的新土地，带着过往的智慧，我们要稳步前行。2024像是一座桥梁，连接着我们的过去与未来。现在，我们已经走过这座桥，站在2025的桥头堡，望向那充满希望的远方，那是新的征程，新的希望在召唤我们前行。新的一年，一定有新的目标，带着目标出发，我们才有坚定的方向。祝愿大家2024一帆风顺，事业长虹。在这里大家一起来谈谈对2024的总结和2025的展望吧

Jack20 发表于2024-12-26 11:49:26 2024-12-26 11:49:26 最后回复 Jack20 2024-12-31 20:40:55
684 33

云存储
如何使用 MongoDB 进行数据备份和恢复

在 MongoDB 中，数据备份和恢复是确保数据安全的关键操作。以下是几种常见的方法来实现 MongoDB 的数据备份和恢复：备份数据使用 mongodump 命令：mongodump 是一个官方提供的命令行工具，用于导出 MongoDB 数据库的内容到 BSON 文件中。备份所有数据库：mongodump --out <backup-directory>备份特定数据库：mongodump --db <database-name> --out <backup-directory>备份特定集合：mongodump --db <database-name> --collection <collection-name> --out <backup-directory>文件系统快照：对于基于磁盘存储引擎（如 WiredTiger）的 MongoDB 实例，可以通过创建文件系统级别的快照来备份数据。这种方法通常适用于虚拟机环境或支持快照功能的存储系统。步骤：停止写入操作。确保所有正在运行的操作都已完成。创建快照。恢复写入操作。使用复制集/分片集群：MongoDB 的复制集可以提供自动的数据冗余，这是通过将数据同步到多个节点实现的。如果主节点发生故障，可以快速切换到副本节点继续服务，并且可以从副本节点恢复数据。步骤：确保你的 MongoDB 部署在一个健康的复制集中。当需要恢复时，可以选择一个最新的健康副本作为新的主节点。MongoDB Atlas（Cloud Manager）备份：如果你使用的是 MongoDB Atlas 或 Cloud Manager，它们提供了自动化备份解决方案，包括按需备份、定期备份以及点对点恢复等功能。设置：登录到 MongoDB Atlas 控制台。选择集群并配置备份策略。执行备份和恢复操作。恢复数据使用 mongorestore 命令：mongorestore 用来从 mongodump 导出的文件中恢复数据。恢复所有数据库：mongorestore <backup-directory>恢复特定数据库：mongorestore --db <database-name> <backup-directory>恢复特定集合：mongorestore --db <database-name> --collection <collection-name> <backup-file-path>文件系统快照恢复：将快照恢复到 MongoDB 数据目录。重启 MongoDB 服务。复制集恢复：在复制集中提升一个副本为新的主节点。或者从副本节点手动拷贝数据到一个新的实例。MongoDB Atlas 恢复：通过 Atlas 控制台选择合适的备份点。按照指示进行恢复操作。注意事项在进行备份和恢复之前，务必停止所有写入操作，尤其是在使用 mongodump 或文件系统快照时。对于生产环境，建议在非工作时间执行备份和恢复，以减少对业务的影响。定期测试备份和恢复流程，确保备份的有效性。考虑备份文件的安全性和完整性，例如加密备份文件并将其存储在安全的地方。

Jack20 发表于2024-12-26 11:43:21 2024-12-26 11:43:21 最后回复林欣 2024-12-29 16:56:06
316 2

MongoDB 云存储
MongoDB 常用的管理命令知识点汇总

MongoDB 是一个流行的 NoSQL 数据库，以下是一些常用的管理命令：数据库操作use <database>：切换到指定的数据库，如果数据库不存在，则创建一个新的数据库。show dbs：显示所有数据库的列表。db.dropDatabase()：删除当前使用的数据库。集合操作<tiangong type="reference" index="1-3">db.createCollection("<collection_name>")</tiangong>：显式创建一个集合。show collections：显示当前数据库中的所有集合。<tiangong type="reference" index="6-5">db.<collection_name>.drop()</tiangong>：删除指定的集合。文档操作<tiangong type="reference" index="6-6">db.<collection_name>.insertOne(<document>)</tiangong>：向集合中插入一个文档。<tiangong type="reference" index="6-7">db.<collection_name>.insertMany([<document1>, <document2>,...])</tiangong>：向集合中插入多个文档。db.<collection_name>.find()：查询集合中的所有文档。db.<collection_name>.findOne(<query>)：查询集合中符合条件的一个文档。db.<collection_name>.updateOne(<query>, <update>)：更新集合中符合条件的一个文档。db.<collection_name>.updateMany(<query>, <update>)：更新集合中符合条件的多个文档。db.<collection_name>.deleteOne(<query>)：删除集合中符合条件的一个文档。db.<collection_name>.deleteMany(<query>)：删除集合中符合条件的多个文档。索引操作db.<collection_name>.createIndex({<field>: 1})：在指定字段上创建升序索引。db.<collection_name>.createIndex({<field>: -1})：在指定字段上创建降序索引。db.<collection_name>.dropIndex("<index_name>")：删除指定的索引。用户管理<tiangong type="reference" index="1-8">db.createUser({user: "<username>", pwd: "<password>", roles: ["<role>"]})</tiangong>：创建一个新用户。db.auth("<username>", "<password>")：验证用户的登录。show users：显示当前数据库中的所有用户。<tiangong type="reference" index="6-9">db.dropUser("<username>")</tiangong>：删除指定的用户。其他操作db.stats()：显示当前数据库的状态信息。db.version()：显示 MongoDB 服务器的版本号。db.getMongo()：显示当前数据库的连接信息。这些命令是 MongoDB 管理的基础，通过它们可以完成数据库、集合、文档的增删改查操作，以及用户管理和索引操作等。在实际使用时，可以根据具体需求组合使用这些命令。

Jack20 发表于2024-12-26 11:42:19 2024-12-26 11:42:19 最后回复林欣 2024-12-29 17:00:39
20 2

MongoDB 云存储
MongoDB部署小实践分享

MongoDB 简介MongoDB 是一个开源、跨平台的文档型数据库，旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。它支持的数据结构非常松散，是类似 JSON 的 BSON 格式，因此可以存储比较复杂的数据类型。MongoDB 的特点包括高性能、易部署、易使用，存储数据非常方便。它支持的数据结构非常松散，是类似 JSON 的 BSON 格式，因此可以存储比较复杂的数据类型。MongoDB 最大的特点是它支持的查询语言非常强大，其语法有点类似于面向对象的查询语言，几乎可以实现类似关系数据库单表查询的绝大部分功能，而且还支持对数据建立索引。MongoDB 的部署MongoDB 的部署可以根据不同的操作系统平台进行，以下是一些常见的部署方式：在 Linux 上部署 MongoDB安装 MongoDB：下载 MongoDB 的安装包，可以从 MongoDB 官方网站下载适合您操作系统的版本。解压安装包到指定目录，例如：tar -zxvf mongodb-linux-x86_64-rhel70-7.0.14.tgz -C /usr/local/创建软链接：ln -s /usr/local/mongodb-linux-x86_64-rhel70-7.0.14/ /usr/local/mongodb创建数据和日志目录：mkdir /usr/local/mongodb/{data,logs}touch /usr/local/mongodb/logs/mongodb.log设置环境变量：vim /etc/profileexport MONGODB_HOME=/usr/local/mongodbexport PATH=$MONGODB_HOME/bin:$PATH生效环境变量：source /etc/profile修改配置文件：vim /etc/mongodb.conf# 指定数据库路径dbpath=/usr/local/mongodb/data# 指定 MongoDB 日志文件logpath=/usr/local/mongodb/logs/mongodb.log# 使用追加的方式写日志logappend=true# 端口号port=27017# 方便外网访问bind_ip=0.0.0.0fork=true# 以守护进程的方式运行 MongoDB，创建服务器进程#auth=true# 启用用户验证#bind_ip=0.0.0.0# 绑定服务 IP，若绑定 127.0.0.1，则只能本机访问，不指定则默认本地所有 IP#replSet=single# 开启 oplog 日志用于主从复制启动和关闭服务：# 启动mongod -f /etc/mongodb.conf# 关闭mongod --shutdown -f /etc/mongodb.conf验证：ps -ef|grep mongodbnetstat -ntlp|grep 27017安装 MongoDB Shell：下载安装包：wget https://downloads.mongodb.com/compass/mongosh-2.3.2-linux-x64.tgz解压：tar fx mongosh-2.3.2-linux-x64.tgz修改命令目录：cp mongosh-2.3.2-linux-x64/bin/mongosh /usr/local/bin/登录：# 不需要认证mongosh# 需要认证mongosh mongodb://192.168.9.25:27017/admin -u "admin" -p "abc123456"在 Windows 上部署 MongoDB下载 MongoDB：从 MongoDB 官方网站下载适合您操作系统的版本。选择 ZIP 安装包，因为它只需要解压就可以使用。解压 MongoDB 安装包：将下载的 ZIP 文件解压到您选择的目录，例如 D:\Tool\mongodb-win32-x86_64-windows-4.4.24。启动 MongoDB 服务：创建一个和 bin 目录同级的 data 文件夹，并在 data 文件夹下创建 db 和 log 子文件夹，其中 db 文件夹用于储存数据库文件，logs 文件夹用于储存日志文件。在 MongoDB 的 bin 文件夹下打开命令行窗口，输入以下命令启动 MongoDB 服务：mongod --dbpath=..\data\db启动之后可以看到 MongoDB 的默认端口是 27017。在浏览器中输入 localhost:27017，如果得到提示就能证明 MongoDB 启动成功。在命令行窗口按 Ctrl+c 结束以上命令，然后输入以下命令创建 mongodb.log 日志文件：mongod --logpath=..\data\logs\mongodb.log使用配置文件启动 MongoDB 服务：在使用配置文件的方式启动 MongoDB 服务之前，需要创建一个和 bin 目录同级的 conf 文件夹，并在文件夹下面创建 mongdb.conf 文件来存放配置文件信息。打开文本编辑器，创建一个自定义文件，将以下配置添加到文件中：systemLog: destination: "file" path: "E:\\mongoDB_data\\log\\mongod.log"storage: dbPath: "E:\\mongoDB_data\\db"net: port: 27017 bindIp: 192.168.10.62进入 bin 目录下，使用命令行窗口，使用命令的形式让 MongoDB 指定配置文件启动：mongod -f..\conf\mongodb.conf若想关闭 MongoDB 服务，只需关闭命令行窗口或者按 Ctrl+c。以上是 MongoDB 在 Linux 和 Windows 上的基本部署步骤，具体的部署方式可能会根据您的操作系统版本和 MongoDB 的版本有所不同。在部署过程中，您可能需要根据实际情况调整一些配置参数，以确保 MongoDB 能够在您的环境中正常运行。

Jack20 发表于2024-12-26 11:40:26 2024-12-26 11:40:26 最后回复林欣 2024-12-29 17:00:42
59 2

云存储
一些工作中常见的更新全表或利用逻辑数据库更新所有实体表可能引发的问题及解决方法

以下是在工作中更新全表或利用逻辑数据库更新所有实体表可能引发的问题：一、性能方面查询性能下降如果在业务高峰期进行全表更新，数据库的查询操作会受到严重影响。因为更新操作会占用大量的系统资源，如CPU、内存和磁盘I/O。例如，在一个在线商城系统中，在促销活动期间（高并发查询场景）进行全表更新，可能会导致用户查询商品信息、查看购物车等操作变得非常缓慢。全表更新可能会使数据库的索引失效或者需要重新构建索引。例如，在MySQL中，当更新了表中的数据列，如果这些列是索引的一部分，索引可能需要重新调整。这一过程会消耗额外的时间和资源，进一步影响数据库的整体性能。长时间锁表全表更新通常会对表加锁。在关系型数据库（如Oracle、SQL Server等）中，长时间的锁表可能会导致其他事务等待，从而影响系统的并发处理能力。例如，一个财务系统中，如果对包含所有财务数据的表进行全表更新，其他涉及该表的财务报表查询、数据录入等事务可能会被阻塞，直到更新操作完成。二、数据一致性方面数据丢失风险如果在更新过程中出现意外情况，如系统崩溃、网络中断等，可能会导致数据部分更新或者处于不一致的状态。例如，在更新一个包含用户订单信息的全表时，更新到一半系统突然断电，如果没有完善的事务处理机制，可能会丢失部分订单的更新信息或者使订单状态变得混乱。数据关联性破坏在一个包含多个实体表且表之间存在关联关系（如外键约束）的逻辑数据库中，全表更新可能会破坏这种关联关系。例如，在一个学生管理系统中，有学生表和选课表，通过学生ID关联。如果在更新学生表的全表时，没有正确处理与选课表的关联关系，可能会导致选课表中的学生ID与更新后的学生表中的学生ID不匹配，从而破坏数据的完整性。三、资源消耗方面日志文件膨胀数据库在执行全表更新操作时，会产生大量的日志记录。例如，在Oracle数据库中，这些日志记录会占用大量的存储空间，导致日志文件快速膨胀。如果不及时清理或管理，可能会影响数据库的正常运行，甚至耗尽磁盘空间。备份和恢复复杂性增加全表更新后的数据库备份和恢复操作会变得更加复杂。因为更新后的数据状态与更新前有很大差异，在进行数据恢复时，可能需要更多的步骤和资源来确保数据能够恢复到正确的状态。例如，在一个企业的重要业务数据库中，如果需要从全表更新后的备份中恢复数据，可能需要考虑更新操作对数据结构、索引等方面的影响，增加了恢复的难度和时间成本。数据完整性问题：如果在更新过程中发生错误，可能会导致部分数据更新成功，部分数据更新失败，从而破坏数据的完整性。例如，如果在更新多个相关表时，其中一个表的更新失败，可能会导致数据不一致。性能问题：更新全表或大量数据可能会导致数据库性能下降，尤其是在生产环境中。这可能会影响到其他正在进行的数据库操作，甚至导致系统停机。并发访问问题：如果多个用户或进程同时尝试更新相同的数据，可能会导致并发访问问题，如死锁或数据冲突。备份和恢复问题：在进行大规模更新之前，如果没有进行适当的数据备份，一旦更新出现问题，可能无法恢复到之前的状态。逻辑错误：如果更新逻辑不正确，可能会导致错误的数据被更新，从而影响业务逻辑的正确性。索引问题：更新操作可能会影响数据库的索引结构，如果索引没有得到适当的维护，可能会导致查询性能下降。为了避免这些问题，建议在进行全表更新或大规模更新时采取以下措施：备份数据：在进行任何更新操作之前，确保对数据进行了备份，以便在需要时可以恢复到之前的状态。使用事务：将更新操作包装在事务中，以确保所有更新操作都能正确执行，并且可以回滚到事务之前的状态。分批更新：如果表非常大，可以考虑分批次进行更新，以减少对数据库性能的影响。监控和日志：在执行更新操作时，监控数据库的性能，并查看日志文件以诊断可能出现的问题。优化索引：在更新之前，考虑是否需要重新评估和优化索引，以提高更新操作的性能。避免锁表：尽可能避免使用LOCK TABLES，因为它会阻止其他用户访问表。使用LOW_PRIORITY：如果使用LOW_PRIORITY选项，更新操作将在没有其他读取操作时才执行，这可以减少对生产环境的影响。使用IGNORE：如果使用IGNORE选项，即使更新操作中出现错误，也不会停止更新过程。分析执行计划：使用EXPLAIN关键字分析更新操作的执行计划，以找出可能的性能瓶颈。

Jack20 发表于2024-12-26 11:33:27 2024-12-26 11:33:27 最后回复林欣 2024-12-29 16:59:33
9 2

云存储数据库
分析 SQL 查询的执行计划的工具——EXPLAIN

EXPLAIN 是一个非常有用的工具，用于分析 SQL 查询的执行计划，帮助优化查询性能。然而，它的可靠性取决于多种因素，包括数据库版本、查询的复杂性、数据分布等。以下是一些关键点：一、EXPLAIN 的基本功能及可靠性基本功能EXPLAIN 可以用来查看 SQL 语句的执行效果，帮助选择更好的索引和优化查询语句，解决大部分的性能问题。它能提供查询的执行计划信息，如查询中表的读取顺序、数据读取操作的类型、哪些索引可以使用、哪些索引被实际使用、表之间的引用以及每张表有多少行被优化器查询等。可靠性方面在很多情况下，EXPLAIN 的结果是可靠的。例如，它可以准确地显示查询是否使用了索引，以及使用了哪些索引。然而，EXPLAIN 提供的信息也存在一定的局限性。例如，它显示的 rows 列是预估的扫描行数，这个数值可能并不准确。二、影响 EXPLAIN 可靠性的因素数据库版本差异不同版本的数据库可能会对 EXPLAIN 的输出结果产生影响。例如，MySQL 5.0 和 MySQL 8.0 在 EXPLAIN 的输出格式和内容上可能存在差异。查询复杂性对于简单的查询，EXPLAIN 的结果通常比较可靠。但对于复杂的查询，尤其是包含多个子查询、联合查询和复杂条件的查询，EXPLAIN 的结果可能会变得复杂且难以准确解读。数据分布数据在表中的分布情况会影响 EXPLAIN 的结果。如果数据分布不均匀，例如某些列的值存在严重的偏斜，那么 EXPLAIN 提供的预估信息可能与实际执行情况存在较大偏差。三、EXPLAIN 的局限性执行计划与实际执行的差异EXPLAIN 显示的是查询的执行计划，但实际执行时可能会因为系统负载、缓存等因素而有所不同。例如，在高并发环境下，查询的执行时间可能会受到其他并发查询的影响，而这种影响在 EXPLAIN 的结果中可能无法体现。无法反映所有性能问题虽然 EXPLAIN 可以帮助发现很多性能问题，但它并不能反映所有可能影响性能的因素。例如，它无法直接显示查询是否会导致数据库的锁竞争，而锁竞争可能是导致性能下降的重要原因。四、使用 EXPLAIN 的建议结合实际执行情况分析不能仅仅依赖 EXPLAIN 的结果来优化查询，还需要结合实际的执行情况进行分析。可以通过在不同的环境和负载条件下测试查询的性能，来验证 EXPLAIN 结果的准确性。关注关键指标在分析 EXPLAIN 的结果时，应重点关注 type 列，因为它显示了连接使用的类别和是否使用了索引，这是分析性能瓶颈的关键项之一。同时，Extra 列也很重要，它包含了很多额外的信息，如是否使用了文件排序、是否有临时表等，这些信息能提供很多关于查询性能的线索。使用扩展功能可以使用 EXPLAIN EXTENDED 来获取额外的查询优化信息，通过 SHOW WARNINGS 命令可以得到优化后的查询语句，从而看出优化器优化了什么。如果查询是基于分区表的，使用 EXPLAIN PARTITIONS 可以显示查询将访问的分区，这有助于分析分区相关的性能问题。

Jack20 发表于2024-12-26 11:29:48 2024-12-26 11:29:48 最后回复林欣 2024-12-29 16:59:20
9 1

云存储数据库
MySQL InnoDB 引擎在 RR 隔离级别下的幻读问题

MySQL InnoDB 引擎在 RR 隔离级别下的幻读问题关键概念解析幻读 (Phantom Read): 幻读是指当某个事务在读取某个范围内的记录时，另一事务在此范围内插入新的记录，导致前一事务再次读取该范围时，会出现新的“幻影”行。具体来说，在事务T1读取某一范围的记录后，事务T2在此范围内插入新行，并提交。当T1再次读取同一范围时，会看到新插入的行，这就是幻读现象。RR 隔离级别 (Repeatable Read): RR 是数据库事务隔离级别之一，保证在同一事务中多次读取同一记录的结果是一致的。这是MySQL的默认隔离级别，通过多版本并发控制 (MVCC) 来实现大部分一致性需求。然而，RR 级别在理论上仍可能存在幻读问题。文献分析《高性能MySQL 第三版》:REPEATABLE READ 解决了脏读和部分不可重复读问题，但仍有可能发生幻读。书中提到，InnoDB 和 XtraDB 存储引擎通过 MVCC 解决了幻读问题。然而，MVCC 主要通过保留数据的多个版本来避免读写冲突，对于范围查询的幻读问题，还需要额外的锁定机制。《MySQL 技术内幕 - InnoDB 存储引擎第二版》:InnoDB 在 REPEATABLE READ 隔离级别下采用 Next-Key Locking 机制来避免幻读问题。Next-Key Lock 不仅锁定查询涉及的行，还会对索引中的间隙进行锁定，防止其他事务在这些间隙中插入新行，从而避免幻读的发生。掘金文章:测试案例表明，在 REPEATABLE READ 隔离级别下，使用普通的 SELECT 语句（快照读）确实可以避免幻读。然而，使用 SELECT ... FOR UPDATE （当前读）时，则会发生幻读现象。这是因为 FOR UPDATE 会请求当前最新的数据版本，从而受到其他已提交事务的影响。实验验证示例 1:事务 1 先查询表 t 的所有记录，接着事务 2 插入一行新数据并提交，事务 1 再次查询。结果显示，事务 1 两次查询得到相同的结果集，看似避免了幻读。示例 2:同样的初始步骤，但事务 1 使用 SELECT ... FOR UPDATE 进行第二次查询，结果发现查询到了事务 2 新插入的数据，证明在 REPEATABLE READ 隔离级别下，当前读操作仍会导致幻读。示例 3:事务 1 在事务 2 插入新数据并提交后，执行更新操作，再查询。结果显示，更新操作可以看到新插入的数据，这也是一种幻读现象。幻读问题的解决方法实体化冲突:构造一个时间-房间表，每一行对应特定的时间段，事务在查询并锁定相应行后再进行插入操作，防止幻读。谓词锁 (Predicate Locks):作用于满足某些搜索条件的所有对象，限制其他事务的读取和写入操作，确保事务的隔离性。索引区间锁 (Next-Key Locking):InnoDB 采用的机制，结合行锁和间隙锁，防止在同一范围内插入新行，有效避免幻读问题。结论MySQL InnoDB 引擎在 REPEATABLE READ 隔离级别下，通过 Next-Key Locking 机制，可以在普通查询（快照读）的情况下避免幻读问题。然而，使用 SELECT ... FOR UPDATE （当前读）时，仍可能发生幻读现象。因此，可以说 InnoDB 的 REPEATABLE READ 隔离级别并没有完全解决幻读问题，尤其是在涉及范围查询和当前读的场景下。

Jack20 发表于2024-12-26 11:22:14 2024-12-26 11:22:14 最后回复林欣 2024-12-29 16:57:09
20 1

云存储
华为云数据脱敏服务支持非结构化数据脱敏知识点

华为云数据脱敏服务支持非结构化数据脱敏。以下是具体分析：一、华为云数据安全中心（DSC）的非结构化数据支持情况数据采集阶段DSC通过构建自动化数据识别引擎，在数据生成的时候就能呈现整体风险，支持200种数据格式，支持结构化数据、非结构化数据，真正做到场景全覆盖。敏感数据识别阶段在AI和专家知识库的双重加权下，精准识别敏感数据和文件，覆盖结构化（RDS）和非结构化（OBS）两种数据类型，实现云上全场景覆盖。其中文件类型支持近200种非结构化文件，数据类型支持数十种个人隐私数据类型（包含中英文），图片类型支持识别8种类型（png、jpeg、x - portable - pixmap、tiff、bmp、gif、jpx、jp2）图片中的敏感文字（包含中英文）。二、数据脱敏服务对非结构化数据的支持数据脱敏类型华为云DSC的数据脱敏支持多种脱敏类型，如Hash脱敏（使用Hash函数对敏感数据进行脱敏，脱敏后敏感信息将变为一串不可恢复的字符串）、加密脱敏（通过加密算法将数据转为密文，可再通过数据密钥将密文转为明文，适用于脱敏后需要恢复数据的场景）、字符掩盖（使用指定字符*或随机字符方式遮盖部分内容，一般身份证号、银行卡号、手机号码等个人敏感信息会采用该方式）、关键字替换（可针对制定的关键词进行替换）、删除脱敏（将指定字段设置为Null或空值，如将字符型的字段设置为空串，数值类的字段设置为0，日期类的字段设置为1970，时间类的字段设置为零点）、取整脱敏（将特定参数进行取整运算，比如日期、时间、数字）等。这些脱敏类型可以应用于非结构化数据中的敏感信息处理。数据脱敏特点DSC的数据脱敏支持静态脱敏和动态脱敏，其特点包括不影响用户数据（从原始数据库读取数据，通过精确的脱敏引擎，对用户的敏感数据实施静态脱敏，脱敏结果另行存放，不会影响原始的用户数据）、支持云上各类场景（支持RDS，ECS自建数据库，大数据合规）、满足多种脱敏需求（用户可以通过20 +种预置脱敏规则，或自定义脱敏规则来对指定数据库表进行脱敏）、实现一键合规（基于扫描结果自动提供脱敏合规建议，一键配置脱敏规则）。虽然这里提到的是数据库表，但结合前面提到的非结构化数据的敏感数据识别等内容，可以推断出非结构化数据脱敏也能满足这些特点。

Jack20 发表于2024-12-26 11:20:14 2024-12-26 11:20:14 最后回复林欣 2024-12-29 16:57:03
95 3

云存储
一文带你了解关系型数据库和NoSQL数据库的各有所长

关系型数据库和NoSQL数据库各有优势和适用场景，虽然关系型数据库已经广泛应用于各种领域，但在某些特定场景下，NoSQL数据库能够提供更好的解决方案。以下是具体分析：关系型数据库的特点和优势特点优势表格结构数据结构清晰，易于理解和管理约束支持定义在数据上的各种约束，保证数据的完整性和一致性SQL使用结构化查询语言(SQL)作为标准的数据操作语言，支持复杂查询事务管理支持事务处理，确保数据的原子性、一致性、隔离性和持久性(ACID属性)可扩展性支持分布式数据库系统、集群技术等手段实现水平扩展数据安全性支持权限管理和数据加密等安全措施，保证数据的安全性和完整性标准化和通用性使用SQL语言进行查询和管理，具有标准化和通用性数据备份和恢复支持数据备份和恢复功能，保证数据的可靠性和可恢复性成熟和稳定历史悠久、经过长期发展和完善，被广泛应用于各种领域NoSQL数据库的特点和优势特点优势高扩展性支持横向扩展，通过增加更多的机器来提高存储容量与处理能力高可用性与容错性通过复制机制确保数据的高可用性和容错能力灵活的模式不需要严格的表结构，可以使用更为灵活的数据模型高性能在处理大规模数据和高并发请求时表现出较高的性能简化查询语言往往不使用SQL标准查询语言，而是使用更为简化或自定义的查询方式支持多种数据模型支持键值对、文档、列族和图形数据库等多种数据模型，适应不同类型的数据存储需求高可用性许多NoSQL数据库通过复制模型实现高可用架构易扩展性去掉了关系数据库的关系型特性，数据之间无关系，使得它们非常容易扩展高性能在大数据量下表现出色，得益于其无关系性和简单的数据库结构灵活的数据模型无需事先为要存储的数据建立字段，可以随时存储自定义的数据格式关系型数据库和NoSQL数据库的对比对比维度关系型数据库NoSQL数据库数据模型表格形式，支持复杂的关系模型键值对、文档、列族、图形等多种模型可扩展性主要通过纵向扩展，水平扩展存在局限性支持水平扩展，能够在多台服务器上分布数据性能适合复杂查询和事务处理，但在大规模数据和高并发读写时性能受限在处理大量数据和高并发读写操作时性能更高使用场景适用于需要强一致性和复杂事务处理的场景，如金融交易、库存管理等适用于需要处理大量非结构化数据、高并发读写、实时数据分析和大规模数据存储的场景，如社交网络、物联网、大数据分析等事务支持支持ACID事务，确保数据的一致性和完整性部分支持事务，通常提供最终一致性模型查询语言使用标准化的SQL语言进行数据查询和管理根据数据模型不同，支持多种查询语言如XPath、JavaScript等数据一致性强调数据完整性和一致性，通过主键和外键等约束保证数据关系和准确性更加注重可用性和分布式存储，允许一定程度的数据冗余扩展性垂直扩展存在物理限制，难以实现大规模扩展水平扩展使得能够处理大规模数据和高并发访问适用场景适用于需要结构严谨、数据完整性要求高的应用场景，如金融、医疗等行业适用于需要高可用性、高性能和灵活性的应用，如大数据处理、实时分析等结论关系型数据库和NoSQL数据库各有优势，适用于不同的场景。在实际应用中，很多系统会同时使用关系型数据库和NoSQL数据库，以发挥各自的优势，满足不同的业务需求。例如，对于需要处理大量非结构化数据、高并发读写、实时数据分析和大规模数据存储的场景，如社交网络、物联网、大数据分析等，NoSQL数据库能够提供更好的性能和可扩展性。而对于需要强一致性和复杂事务处理的场景，如金融交易、库存管理等，关系型数据库则更为合适。

Jack20 发表于2024-12-19 11:44:34 2024-12-19 11:44:34 最后回复泽宇-Li 2025-03-27 23:02:47
34 5

云存储数据库
CHAR和VARCHAR的区别

CHAR和VARCHAR是MySQL中两种用于存储字符串的数据类型，它们在存储方式、性能表现和应用场景上有显著区别。以下是两者的详细对比：特性CHARVARCHAR存储方式固定长度，不足则用空格补齐可变长度，只占用实际字符串长度存储空间固定长度，可能浪费空间可变长度，节省空间性能读写操作快，适合固定长度数据读写操作相对较慢，适合可变长度数据最大长度255个字符65535个字节适用场景国家代码、性别等固定长度数据用户名、地址等可变长度数据检索效率高，因为数据位置固定略低，因为需要处理长度信息存储空间固定长度，可能浪费空间可变长度，节省空间填充自动填充空格至指定长度不填充，存储实际长度去除空格查询时自动去除尾部空格不会自动去除尾部空格存储机制固定长度，占用指定长度空间可变长度，占用实际长度加1-2字节性能对比存储空间固定，读写快存储空间可变，读写慢实际应用场景存储固定长度的数据存储可变长度的数据空值处理允许空值，空格填充允许空值，不填充比较和排序根据字符集区分大小写比较同样区分大小写比较从上表可以看出，CHAR和VARCHAR各有优劣，具体使用哪种类型应根据实际应用场景来决定：CHAR：适合存储固定长度的数据，如国家代码、性别等。由于其固定长度的特性，CHAR在读写操作上通常比VARCHAR快，尤其是在处理固定长度的数据时。然而，CHAR可能会浪费存储空间，因为它总是占用指定长度的空间，即使实际存储的字符串长度小于指定长度。VARCHAR：适合存储可变长度的数据，如用户名、地址等。VARCHAR只占用实际字符串长度所需的空间，因此在存储空间上比CHAR更高效，尤其是在数据长度变化较大的情况下。但是，由于需要额外的字节来存储字符串长度信息，VARCHAR的读写操作可能会比CHAR稍慢。在选择CHAR或VARCHAR时，应考虑以下因素：数据长度的一致性：如果数据长度基本一致或对存储空间不敏感，且需要较高的检索效率，可以选择CHAR。存储空间的节省：当字段的值长度变化较大，或者需要节省存储空间，特别是当字符串经常变化长度时，VARCHAR是更好的选择。性能需求：在对性能要求较高的场景下，如高频查询或需要快速访问的数据表中，如果字段长度固定，可以选择使用CHAR。而在存储空间敏感的场景中，特别是数据量巨大且字符串长度不均的情况下，VARCHAR可以显著减少存储开销。

Jack20 发表于2024-12-19 11:38:46 2024-12-19 11:38:46 最后回复 Jack20 0
6 0

云存储
在不使用多表的JOIN时一些数据库关联查询的方法

在不使用多表的JOIN操作时，仍然可以通过其他方法来实现关联查询。以下是一些常用的替代方法：1. 子查询（Subquery）子查询是在一个查询语句中嵌套另一个查询语句。子查询可以放在SELECT、FROM或WHERE子句中，用于从一个表中获取数据，然后在外部查询中使用这些数据。例如：SELECT * FROM orders WHERE customer_id IN (SELECT id FROM customers WHERE country = 'CN');这个查询会先在customers表中找到所有来自美国的客户的id，然后在orders表中查找这些客户的所有订单。2. 内联视图（Inline View）内联视图是将一个查询作为另一个查询的FROM子句的一部分。这可以看作是一种特殊的子查询，但通常性能更好，因为数据库优化器可以更有效地处理内联视图。例如：SELECT * FROM (SELECT id, name FROM customers WHERE country = 'CN') AS us_customers;这个查询会创建一个内联视图，只包含来自美国的客户的id和name，然后从这个内联视图中选择所有数据。3. 自连接（Self Join）自连接是一种特殊的JOIN，用于在同一表中进行关联查询。这通常用于表中的记录需要与表中的其他记录进行比较的场景。例如：SELECT e1.name, e2.name FROM employees e1 JOIN employees e2 ON e1.manager_id = e2.id;这个查询会将employees表与自身进行连接，找到每个员工的经理的名字。4. 分解关联查询即对每个要关联的表进行单表查询，然后将结果在应用程序中进行关联。例如：SELECT * FROM tag WHERE tag = 'mysql';SELECT * FROM tag_post WHERE tag_id = 1234;SELECT * FROM post WHERE post.id in (123,456,567,9098,8904);这种方法的问题是，如果in后面的参数过多，通用性会非常有限。5. 打破范式标准建议建表的时候，就把这些列放在一个表里，比如一开始有student(id, name)，class(id, description)，student_class(student_id, class_id)三张表，可以用一张大表代替它，student_class_full(student_id, class_id, name, description)，这样name和description可能要被存储多份，但是由于不需要join了，查询的性能就可以提高很多了。6. 具体问题具体分析即使多表Join在阿里规范是强制不允许的，但比如在管理后台这类并发量很低的业务场景下，依然是可以进行多表Join操作的。多表Join并不一定是很Low的做法，在错误场景下多表Join才是很Low的做法。以上方法各有优缺点，选择哪种方法应根据具体的应用场景、数据量和数据库性能来决定。在大多数情况下，适当的JOIN操作，结合良好的索引策略和查询优化，仍然是处理关联数据的首选方法。

Jack20 发表于2024-12-19 11:33:37 2024-12-19 11:33:37 最后回复 Jack20 0
9 0

云存储数据库
mysql中select* 会用到事务吗

在MySQL中，SELECT *语句本身并不会自动开启事务。事务通常用于一组操作的集合，这些操作要么全部成功执行，要么全部回滚，以确保数据的一致性和完整性。SELECT *语句通常用于查询数据，它不会修改数据，因此在大多数情况下，它不需要事务的支持。事务的概念和用途事务是一组操作的集合，这些操作被视为一个不可分割的工作单元。事务的主要目的是确保数据库的一致性和完整性。在MySQL中，事务具有以下特性：原子性（Atomicity）：事务中的所有操作要么全部成功，要么全部失败。一致性（Consistency）：事务完成后，数据库必须处于一致状态。隔离性（Isolation）：事务的执行不受其他并发事务的影响。持久性（Durability）：一旦事务提交，其结果将永久保存。SELECT *语句的基本功能和执行过程SELECT *语句用于从数据库表中检索所有列的数据。它的执行过程通常包括以下步骤：客户端发送SELECT *请求到数据库服务器。服务器接收到请求后，解析查询语句。服务器执行查询操作，从存储引擎中检索数据。服务器将检索到的数据返回给客户端。事务在SELECT *操作中的应用场景虽然SELECT *本身不需要事务，但在某些情况下，事务可以用于确保查询操作的一致性。例如：可重复读（REPEATABLE READ）：在事务中执行SELECT *可以确保在事务期间，多次读取的数据是一致的，即使其他事务修改了数据。隔离级别：事务的隔离级别可以控制SELECT *操作的行为，例如，设置为SERIALIZABLE可以确保事务之间的完全隔离，避免并发问题。数据修改操作：当需要对数据库进行修改操作（如INSERT、UPDATE、DELETE）时，事务的使用就变得非常重要。事务可以确保这些操作的原子性、一致性、隔离性和持久性（ACID特性）。并发控制：事务还可以用于处理并发访问数据库时的隔离问题，例如脏读、不可重复读和幻读等问题。事务的隔离级别READ UNCOMMITTED：最低隔离级别，可以读取其他事务未提交的数据。READ COMMITTED：可以读取其他事务已提交的数据。REPEATABLE READ：事务在执行中反复读取数据，得到的结果是一致的，不会受其他事务影响。SERIALIZABLE：最高隔离级别，事务逐一执行，避免了并发问题，但性能较低。SELECT *查询本身并不需要事务，但在某些情况下，如果你希望在SELECT查询期间启动和提交事务，可以使用显式事务或隐式事务来实现。示例代码说明以下是一个示例，展示了如何在事务中使用SELECT *：-- 开始事务START TRANSACTION;-- 查询账户余额SELECT * FROM accounts WHERE account_id = 123;-- 其他操作...-- 提交事务COMMIT;在这个例子中，SELECT *语句用于查询账户余额，事务确保了在查询期间，账户余额不会被其他事务修改。综上所述，SELECT *语句本身不会用到事务，但在某些场景下，事务可以用于确保查询操作的一致性和隔离性。

Jack20 发表于2024-12-19 11:24:56 2024-12-19 11:24:56 最后回复加油O幸福 2024-12-27 15:08:18
15 2

云存储
函数工作流FunctionGraph的原理

什么是函数工作流FunctionGraph？函数工作流FunctionGraph是华为云提供的一项基于事件驱动的函数托管计算服务。其核心思想在于用户只需编写业务函数代码并设置运行条件，无需配置和管理底层服务器等基础设施，即可实现函数的弹性、免运维和高可靠性运行。基本组成和工作机制编写代码用户使用支持的语言（如Node.js、Python、Java等）编写业务代码。上传代码支持在线编辑、上传ZIP或JAR包，也可从对象存储服务OBS引用代码。触发执行通过RESTful API或云产品事件源触发函数执行，生成函数实例以实现业务功能。弹性执行函数在执行过程中根据请求量自动扩缩容，支持请求峰值，此过程由FunctionGraph自动管理。查看日志和监控无缝对接云日志服务和应用运维管理服务，用户可便捷查看函数运行日志和图形化监控信息。计费方式按函数实际执行次数和执行时间计费，不执行不产生费用。为何使用函数工作流部署Excalidraw？Excalidraw简介Excalidraw是一个开源的手绘风格白板工具，允许用户创建各种图表、流程图和思维导图，特别适合团队实时协作。部署原因详解快速部署和免运维FunctionGraph的无服务器特性使开发者无需关心底层基础设施的配置和管理，可以快速部署应用，并自动处理扩容和运维，大大节省时间和精力。事件驱动架构Excalidraw的交互性质（如用户操作和协作编辑）天然适配事件驱动模型。FunctionGraph可以根据用户操作触发相应函数执行，实现高效的响应机制。弹性伸缩FunctionGraph的弹性伸缩能力确保在用户访问高峰时段自动扩展资源，保障应用流畅运行，而在低峰期减少资源消耗，降低成本。成本效益按实际使用量计费的模式使得在初期或流量不稳定的情况下，相比传统服务器租赁有更高的性价比。高可靠性和安全性FunctionGraph提供高可靠的函数运行环境，并结合云安全措施，确保Excalidraw在多用户协作下的稳定性和数据安全。简化集成通过API网关服务（APIG）触发器，可以方便地将Excalidraw前端请求与后端函数处理逻辑关联起来，实现前后端分离，简化开发和维护。总结函数工作流FunctionGraph凭借其无服务器架构、事件驱动、弹性伸缩和高可靠性等特点，为部署Excalidraw提供了理想的技术解决方案。不仅大幅降低了部署和运维的复杂性，还提升了应用的响应速度和用户体验，使其成为高效、低成本的优选方案。

Jack20 发表于2024-12-19 11:11:58 2024-12-19 11:11:58 最后回复加油O幸福 2024-12-27 15:08:28
62 2

云存储
大规模集群中快速查询单表或单schema的脏页率实现

在大规模集群中，快速查询单表或单schema的脏页率可以通过以下几种方式实现：使用系统视图或函数查询指定schema的脏页率：SELECT * FROM pgxc_get_stat_dirty_tables(30,100000,'mppedw');这个查询会返回指定schema中脏页率大于30%且脏数据行数大于100000的表的相关信息。查询指定表的脏页率：SELECT c.oid AS relid, n.nspname AS schemaname, c.relname, pg_stat_get_tuples_inserted(c.oid) AS n_tup_ins, pg_stat_get_tuples_updated(c.oid) AS n_tup_upd, pg_stat_get_tuples_deleted(c.oid) AS n_tup_del, pg_stat_get_live_tuples(c.oid) AS n_live_tup, pg_stat_get_dead_tuples(c.oid) AS n_dead_tup, cast( (n_dead_tup / (n_live_tup + n_dead_tup + 0.0001) * 100) AS numeric(5,2)) AS dirty_page_rateFROM pg_class cLEFT JOIN pg_namespace n ON n.oid = c.relnamespaceWHERE c.oid = (SELECT 'pg_catalog.pg_attribute'::regclass::oid);这个查询会返回指定表的脏页率以及其他相关的统计信息。使用特定于数据库的工具或命令GaussDB(DWS)：可以使用pgxc_stat_single_table(schema, table_name)函数来查询单表在全库中的统计信息及该表在每个DN上的脏页率。这个函数仅在8.1.3及以上集群版本支持，并且依赖于ANALYZE，为获取最准确的信息请先对表进行ANALYZE。注意事项脏页率查询可能会对系统性能产生一定影响，建议在业务低峰期执行。对于大规模集群，建议使用分布式查询工具或系统视图来获取脏页率信息，以减少对单个节点的压力。脏页率的预警值可以根据实际情况进行调整，例如，如果脏页率长期超过30%，可能需要对表进行VACUUM FULL操作来回收空间。以上信息基于搜索结果中的最新数据，希望对你有所帮助。

Jack20 发表于2024-12-19 11:06:35 2024-12-19 11:06:35 最后回复加油O幸福 2024-12-27 15:08:37
22 2

云存储
[问题求助] 如何部署mongodb？？？

mongdb是啥？咋部署啊？？？？？

yd_219475889 发表于2024-12-13 19:02:31 2024-12-13 19:02:31 最后回复赫塔穆勒 2024-12-29 13:25:40
58 5

云存储

上滑加载中

推荐直播

0.25

基于开源鸿蒙+海思星闪开发板：嵌入式系统开发实战（Day1）
2025/03/29 周六 09:00-18:00

华为开发者布道师

本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用，涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容，旨在帮助学员全面掌握相关技术并进行实际操作
回顾中
华为云软件开发生产线（CodeArts）1月&2月新特性解读
2025/03/18 周二 19:00-20:00

阿星华为云高级产品经理

不知道产品的最新特性？没法和产品团队建立直接的沟通？本期直播产品经理将为您解读华为云软件开发生产线1月&2月发布的新特性，并在直播过程中为您答疑解惑。
回顾中
基于能力图谱的openGauss项目闯关
2025/03/20 周四 19:00-20:30

华为开发者布道师

想成为顶级数据库开发者吗？本次直播将从银行业务系统的数据库设计出发，带你逐步掌握openGauss的建库表、数据封装、密态技术、性能调优及AI应用。通过实战案例，全面展示openGauss的强大功能，助你提升技能，为未来的职业发展打下坚实基础。立即报名，开启你的数据库进阶之旅！
回顾中
基于开源鸿蒙+海思星闪开发板：嵌入式系统开发实战（Day1）
2025/03/29 周六 09:00-18:00

华为开发者布道师

本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用，涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容，旨在帮助学员全面掌握相关技术并进行实际操作
回顾中
华为云软件开发生产线（CodeArts）1月&2月新特性解读
2025/03/18 周二 19:00-20:00

阿星华为云高级产品经理

不知道产品的最新特性？没法和产品团队建立直接的沟通？本期直播产品经理将为您解读华为云软件开发生产线1月&2月发布的新特性，并在直播过程中为您答疑解惑。
回顾中

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript

开发者空间

了解空间

工作台

开发工具

实战案例

空间活动

空间论坛

开发平台

软件开发生产线 CodeArts

AI平台ModelArts

数据治理中心 DataArts Studio

数字内容生产线 MetaStudio

精选服务

云数据库 GaussDB

云数据库 RDS for MySQL

MapReduce服务 MRS

数据仓库服务 DWS

分布式缓存服务Redis版

分布式消息服务 DMS

华为云实时音视频 SparkRTC

媒体处理 MPC

主机迁移服务 SMS

对象存储迁移服务 OMS

云消息服务 KooMessage

云手机服务 KooPhone

企业搜索服务 KooSearch

云地图服务 KooMap

更多开放能力

开发工具

API生态

CodeArts API

API Explorer

Terraform Explorer

KooCLI

API 中心

SDK 中心

开发服务

Codelabs

DevStar

低代码平台Astro

CodeArts IDE

Huawei Cloud Toolkit

Classroom

开发资源

开源镜像站

开源资源

开发语言

开发实践

入门精选

分发资源

企业应用中心

企业通用专区

教育专区

华为应用专区

政务云专区

硬件云服务商城

医疗健康专区

跳蚤市场

华为云开发者日

直播专区

开发者精品活动

DTSE Tech Talk

加入HCDE

加入HCDG

加入HCSD

加入HCWD

鲁班会

沃土云创计划·企业

沃土云创计划·高校

沃土云创计划·个人

沃土云创计划·开源共创

博客

论坛

专题

开发者榜单

学习路径

在线课程

动手实验

考试认证

培训服务