云数据迁移 CDM_标签_开发者

博客(96)
视频(0)
论坛(0)
云声(29)
代码示例(0)

[技术干货] 云数据库怎么用？从注册到部署的完整实操教程（2026新手进阶版）

在数字化业务部署中，云数据库凭借弹性扩容、低成本运维、高可用性的优势，成为个人开发者和中小企业的首选数据存储方案。但很多新手会陷入“注册容易，部署难”的困境：不知道如何选择适配的数据库引擎、不会配置安全组、迁移数据时出现丢失风险……本文结合百度SEO核心规则，从注册、选型、配置、部署到运维，给出一套零门槛的完整实操指南，帮你避开90%的坑。一、前期准备：明确需求，避免盲目选型在注册云数据库前，先明确自身业务需求，这是后续所有操作的核心前提，也是避免资源浪费的关键。1. 业务类型与数据结构- 若为个人博客、电商网站等结构化数据场景，优先选择关系型云数据库（如MySQL、PostgreSQL），支持SQL查询和事务一致性。- 若为物联网、短视频平台等非结构化/半结构化数据场景，选择非关系型云数据库（如MongoDB、Redis），适合海量数据的高并发读写。2. 性能需求评估- 预估并发量：个人站点并发量低，选择基础版即可；企业级高并发场景，需选择集群版并配置读写分离。- 计算存储容量：按业务数据增长趋势预留30%以上的存储空间，避免频繁扩容影响业务。3. 地域与网络选择- 优先选择靠近业务用户的地域节点，降低数据传输延迟；跨境业务可选择多地域部署，提升全球访问速度。- 确认网络类型：若与云服务器搭配使用，选择内网连接，稳定性更高且不占用公网带宽。二、核心步骤：云数据库从注册到部署的实操指南步骤1：云数据库平台注册与开通1. 进入云服务平台，完成实名认证（个人用户需提供身份信息，企业用户需上传营业执照），这是使用云数据库的必要前提。2. 找到云数据库产品入口，选择“立即开通”，进入产品列表页。注意：部分平台提供免费试用版，新手可先试用，熟悉操作流程后再升级付费版。3. 开通后进入云数据库控制台，这是后续配置、管理的核心操作界面。步骤2：实例创建与参数配置（核心痛点解决）实例创建是最容易出错的环节，以下参数直接影响数据库性能和安全性：1. 选择数据库引擎与版本- 关系型数据库：MySQL 8.0兼容性强，适合大多数场景；PostgreSQL对复杂查询支持更好，适合数据分析业务。- 非关系型数据库：Redis适合缓存场景；MongoDB适合文档型数据存储。- 版本选择原则：优先选择稳定版，避免最新测试版的兼容性问题。2. 配置实例规格- 计算规格：按CPU和内存配比选择，如1核2G适合个人场景，4核8G满足中小企业常规需求。- 存储类型：SSD云盘读写速度快，适合高IO场景；普通云盘成本低，适合低频访问数据。- 付费模式：短期测试选按量付费，长期稳定业务选包年包月，性价比更高。3. 设置关键参数- 端口号：默认端口（如MySQL 3306）可修改，降低被恶意扫描的风险。- 字符集：关系型数据库建议选择UTF-8mb4，支持emoji表情和特殊字符，避免数据插入失败。- 时区配置：设置与业务服务器一致的时区，防止时间戳数据混乱。步骤3：安全组与访问权限配置（避坑重点）很多新手部署后无法连接数据库，80%的原因是安全组未正确配置：1. 安全组规则设置- 入方向规则：仅开放必要的端口（如3306），并限制访问来源IP——个人测试可暂时开放公网IP，生产环境必须改为业务服务器的内网IP，禁止所有公网访问。- 出方向规则：默认允许所有，无需额外修改。2. 账号与权限管理- 避免使用默认root账号，创建专属业务账号，并分配最小权限（如仅授予SELECT、INSERT权限，禁止DROP、ALTER等高风险操作）。- 开启密码复杂度校验：设置8位以上包含大小写字母、数字、特殊符号的密码，定期更换。步骤4：数据库连接与数据部署配置完成后，通过两种方式连接云数据库并部署业务数据：1. 本地客户端连接（适合新手测试）- 下载数据库管理工具（如Navicat、DBeaver），输入云数据库的公网地址、端口、账号、密码，测试连接。- 连接成功后，可直接创建数据表、导入本地SQL文件，完成数据初始化。2. 业务服务器连接（生产环境推荐） - 若业务部署在云服务器上，优先使用内网地址连接，代码示例（以MySQL为例）：host: '云数据库内网地址', port: 3306, user: '业务账号', password: '账号密码', database: '数据库名称'- 连接后，通过业务代码自动创建表结构，或使用数据迁移工具导入历史数据。3. 数据迁移注意事项- 迁移前全量备份本地数据，避免迁移过程中数据丢失。- 大数量迁移建议选择离线迁移（如上传SQL文件到云存储，再导入云数据库），减少网络波动影响。三、后期运维：保障云数据库稳定运行的核心技巧部署完成不代表结束，科学的运维能延长数据库寿命，降低故障风险：1. 自动备份策略配置- 开启每日自动备份，备份时间选择业务低峰期（如凌晨1-3点）；保留7-15天的备份记录，支持数据回溯。- 定期进行备份恢复测试，确保备份文件可用，避免真正需要时无法恢复。2. 性能监控与优化- 开启控制台的性能监控功能，重点关注CPU使用率、内存占用、磁盘IO、并发连接数，超过阈值及时告警。- 优化SQL语句：避免全表扫描、合理创建索引，降低数据库负载；高并发场景配置读写分离，将查询请求分流到只读节点。3. 安全防护升级- 定期更新数据库版本，修复已知漏洞；开启审计日志，记录所有访问和操作行为，便于追溯安全事件。- 避免直接暴露公网地址：通过云服务器做中间层代理，或使用软件连接数据库，提升数据安全性。四、常见痛点解决：新手必看的避坑指南1. 连接超时：检查安全组是否开放对应端口、数据库实例是否处于运行状态、网络是否互通。2. 数据插入失败：排查字符集是否支持特殊字符、字段长度是否足够、主键是否重复。3. 性能卡顿：查看是否有慢查询SQL、是否需要扩容实例规格、是否开启了不必要的服务。4. 数据丢失：立即使用最近的备份文件恢复，同时检查备份策略是否合理，是否开启了事务日志。五、总结云数据库的使用流程，核心是“需求先行-精准选型-规范配置-科学运维”。从注册到部署，每一步都需要结合业务场景，避开盲目操作的误区。对于新手来说，先通过免费版熟悉流程，再根据业务增长逐步升级配置，是性价比最高的选择。按照本文的步骤操作，即使是零基础的开发者，也能快速完成云数据库的部署和运维，让数据存储更稳定、更高效。

yd_221426427 发表于2026-01-15 10:25:36 2026-01-15 10:25:36 最后回复 yd_221426427 0
19 0

云数据库 RDS for MariaDB 云数据库 GaussDB 云数据库 TaurusDB 云数据迁移 CDM 云数据库 GaussDB(for Mongo)
[技术干货] 【实战宝典】跨云平台数据迁移：云数据迁移工具推荐对比+架构设计+避坑指南

随着云计算进入多云时代，企业逐渐采用混合云或多云架构以提升灵活性、降低供应商依赖风险并优化成本。然而，这一趋势也带来了新的挑战——跨云平台的数据迁移。无论是将本地数据中心迁移至公有云、私有云，还是在不同公有云之间迁移，数据作为核心资产，其迁移过程直接影响业务连续性、数据完整性和安全性。本文将从技术视角出发，结合实战经验，解析跨云数据迁移的关键要素：工具选型、架构设计与避坑策略，助您构建高效、安全的迁移方案。一、云数据迁移工具对比：如何选择最适合的工具？在跨云迁移中，工具的选择决定了迁移的效率与质量。以下是几类主流工具的对比分析，供参考：选型建议：小规模测试：优先选择轻量化工具快速验证可行性；大规模生产环境：采用组合方案（如数据库专用工具+对象存储工具）；实时同步需求：选择支持CDC技术的工具，并提前测试冲突解决机制。二、架构设计：跨云迁移的核心逻辑与关键步骤成功的跨云迁移离不开科学的架构设计。以下是分阶段实施的关键步骤： 1. 评估与规划阶段数据普查：绘制数据拓扑图，标注所有数据源（数据库、文件服务器、SaaS应用）、数据量及增长趋势；业务影响分析：明确关键业务的RTO（恢复时间目标）和RPO（恢复点目标），例如电商大促期间需保证毫秒级延迟；迁移策略制定：根据数据敏感性和实时性要求，选择“停机窗口冷迁移”“增量同步热迁移”或“双写模式”。2. 高可用性设计冗余链路：在源端和目标端部署代理节点，避免单点故障；数据校验机制：迁移前后计算文件哈希值（MD5/SHA-256）、数据库记录数比对；回滚方案：保留源端快照，并在目标端预置回滚脚本，确保紧急情况下可快速回退。3. 混合云管理架构统一监控平面：通过Prometheus/Grafana等工具监控跨云数据传输速度、错误率、资源占用；权限隔离：基于RBAC模型限制操作员权限，避免越权访问敏感数据；日志审计：记录所有迁移操作日志，满足合规性要求（如GDPR、HIPAA）。4. 性能优化策略压缩算法：使用LZ4、Zstandard等无损压缩算法减少网络传输量；并发控制：根据带宽动态调整线程数，避免拥塞；缓存机制：对频繁访问的数据块进行本地缓存，加速重复传输。三、避坑指南：跨云迁移的常见陷阱与解决方案即使拥有最佳工具和架构，仍需警惕以下潜在风险：四、实战案例：某电商平台的跨云迁移实践背景：某电商平台因业务扩张需将部分业务从A云迁移至B云，涉及MySQL数据库（5TB）、Redis缓存（1TB）和OSS文件存储（500TB）。实施步骤：评估阶段：通过工具扫描发现大量历史订单表存在外键约束，直接迁移可能导致锁表；方案设计：采用“数据库专用工具+对象存储工具”组合，对订单表进行分片迁移，并启用CDC实时同步；测试验证：在沙箱环境中模拟大促流量，发现Redis集群因跨云延迟导致响应变慢，遂调整为本地缓存+异步同步；正式迁移：选择业务低峰期（凌晨2-4点），分三批次完成迁移，全程耗时6小时，停机时间控制在30分钟内；优化迭代：迁移后通过监控发现B云的磁盘IOPS不足，扩容后性能提升40%。五、结语：工具+架构+经验=成功迁移跨云数据迁移是一项系统工程，工具的选择仅是起点，科学的架构设计和丰富的实战经验才是成功的关键。建议企业在迁移前组建跨部门团队（IT、业务、法务），制定详细的《迁移应急预案》，并预留足够的缓冲时间应对突发状况。未来，随着AI驱动的智能迁移助手兴起，自动化程度将进一步提升，但人类专家对业务逻辑的理解始终是保障迁移质量的核心要素。希望本文能为您的跨云迁移之路提供实用参考！

yd_221426427 发表于2025-08-05 09:38:14 2025-08-05 09:38:14 最后回复 yd_221426427 0
17 0

数据迁移云数据迁移 CDM 云计算
[问题求助] Java事务中操作高斯数据库sql报错导致try...catch捕获失败

我们Java中有个方法，里面是两个操作，一个写入业务数据，另一个是其他写操作（更新或新增），第二个写入操作是有try catch进行捕获的，并且没有抛出异常只是输出了日志，程序执行时发现第一个写入业务数据正常，第二个写入操作报了sql错误，程序能执行完并正常返回，原来使用oracle的时候第一个写入都成功了，但是现在用GaussDB后发下第一个业务也没有写入成功，达蒙数据库第一个业务也是写入成功的，换到高斯数据库后虽然第二个业务捕获了异常也没有抛异常，但是还是影响第一个写操作业务

yd_211740480 发表于2025-03-20 10:25:52 2025-03-20 10:25:52 最后回复 Idea 2025-03-27 18:42:03
136 13

云数据库 GaussDB 云数据迁移 CDM
[互动交流] HCCDE – Big Data 这个认证为什么专家级不能报名呢

HCCDE – Big Data 这个认证为什么专家级不能报名呢

yd_229608299 发表于2024-04-09 09:41:33 2024-04-09 09:41:33 最后回复多米诺的古牌 2024-04-24 15:07:44
207 6

数据治理中心 DataArts Studio 湖仓构建 LakeFormation 云数据迁移 CDM
[问题求助] 茅台酒库一体化环境迁移报错

茅台酒库AP1环境中的HiCampus__SecurityWorkbenchBase应用，打包安装在ulab环境后，报错。安装高级页面时出错: 导入'高级页面'请求失败，错误码为'3004'，错误信息为'页面引用的插件资产不存在，资产插件标识：global_SCResafety3DAdapter。'但项目中是有这个资产插件。AP1环境：

诸葛建国 发表于2023-12-04 10:44:54 2023-12-04 10:44:54 最后回复智慧园区专家三 2023-12-08 09:43:18
110 2

云数据迁移 CDM
[问题求助] 查询表时候报：查看表数据时出错。

查询表时候报：查看表数据时出错。单击“详细信息”了解详情。 [SQLErrorCode : 6636]ERROR: pooler: failed to create 2 connections, Error Message: remote node dn_6003_6004, detail: GSSAPI continuation error, more than 10 times, remote datanode dn_6003_6004, errno: Success各位大佬,求助!!!感谢!!!!

yd_247011125 发表于2023-07-13 18:16:14 2023-07-13 18:16:14 最后回复赫塔穆勒 2023-07-31 11:25:26
70 3

云数据库 GaussDB 云数据迁移 CDM 数据接入服务 DIS
[技术干货] 镜像迁移

问题：zhxx-app.vmdk和zhxx-db.vmdk是否都能导入华为云镜像的方式部署？问题2：对于Vmware镜像文件.vmdk部署为华为云的弹性云服务器ECS，其流程主要步骤有哪些？回答：1、华为云支持导入vhd、vmdk、qcow2、raw、vhdx、qcow、vdi、qed、zvhd或zvhd2格式镜像文件。2、使用公有云镜像服务，步骤如下：准备符合平台要求的外部镜像文件。上传外部镜像文件到OBS个人桶中。通过管理控制台选择上传的镜像文件，并将镜像文件注册为私有镜像。私有镜像注册成功后，使用该镜像创建新的云服务器。

BenMessi 发表于2023-03-08 13:39:59 2023-03-08 13:39:59 最后回复 BenMessi 2023-03-08 13:39:59
80 0

对象存储迁移服务 OMS 云数据迁移 CDM
java代码迁移实验

就挺麻的，第一步死活报错。找不到文件。

yd_259315403 发表于2022-11-10 11:59:20 2022-11-10 11:59:20 最后回复 yd_259315403 2022-11-10 11:59:20
69 0

主机迁移服务 SMS 数据复制服务 DRS 对象存储迁移服务 OMS 云数据迁移 CDM
[教程] 使用CDM搬迁关系型数据库类作业报错Read timed out的排查流程

关系型数据库类作业搬迁报错Read timed out的排查说明问题背景在进行关系型数据库的搬迁时，经常会出现Read timed out异常，该类问题一般是在设定的超时时间内没有完成对应抽取或写入数据的SQL。下面以MySQL2DWS的单表迁移作业日志为示例，讲述如何简单并快速定位该类问题。定位流程找到导致作业失败的异常日志在作业日志中的位置，界面提示报错信息如下：作业日志异常位置关键信息如下：aa：表示出现异常的时间点为2022-05-18 09:57:18,049bb：表示出现异常的线程名称为LocalJobRunner Map Task #51 cc：表示导致异常产生的原因为The last packet successfully received from the server was 300,100 milliseconds ago. The last packet sent successfully to the server was 300,100 milliseconds ago.dd：异常堆栈中出现该方法表示是在抽取线程中出现的异常：org.apache.sqoop.connector.jdbc.GenericJdbcExtractor.extractee：表示导致该异常的根因是Read timed out由以上关键信息，即可分析出现异常的原因是cdm在抽取数据过程中出现了超时，超时时间是300100ms（5min）左右，cdm作为客户端抽取源端数据，由于源端数据超过5min没有返回（也可以说是某个数据包），导致超时异常产生；进一步确认是那个动作执行出现了超时，按照抽取线程名LocalJobRunner Map Task #51向上搜索作业日志，寻找上一次该线程的时间点，因为cdm对应该抽取线程名的laoder线程名为LocalJobRunner Map Task #51 #laoder，所以一般按照LocalJobRunner Map Task #51 [ 来搜索；由以上日志可以看出是cdm提交的查询语句（SELECT * FROM xxxx WHERE xxxx）在数据源端超过了5min（从2022-05-18 09:52:17到2022-05-18 09:57:18,049）问题根因对应的SQL执行时间超过了CDM设置的默认超时时间，读写数据的默认超时时间是5min，获取连接的默认超时时间是1min；解决措施配置对应连接的相关超时参数。关于关系型数据库的该类超时问题，排查思路如下：先要确认是抽取源端超时还是写入目的端超时；再确认当前生效的超时时间；最后在连接管理中找到对应的连接，配置高级属性，对于MySQL、SqlServer、DWS等关系型数据库读写超时参数为socketTimeout，连接超时参数为connectTimeout，对于oracle数据库，读写超时参数为jdbc.ReadTimeout，连接超时参数为oracle.net.CONNECT_TIMEOUT，单位均为ms。上面讲述了出现了超时的基本解决措施，另外还可以从如下几个方面考虑：数据大表，考虑用where条件拆分成多个子作业，where条件中的字段最好是主键或者索引字段；避免数据源在同一时间大批量执行业务，尽量错峰运行业务（数据源端业务压力大时，相关sql会执行缓慢）；cdm 作业的抽取并发数和抽取并发字段设置合理，抽取并发字段一般建议设置成主键，其次是设置成数据分布均匀的带有索引的字段；

DGC_1号搬砖人 发表于2022-06-25 17:14:51 2022-06-25 17:14:51 最后回复 DGC_1号搬砖人 2022-06-25 17:14:51
349 0

云数据迁移 CDM
[互动交流] 单表迁移作业报错Timestamp format must be yyyy-mm-dd hh:mm:ss[.fffffffff]

【功能模块】HIVE2MySQL 单表迁移作业报错，日志提示“java.lang.IllegalArgumentException: Timestamp format must be yyyy-mm-dd hh:mm:ss[.ffffffffff]”【操作步骤&问题现象】【截图信息】【日志信息】（可选，上传日志内容或者附件）

DGC_1号搬砖人 发表于2022-06-25 16:48:01 2022-06-25 16:48:01 最后回复黄生 2022-06-29 21:47:07
466 2

云数据迁移 CDM
[互动交流] 【CDM】抽取HBASE表数据报错”HBASE_CONNECTOR_1104:Failed to open tablble.

【功能模块】【操作步骤&问题现象】抽取HBASE表数据作业失败，作业日志报错”HBASE_CONNECTOR_1104:Failed to open table. Cause : callTimeout=6000…”【截图信息】【日志信息】（可选，上传日志内容或者附件）

DGC_1号搬砖人 发表于2022-06-25 16:10:59 2022-06-25 16:10:59 最后回复黄生 2022-06-25 16:43:37
282 2

云数据迁移 CDM
[互动交流] 【CDM】【单表迁移】DWS自动建表报错“column name “tid” conflicts with a system

【功能模块】mysql2dws 单表迁移，自动建表【操作步骤&问题现象】作业运行失败【截图信息】【日志信息】（可选，上传日志内容或者附件）

DGC_1号搬砖人 发表于2022-06-25 15:57:27 2022-06-25 15:57:27 最后回复运气男孩 2022-06-30 16:11:35
642 3

云数据迁移 CDM
[其他] CDM作业配置界面选择模式或表空间/表名选项，列表显示为空也没有任何报错提示

作业配置界面选择模式或表空间/表名选项，列表显示为空也没有任何报错提示建议按照如下排查方式排查：检查对应连接的连通性是否正常；检查对应连接所使用的用户权限配置是否满足，权限参考https://support.huaweicloud.com/productdesc-cdm/cdm_01_0008.html ；对于关系型数据库类，可以尝试在对应连接的高级属性中，配置或去掉引用符号尝试；对于关系型数据库类，检查驱动版本是否是正确匹配，更换驱动尝试；

DGC_1号搬砖人 发表于2022-06-25 15:50:32 2022-06-25 15:50:32 最后回复 DGC_1号搬砖人 2022-06-25 15:50:32
281 0

云数据迁移 CDM
[迁移系列] CDM迁移阿里云ADB到华为云DWS

1. 阿里云ADB导入数据到DWS前提配置点（1） CDM绑定的公网IP的带宽不能太低，建议为按需购买的300M/S；（2）阿里云ADB端的一个查询的连接时长默认为30min，若导数时长长于此值，会报错（Query exceeded maximum time limit of 1800000.00ms）进行设置：SET adb_config QUERY_TIMEOUT=XXXX;（阿里云这个全局生效）（3） DWS目标端为列存表时，delta不要开启；DWS目标端最好提前建好表，是分区表的话注意分区范围1.1 创建阿里云连接1.2 创建DWS连接1.3 作业配置1.4 CDM配置管理

木易東 发表于2022-06-24 20:03:30 2022-06-24 20:03:30 最后回复 QGS 2022-07-04 19:38:20
499 2

云数据仓库 GaussDB(DWS) 云数据迁移 CDM
[交流吐槽] 总结出这套数据库迁移经验，我花了20年……

作者：白鳝 2022-06-09 10:23:06数据库迁移是DBA经常会面临的工作，这二十多年来，我们也做过很多数据库迁移的工作。早期的时候，作为一个DBA，考虑迁移方案的时候总是从数据库的角度去考虑。随着项目做多了，知识范围不断地扩大，加入了很多系统级的迁移方案，使迁移工作变得更加简单了。迁移工作做多了，也难免会遇到鬼，在这二十多年，上百个迁移项目中，也确实遇到过不少坑，有时候甚至面对命悬一线的绝境。到了后来，面对迁移方案的选择，如果是十分重要的核心系统，一定要选择最为稳妥的方案，以备不测。昨天微信群里有人在问一个数据库想迁移存储，有没有什么好方案，从我脑子里冒出来的都是系统层面的迁移方案，而群里的DBA朋友往往都说的是数据库层面的迁移技术。实际上没有最好的技术和方案，只有最合适的。具体选择哪种数据库迁移方案，最终还是要看具体的系统环境以及迁移实施队伍的技术能力。一、存储复制存储复制是最近我比较喜欢的一种数据库跨存储迁移的方法，可以用于很多迁移需求。特别是一个环境中存在多种数据库/多个数据库的场景，用存储复制的方式一下子可以搞定所有的数据库，十分便捷。存储复制的主要实施工作都由存储厂商完成，对于DBA来说也是最为轻松的，如果出问题，都不需要DBA去甩锅，肯定是存储厂商的问题。DBA要做的就是打开数据库，用rman validate校验一下数据文件是否存在物理/逻辑坏块就可以了。十年前一个金融客户的核心数据库数据库从9i HA升级为10g RAC,存储从IBM 8000系列迁移到HDS高端存储，采用的就是这个方案。使用HDS自带的异构存储虚拟化能力，首先将数据从IBM 8000系列存储复制到HDS上，最后切换的那一晚上停掉生产数据库，作最后一次增量复制后，用10g RAC的环境挂在新的卷，然后UPGRADE数据库，整个数据库迁移升级工作一个多小时就完成了。很多DBA会把卷复制和存储复制看作一码事，对于DBA来说，存储和卷并无不同，反正看到的是一堆裸设备。实际上二者还是不同的，卷复制采用的是卷管理软件的数据同步功能，比如VERITAS的LVM，卷管理软件天生就是支持异构平台的，因此使用卷复制技术同步数据有更广泛的适用性，而存储复制技术需要存储本身的支持（不过现在大多数高端存储都支持异构存储的存储虚拟化，因此大多数情况下都能支持，如果实在你的环境中的存储不支持异构复制，也可以考虑租借一台支持你所需要复制的存储的虚拟化机头来做实施，费用在几千块钱到几万块钱不等，看你租借的设备和租借的时间）。大概十年前吧，一个运营商从HP小机上迁移一个数据库到IBM小机，存储也从HP存储更换为EMC存储，当时他们原来的系统使用了VCS，因此使用VERITAS的卷复制做的数据迁移。在IBM端CONVERT数据库的时候（因为HP-UX和AIX都是大端的，所以可以做DATABASE CONVERT，而不需要使用XTTS）遇到了ORACLE 10G的一个BUG， UNDO表空间CONVERT失败，数据库无法打开，当时也是惊出一身冷汗，最后通过强制OFFLINE相关UNDO SEGMENT，重新创建UNDO表空间切换等方式解决了这个问题，不过完成迁移的时候已经接近早上8点，超出了申请的停机窗口，差点影响了第二天营业厅开门。所以说，再简单的迁移方案，都不能保证不出意外。二、逻辑复制逻辑复制是一种停机窗口较为紧张时候常用的数据库迁移的方案。两千零几年的时候帮助一个运营商把计费/账务两大核心系统从Oracle 8i迁移到Oracle 10g的时候，为了缩短停机窗口，使用ogg进行逻辑复制。那时候的OGG也是比较垃圾的，功能、性能都存在一定的问题，BUG也比较多。切换当晚发现有几张表总是追不上，最后决定直接通过dblink CTAS重建的方式迁移了。最后还好，在规定的时间窗口内完成了数据库的迁移和数据校验工作。使用OGG做迁移，数据校验的工作量十分大，如果是十分核心的系统，对数据一致性和完整性要求较高，一定要留足时间做数据校验。逻辑导出导入一直是被认为最为安全的迁移方式，不过天底下没有绝对安全的迁移方案。大概6/7年前，一个银行把核心系统从HDS存储迁移到华为18K上的时候，想把数据库也顺便从10g升级到11g，因为核心应用也要做升级，因此申请了36小时的业务停机窗口，其中核心系统完全停止业务18小时，这18小时中，给了数据库迁移8个小时的时间。通过综合考虑，他们决定采用最为稳妥的数据库逻辑导出导入的方式。首先在老存储上导出数据，然后把整个卷挂载到新的服务器上，再做导入。按理说够安全了吧，没想到主机工程师挂载这块盘的时候没注意给挂载成只读的了。DBA也没检查就开始导入了，几个小时后报无法写入磁盘数据，impdp异常退出了。这时候8小时的时间窗口已经使用了5个多小时了，如果重新导入一次，时间上肯定是不够的。当时我正好在现场，通过检查发现是impdp输出日志的时候无法写盘导致了错误，而刚开始的时候写入日志的时候是写在缓冲里并没有刷盘，所以没有报错，等刷盘的时候就报错了。通过校验数据表和索引发现所有的索引都已经完成创建了。因此报错时可能已经完成了主要的数据导入过程。最后经过会商决定暂时不回退整个工作，继续进行后续工作。不过因为这个插曲，原本计划的对所有表和索引做一次重新统计（通过SPA分析后发现11g对统计数据的依赖性更强，因此建议最后做一次表分析）就没有进行了。核心系统启动顺利完成，主要功能测试也顺利完成，大家揪着的心才放了下来。不过前台很快传来更坏的消息，应用开发商在测试性能的时候，认为主要核心交易的延时都慢了几十毫秒，平均核心交易延时从升级前的80毫秒提高到120毫秒以上，因此拒绝新系统上线。大家折腾了这么长时间还要回退，这对IT部门的打击十分严重的。因此CIO希望我们能够尽快找到问题，解决问题。通过分析存储的性能，数据库的总体性能没有发现什么问题。时间已经接近8小时的窗口了，按道理现在必须做回退了。我当时和CIO说，能不能再给我20分钟我再分析一下，如果找不到原因再回退。当时CIO说，我给你40分钟，如果不行只能我去向行长请罪了。最后在差不多半小时后，我终于定位了引起一部分核心交易延时增加的主要原因是几张表的统计数据过旧，更新了统计数据后，核心交易延时恢复到90毫秒左右，低于开发商要求的不高于120毫秒的要求。从这个案例上看，最简单靠谱的迁移方案，也不是万全的。三、ASM磁盘组加盘/删盘ASM磁盘组上加入新存储的磁盘，然后逐步删除老存储的磁盘，利用ASM的REBALANCE功能实现存储迁移也是一种挺不错的方案，只是REBALANCE时间比较长（如果数据量较大，业务负载较大），需要DBA随时关注整个进程，如果系统负载较高，IO吞吐量较大，那么在此期间可能会引起一些IO方面的性能问题。严重时可能导致应用系统总体性能严重下降，而一旦这些问题发生，我们只能暂时降低REBALANCE的优先级，缓解问题，无法彻底解决问题。因此对于特别核心的系统使用这种方式还是要十分注意。我把这个方法教给一家银行后，他们就喜欢上了这种迁移方式，并用这种方式迁移了大量的系统，总体上来说还是比较平稳的。不过在核心交易系统上，他们还是没敢使用。数据库迁移的方法有很多，今天时间的关系我就不一一举例了。不过无论采用何种方式，都需要实施者不要掉以轻心，对每个环节都做最精心的准备。不过有一定可以提醒大家的是，跳出DBA的思维方式，可能会找到更好的方法。

xxll 发表于2022-06-10 09:30:14 2022-06-10 09:30:14 最后回复多米诺的古牌 2022-07-12 22:14:47
650 2

数据迁移云数据迁移 CDM 数据库

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript