数据治理中心 DataArts Studio_标签_开发者

博客(147)
视频(0)
论坛(0)
云声(143)
代码示例(0)

[互动交流] Dataarts作业中shell节点如何获取MRS Hive SQL节点执行的结果

Dataarts作业中shell节点如何获取MRS Hive SQL节点执行的结果

yd_293797038 发表于2025-04-16 17:02:05 2025-04-16 17:02:05 最后回复 Jack20 2025-04-18 14:28:19
213 3

数据治理中心 DataArts Studio
[技术干货] 精准数据获取三网DPI、sdk实时获取意向用户数据

在当今信息化社会，数据已经成为企业竞争的核心资产。如何准确、快速地获取有效数据，是各行各业都在关注的问题。本文将为您介绍一种能够精准获取三网DPI、SDK实时获取意向用户数据的方法，帮助您更好地理解并应用这一技术。该方法基于深度数据包检测(DPI)技术，通过实时捕获、解析网络流量，提取关键信息。收集与自身行业相关的网页链接、手机上App、小程序名称、关键字和400号码，然后根据运营商大数据的数据信息数据模型创建精确数据模型。接着，对顾客的上网行为、通讯行为进行分析，从而获得顾客的自身联系电话等信息，如地域、性别、访问频次、访问时间等各行各业的数据信息。例如，金融贷款、教育机构、股民、期货、外汇、工商企业、POS机、机票、保健品、白酒、各类电商等行业，都可以通过这一方法实时获取高精准的客户数据。这种数据获取方式可以渗透SDK/DPI爬虫精准数据，获取指定网站访客、app登录访客手机号码。但是，这种数据不像渗透资源那样类别齐全，基本只包含手机号码、对应的APP。精准数据获取三网DPI、SDK实时获取意向用户数据的方法，具有广泛的应用前景。它可以帮助企业快速获取潜在客户信息，提高市场营销效果。通过对客户的上网行为、通讯行为进行分析，企业可以更好地了解客户需求，优化产品和服务。该方法还可以应用于金融、教育、医疗等行业，提高行业监管水平，保障公共利益。精准数据获取技术将为我国各行各业的发展带来深远影响。三网运营商大数据的精准客户资源，其原理和机制主要基于数据挖掘和用户行为分析。运营商通过各种手段收集用户的数据，包括用户的实时访问行为、应用使用行为、通信行为等。然后，通过数据挖掘技术，对这些数据进行深度分析，提取出用户的各种特征和行为模式。根据企业的需求，通过标签筛选，精准地识别出目标用户。以移动运营商为例，其大数据平台可以实时跟踪所有移动用户的各种行为足迹，进行意向数据确认，如搜索行为、访问行为、应用下载、注册、登录行为、短信交互行为、拨号行为、消费记录等综合信息。通过对这些数据的分析，企业可以精准地找到目标客户，实现精准营销。例如，一家电商企业，通过移动运营商的大数据平台，找到了最近一周内在淘宝、京东等电商平台频繁搜索和浏览手机的用户，然后针对这些用户进行精准的广告投放，结果显著提高了产品的销售量。

kx99954 发表于2024-10-07 16:32:48 2024-10-07 16:32:48 最后回复轻舟tech 2025-05-19 09:11:05
754 3

big data database DDoS防护数据治理中心 DataArts Studio BigData Pro 大数据
[互动交流] DataArts Studio通过Rest Client接口获取json数据，json数据很长，Job.getNodeOutput得不到完整结果怎么办

DataArts Studio通过Rest Client接口获取json数据，json数据很长，传到后面节点，Job.getNodeOutput得不到完整结果怎么办？节点1（Rest Client） ----------> 节点2（dws sql脚本）json 返回类似：{"d":{"results":[{"a":"123","b":"123"},{"a":"332","b":"332"}, ....]}}但用Job.getNodeOutput拿到截掉了后面部分，导致json解析报错，有什么长度限制可以修改吗？谢谢

yd_225447906 发表于2024-09-25 14:11:13 2024-09-25 14:11:13 最后回复福州司马懿 2024-09-30 11:05:29
199 7

数据治理中心 DataArts Studio
[开发应用] 通过Rest Client 接口取到json，如何用DWS SQL脚本将json解析后存入DWS表里

通过Rest Client 接口取到json，如何用DWS SQL脚本将json解析后存入DWS表里？hive-sql脚本好像有解析json的函数，比如：INSERT INTO mrs_hive_rest SELECT json_tuple(json, 'billsNumber', 'proportionDepartmentId', 'voucherStatusTime', 'proportionProjectId', 'proportionAfterTax', 'id', 'proportionProjectName', 'proportionDepartmentName') FROM ( SELECT explode(split(regexp_replace(regexp_replace('${jsonStr}', '\\[|\\]',''),'\\}\\,\\{','\\}\\;\\{'),'\\;')) as json) t;DWS SQL脚本里是否有相应的做法，谢谢。

yd_225447906 发表于2024-09-24 19:56:40 2024-09-24 19:56:40 最后回复赫塔穆勒 2024-09-29 23:04:40
202 3

数据治理中心 DataArts Studio
[互动交流] DGC分别基于MRS和DWS底座做数据治理有哪些比较明确的区别点呢？

我能想到的是MRS有CDL实时数据集成能力，及Hudi实时数据湖的支持。DGC关于这个对比有没有比较系统的归纳总结呢？

yd_246662643 发表于2024-06-26 11:02:11 2024-06-26 11:02:11 最后回复江南清风起 2025-11-27 16:01:35
240 6

数据治理中心 DataArts Studio
[互动交流] SQL报错，返回code1和code2

各位大佬们，DataArts跑复杂SQL时，比如表连接，开窗函数是会出现报错，主要是这样。有没有解决办法。-- Error while processing statement: FAILED: Execution Error, return code 2 -- Error while processing statement: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.tez.TezTask

yd_240600884 发表于2024-05-31 15:23:54 2024-05-31 15:23:54 最后回复雨落无痕 2024-06-14 15:40:09
273 2

数据治理中心 DataArts Studio Hive SQL
[互动交流] 数据标准设计，目录是挂在主题设计下么？

数据标准设计是建立在主题设计的基本上么？是等l1到l3到业务对象梳理完，挂到业务对象下的么？还是说两个没有什么关联关系，相互独立的。那如果是这样的话，数据标准的目录划分有什么方法论或者说最佳实践尼

yd_228218780 发表于2024-05-07 10:06:45 2024-05-07 10:06:45 最后回复 yd_228218780 2024-05-08 16:09:57
160 2

数据治理中心 DataArts Studio
[认证交流] HCCDP – Big Data 认证

请问大家这个HCCDP – Big Data 有没有视频学习课程或者更多的学习资料报名后提供的资料太少了

yd_229608299 发表于2024-04-10 11:11:18 2024-04-10 11:11:18 最后回复 yd_229608299 0
1143 0

数据仓库数据湖 big data ETL 数据治理中心 DataArts Studio
[互动交流] HCCDE – Big Data 这个认证为什么专家级不能报名呢

HCCDE – Big Data 这个认证为什么专家级不能报名呢

yd_229608299 发表于2024-04-09 09:41:33 2024-04-09 09:41:33 最后回复多米诺的古牌 2024-04-24 15:07:44
229 6

数据治理中心 DataArts Studio 湖仓构建 LakeFormation 云数据迁移 CDM
[互动交流] 数据查询不显示数据的问题

查询DGC里新建脚本查询数据执行完成不显示数据，select * from tablename;select * from tablename;

bigdata的AI 发表于2024-02-21 15:03:56 2024-02-21 15:03:56 最后回复雨落无痕 2024-02-21 17:15:19
78 2

数据治理中心 DataArts Studio
[互动交流] DGC 的主数据治理，在哪个模块？

DGC 的主数据治理，在哪个模块？

yd_270438643 发表于2024-02-20 09:28:24 2024-02-20 09:28:24 最后回复加油O幸福 2024-02-28 14:21:27
196 4

数据治理中心 DataArts Studio
[互动交流] 逻辑模型为什么不能一步到位？

1.既然在【数据架构】模块构建了关系模型与维度模型，包括维表和事实表的逆向数据表关联与填充，为什么还要在【数据开发】模块在开发一遍？只是因为要建立数据任务么？在数据架构模块已经确定了主题与数据的联系，这里就不能默认完成数据的ETL么？感觉在做重复的事，感觉产品层面可以一步解决的，简单的问题复杂化了。2.原来想只取其中一个来构建数据仓库层，但是因为在【数据架构】模块中，构建了原子与派生指标，底层会自动创建了dws表。所以在开发的时候，可以自动选择此任务。这样的关系，让这两个无法取舍。如果完全用【数据开发】模块来构建数据仓库，包括指标层，是否可以？但是数据主题域这样的内容，可以在excel 里面呈现，不在工具层面。3.【数据架构】里面的码表是不是维表的概念，如果是，创建了码表，为什么在下面的流程中，又要求创建维表。在【数据开发】中又创建了一次，并且两次都在填数。这些相同的维表是创建在不同的空间吗？为什么如此频繁在构建同一个业务表，是不是违背了数据治理统一，规范的原则？4.数据标准的功能，仅仅是对共享的粒度做命名规范么，还包括一些参数的要求？这个功能与数据质量的是不是有点雷同，其本质都是对字段，表，库级做数据的限制监控。烦请热心的产品同志，看到后，跟踪上述问题。谢谢！

yd_270438643 发表于2024-02-18 15:09:39 2024-02-18 15:09:39 最后回复福州司马懿 2024-02-27 10:01:44
349 10

数据仓库数据治理中心 DataArts Studio
[分享交流] 华为DTT对我的影响

华为DTT直播为我提供了许多技术支持。通过这个平台，我学习了最新的技术趋势和解决方案，了解了业界领先的技术理念和实践经验。作为大学生用户，在此直播中学习到的好的，新的算法理念让我在亚太大学生robocon机器人比赛中有更好的思路眼界。华为作为科技巨头，其在5G、人工智能、云计算等领域的专业知识和前沿技术，让我受益匪浅。我深入了解了不同技术领域的核心概念，拓宽了自己的技术视野，提升了解决问题的能力。DTT直播不仅让我学习到了技术知识，更重要的是学会了团队合作、沟通技巧和解决问题的方法。这些技能对我在机器人战队近50人的团队中的表现产生了积极的影响。我学会了更好地与队友合作，更高效地解决备赛过程中的挑战，并且在团队中展现出更大的价值。此外，DTT直播还为我提供了与很多大佬交流的平台。在这里，我有机会结识来自不同背景和领域的技术人才，并和他们分享经验和见解。这种交流不仅拓宽了我的人脉圈，更重要的是让我从不同角度思考问题，汲取了宝贵的知识。综上所述，参与华为DTT直播培训对我产生了深远的影响，让我获益良多。我通过这个平台学到了宝贵的知识和技能，提升了自己的综合素质，为未来的职业发展打下了坚实的基础。我相信，这次宝贵的经历将在我未来的职业道路上发挥重要作用，让我能够更加自信和有竞争力地面对未来的挑战。

yd_259383340 发表于2024-01-05 16:23:34 2024-01-05 16:23:34 最后回复 yd_259383340 0
50 0

数据治理中心 DataArts Studio
[互动交流] 如何复用依赖的数据集成任务

有个数据集成任务同步了一张表，下游多个hive任务需要依赖这张表，如果配置依赖呢，是不是只有一种方法，做一个作业只放这一个集成任务。有没有其他复用的方法

jackyma 发表于2023-12-28 10:03:07 2023-12-28 10:03:07 最后回复 jackyma 2024-01-05 10:13:25
121 3

数据治理中心 DataArts Studio
[互动交流] DGC如何实现数据分类和标签？

DGC如何实现数据分类和标签，以及如何自动化和管理这些任务以提高效率和准确性。

皮牙子抓饭 发表于2023-10-31 16:50:44 2023-10-31 16:50:44 最后回复雨落无痕 2023-11-02 15:16:57
48 2

数据治理中心 DataArts Studio

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript