Fusioninsight,助力智能时代全球数字经济转型升级

论坛
活动
云享专家
  • 徐礼锋

    大数据架构师

  • 许田立

    大数据架构师

展开更多
  • 文章
手把手教你搭建Hive环境
准备环境: hadoop基础环境(3.1.3)  Hive版本 3.1.2下载地址:https://hive.apache.org/downloads.htmlHive3.X版本支持Hadoop3.X,Hive2.0版本支持Hadoop2.X1、上传安装包,解压文件tar -zxvf   对应包名2、 创建软连接ln -s  apache-hive-1.2.2-bin hiv...
用户头像 SegmentFault思否 2020-12-04 0 0
表格化数据挖掘
文章目录 1. 经典的数据挖掘方法:数据驱动型开发早期的努力 1.1 什么是结构化数据 1.2 结构化数据的传统建模流程 1.3 传统建模流程的问题 2. 表格化数据挖掘基本流程:看看现在的数据挖掘都是怎么做的? 2.1 数据挖掘竞赛和新的建模流程:竞赛基本流程和挑战 2.2 新的流程 2.3 新的流程的一些说明 3....
用户头像 CSDN 2020-12-04 0 0
一日一技:在 Jupyter 中如何自动重新导入特定的 模块?
一日一技:在 Jupyter 中如何自动重新导入特定的 模块? 摄影:产品经理提包:kingnameJupyter 是数据分析领域非常有名的开发环境,使用 Jupyter 写数据分析相关的代码会大大节约开发时间。 设想这样一个场景:别的部门的同事传给你一个数据分析的模块,用于实现对数据的高级分析。模块里面有上百个函数。 如果直接写 Python 文件来调用数据分析模块,那么使...
用户头像 51CTO 2020-12-04 0 0
hadoop start namenode deamon and datanode deamon failed
执行命令hadoop/sbin/start-dfs.sh失败,报错信息如下:WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable Incorrect configurati...
用户头像 SegmentFault思否 2020-12-04 0 0
Flink 流式处理与推荐系统的样本实时生成
继搜索引擎之后,推荐系统已经成为移动互联网时代人们获取信息的主要渠道,比如,流行的新闻 App 都会利用推荐系统进行用户的个性化推荐。新闻推荐场景具有高度的实时性,每时每刻都会有大量的新闻、热点产生。王喆前辈的两篇博客已经对推荐系统的实时性问题进行了深入的探讨:天下武功,唯快不破,论推荐系统的「 实时性」如何增强推荐系统模型更新的「实时性」?增量更新、在线学习、局部更新甚至强...
用户头像 SegmentFault思否 2020-12-03 0 0
软件设计师考试 | 第四章 操作系统知识 | 操作系统概述
文章目录 (一)操作系统的基本概念1.操作系统定义及作用2.操作系统特征与功能 (二)操作系统分类及特点1.批处理操作系统2.分时操作系统3.实时操作系统4.网络操作系统5.分布式操作系统6.微型计算机操作系统7.嵌入式操作系统 (三)操作系统的发展 (一)操作系统的基本概念 1.操作系统定义及作用 定义: 能有效地组织和管理系统中的各种软/硬件资...
用户头像 CSDN 2020-12-03 0 0
Hive基本操作
Hive DML1、插入数据1.1. Loading files into tables--加载本地数据到hive表 load data local inpath '/root/data/data' into table psn;--(/root/data/data指的是本地 linux目录) --加载hdfs数据文件到hive表 load data inpath '/dat...
用户头像 SegmentFault思否 2020-12-03 0 0
推荐 5 个实用的黑科技网站,建议收藏!
今天将为大家推荐 5 款实用的小众型网站 建议大家收藏起来,这些网站可以很好的提升自己的工作效率 TOOLFK TOOLFK 是一个面对程序员的在线工具箱网站 包含 100 多种实用的工具,包含:程序在线运行、在线制作思维导图、在线网络爬虫、语音合成、PDF/PPT/Excel 文档转换加密工具、MarkDown 格式转换等 网站地址: https://www.toolf...
用户头像 51CTO 2020-12-03 0 0
Python核心资料:Django+Scrapy+Hadoop+数据挖掘+机器学习+Python精选视频(限时福利免费领)
现在转 Python 还来得及吗?来得及!目前企业招聘 Python 相关岗位的需求很大,现在上车虽然稍晚,但刚好也是 Python 的红利期。学会 Python 可以做测试开发、运维、Python Web 开发,还可以做爬虫、数据分析、数据挖掘、算法、人工智能等高薪岗位。 最近花了很长时间整理了很多 Python 基础+爬虫+数据挖掘+人工智能核心资料,有视频,也有学习文...
用户头像 CSDN 2020-12-03 0 0
数据分析:复杂业务场景下,量化评估流程
本文源码:GitHub·点这里 || GitEE·点这里 一、量化思维 在编程体系中有很多复杂的业务是很难理解的,但是又需要做一个量化分析,给业务人员或者运营,或者用户一个参考标准,例如常见指数,芝麻分数,店铺等级,这类业务评定标准非常复杂,因为影响结果的因素很多。 在多个维度的业务考量模型中,有一个核心概念叫做权重,指某一因素或指标相对于某一事物的重要程度,其不同于一般的比...
用户头像 51CTO 2020-12-03 1 0
自动化篇 | 这些自动化场景,批处理脚本完全可以取代 Python!
1. 前言 提到自动化解决方案,相信大部分人会想到用 Python 语言,只需要根据功能场景,编写 Python 脚本即可 相反,PC 端的 Batch 批处理 似乎快被忘记了,很多人对它嗤之以鼻,认为这么古老的脚本语言貌似没什么用,Python 似乎可以取而代之 相比 Python 脚本,Batch 批处理脚本在某些场景下,使用更简洁、方便、高效,即写即用,不需要依赖 Py...
用户头像 51CTO 2020-12-03 0 0
Spark Streaming 快速入门系列(5) | 还不会DStream转换,一文带你深入了解
  大家好,我是不温卜火,是一名计算机学院大数据专业大二的学生,昵称来源于成语—不温不火,本意是希望自己性情温和。作为一名互联网行业的小白,博主写博客一方面是为了记录自己的学习过程,另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限,博客中难免会有一些错误出现,有纰漏之处恳请各位大佬不吝赐教!暂时只有csdn这一个平台,博客...
用户头像 CSDN 2020-12-03 1 0
Spark内核详解 (7) | Spark 内存管理
  大家好,我是不温卜火,是一名计算机学院大数据专业大二的学生,昵称来源于成语—不温不火,本意是希望自己性情温和。作为一名互联网行业的小白,博主写博客一方面是为了记录自己的学习过程,另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限,博客中难免会有一些错误出现,有纰漏之处恳请各位大佬不吝赐教!暂时只有csdn这一个平台,博客...
用户头像 CSDN 2020-12-03 1 0
Spark SQL 快速入门系列(6) | 一文教你如何自定义 SparkSQL 函数
  大家好,我是不温卜火,是一名计算机学院大数据专业大二的学生,昵称来源于成语—不温不火,本意是希望自己性情温和。作为一名互联网行业的小白,博主写博客一方面是为了记录自己的学习过程,另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限,博客中难免会有一些错误出现,有纰漏之处恳请各位大佬不吝赐教!暂时只有csdn这一个平台,博客...
用户头像 CSDN 2020-12-03 2 0
一、通过requests库爬取数据并保存为csv文件
此系列第一篇呀 目录 一、选择数据源三、整体代码实现4、总结 同时推荐前面作者另外两个系列文章: 快速入门之Tableau系列:快速入门之Tableau快速入门之爬虫系列:快速入门之爬虫 一、选择数据源 网址:https://wp.m.163.com/163/page/news/virus_report/index.html?nw=1...
用户头像 CSDN 2020-12-03 0 0
展开更多