- 集合:一个无序的,不重复的数据组合 - 去重,列表变集合,自动去重 - 关系测试,测试两组数据之间的交集,差集,并集等关系 去重 set0 = set("hello") # 创建字符集合 print("set0:", set0) # ->set0: {'e', 'l', 'h', 'o'} list1 = [1, 2, 3, 1, 2] set1 =... 集合:一个无序的,不重复的数据组合 - 去重,列表变集合,自动去重 - 关系测试,测试两组数据之间的交集,差集,并集等关系 去重 set0 = set("hello") # 创建字符集合 print("set0:", set0) # ->set0: {'e', 'l', 'h', 'o'} list1 = [1, 2, 3, 1, 2] set1 =...
- 烯牛数据地址: http://www.xiniudata.com/project/event/lib/invest 打开页面,能正常看到内容,查看源代码发现页面并没有出现我们需要的内容,说明这是异步加载的内容。 数据抓取 方式1: 采用requests或scrapy,拿不到页面数据,api数据加密不好处理 方式2: 采用PhantomJS,尝试多次还是拿不... 烯牛数据地址: http://www.xiniudata.com/project/event/lib/invest 打开页面,能正常看到内容,查看源代码发现页面并没有出现我们需要的内容,说明这是异步加载的内容。 数据抓取 方式1: 采用requests或scrapy,拿不到页面数据,api数据加密不好处理 方式2: 采用PhantomJS,尝试多次还是拿不...
- 利用requests库对网络接口的请求,将markdown格式转换为rst格式 代码示例 # -*- coding: utf-8 -*- # @File : markdown_to_rst.py # @Date : 2018-08-20 # @Author : Peng Shiyu import requests def md_to_rst(from_f... 利用requests库对网络接口的请求,将markdown格式转换为rst格式 代码示例 # -*- coding: utf-8 -*- # @File : markdown_to_rst.py # @Date : 2018-08-20 # @Author : Peng Shiyu import requests def md_to_rst(from_f...
- Pandas是Python第三方库,提供高性能易用数据类型和分析工具 官网文档:http://pandas.pydata.org/pandas-docs/stable/10min.html 引入: import pandas as pd 1 Pandas基于NumPy实现,常与NumPy和Matplotlib一同使用 两个数据类型:Series, DataFr... Pandas是Python第三方库,提供高性能易用数据类型和分析工具 官网文档:http://pandas.pydata.org/pandas-docs/stable/10min.html 引入: import pandas as pd 1 Pandas基于NumPy实现,常与NumPy和Matplotlib一同使用 两个数据类型:Series, DataFr...
- 一、常用指令 指令说明pwd打印当前目录ls列出当前路径下的文件和目录mkdir 目录名新建目录cd 目录名进到指定目录python运行 Python 解释器 绝对路径:是以根目录(” / “)为起点的完整路径 相对路径:是你当前的目录(” . “)为起点的路径 . 表示当前目录 .. 表示当前目录的上一级目录 - 表示上一次所在目录 ~ 表示当前用户的 hom... 一、常用指令 指令说明pwd打印当前目录ls列出当前路径下的文件和目录mkdir 目录名新建目录cd 目录名进到指定目录python运行 Python 解释器 绝对路径:是以根目录(” / “)为起点的完整路径 相对路径:是你当前的目录(” . “)为起点的路径 . 表示当前目录 .. 表示当前目录的上一级目录 - 表示上一次所在目录 ~ 表示当前用户的 hom...
- yield yield不仅可以返回值,也可以接收值 # yield返回值, 生成器 def gen(): for x in ["a", "b", "c"]: yield x for i in gen(): print(i) # a b c12345678910 # yield接收值, 协程 def gen(): while True: x = yield p... yield yield不仅可以返回值,也可以接收值 # yield返回值, 生成器 def gen(): for x in ["a", "b", "c"]: yield x for i in gen(): print(i) # a b c12345678910 # yield接收值, 协程 def gen(): while True: x = yield p...
- Request Payload 和 Form Data 请求头上的参数差别在于: Content-Type Form Data Post表单请求 代码示例 headers = { "Content-Type": "application/x-www-form-urlencoded" } requests.post(url, data=data, header... Request Payload 和 Form Data 请求头上的参数差别在于: Content-Type Form Data Post表单请求 代码示例 headers = { "Content-Type": "application/x-www-form-urlencoded" } requests.post(url, data=data, header...
- 文档:https://github.com/scrapinghub/number-parser 安装 pip install number-parser 1 requires Python 3.6+. # -*- coding: utf-8 -*- from number_parser import parse, parse_number, parse_ordi... 文档:https://github.com/scrapinghub/number-parser 安装 pip install number-parser 1 requires Python 3.6+. # -*- coding: utf-8 -*- from number_parser import parse, parse_number, parse_ordi...
- 第一步:先安装pydev pyDev:http://www.pydev.org/updates 第二步:配置python解释器路径 安装好pydev后, 需要配置Python解释器。 在Eclipse菜单栏中,点击Windows -&... 第一步:先安装pydev pyDev:http://www.pydev.org/updates 第二步:配置python解释器路径 安装好pydev后, 需要配置Python解释器。 在Eclipse菜单栏中,点击Windows -&...
- 算术运算法则 算术运算根据行列索引,补齐后运算, 运算默认产生浮点数 补齐时缺项填充NaN(空值) 二维和一维、一维和零维间为广播运算 采用+ ‐* /符号进行的二元运算产生新的对象 方法形式的运算 方法说明.add(d, **argws)类型间加法运算,可选参数.sub(d, **argws)类型间减法运算,可选参数.mul(d, **argws)类型间... 算术运算法则 算术运算根据行列索引,补齐后运算, 运算默认产生浮点数 补齐时缺项填充NaN(空值) 二维和一维、一维和零维间为广播运算 采用+ ‐* /符号进行的二元运算产生新的对象 方法形式的运算 方法说明.add(d, **argws)类型间加法运算,可选参数.sub(d, **argws)类型间减法运算,可选参数.mul(d, **argws)类型间...
- pykafka https://pypi.org/project/pykafka/ http://github.com/Parsely/pykafka/ https://pykafka.readthedocs.io/ kafka-python https://pypi.org/project/kafka-python/ https://github.com/dpkp/... pykafka https://pypi.org/project/pykafka/ http://github.com/Parsely/pykafka/ https://pykafka.readthedocs.io/ kafka-python https://pypi.org/project/kafka-python/ https://github.com/dpkp/...
- 方法比较简单 import os import base64 # 生成32位随机字符 a = os.urandom(32) # 编码为base64 base64.b64encode(a) Out[13]: b'2QDq4HSpT8U4W6iZ2xDzGW3CcY2WVsJXVEwYv0qludY=' 12345678910 命令行中使用 python -c ... 方法比较简单 import os import base64 # 生成32位随机字符 a = os.urandom(32) # 编码为base64 base64.b64encode(a) Out[13]: b'2QDq4HSpT8U4W6iZ2xDzGW3CcY2WVsJXVEwYv0qludY=' 12345678910 命令行中使用 python -c ...
- 安装第三方包的时候报错 Command "python setup.py egg_info" failed with error code 1 1 解决 更新pip pip install --upgrade pip 1 再安装需要安装的第三方扩展包 参考: Command “python setup.py egg_info” failed with... 安装第三方包的时候报错 Command "python setup.py egg_info" failed with error code 1 1 解决 更新pip pip install --upgrade pip 1 再安装需要安装的第三方扩展包 参考: Command “python setup.py egg_info” failed with...
- 分词函数 def split_word(document): """ 分词,去除停用词 """ stop_words = {":", "的", ",", "”"} text = [] for word in jieba.cut(document): if word not in stop_words: text.append(word) return text 123... 分词函数 def split_word(document): """ 分词,去除停用词 """ stop_words = {":", "的", ",", "”"} text = [] for word in jieba.cut(document): if word not in stop_words: text.append(word) return text 123...
- 文档:https://github.com/fxsjy/jieba 安装 pip install jieba 1 分词 cut/lcut(self, sentence, cut_all=False, HMM=True, use_paddle=False) # 参数: sentence 需要分词的字符串; cut_all 参数用来控制是否采用全模式; HMM... 文档:https://github.com/fxsjy/jieba 安装 pip install jieba 1 分词 cut/lcut(self, sentence, cut_all=False, HMM=True, use_paddle=False) # 参数: sentence 需要分词的字符串; cut_all 参数用来控制是否采用全模式; HMM...
上滑加载中
推荐直播
-
华为云码道 × 仓颉编程:工程化AI编码探索2026/05/27 周三 19:00-21:00
刘俊杰-华为云仓颉语言专家/李炎-华为云码道技术专家/王智鹏-OpenCangjie开源社区发起人
本场直播围绕华为云仓颉语言与华为云码道的深度结合,展示华为云智能编程从零基础到高效落地的完整生态能力。以华为云码道为引擎,仓颉语言为载体,带给大家日常提效、趣味创新到极速量产的开发体验。
回顾中
热门标签