- 目录 前言安装HanLP库词典的加载 前言 目前开源的自然语言处理工具有NLTK,CoreNLP,LTP,HanLP。对于我们中国的程序员来说,一般使用哈工大的LTP,或者使用开源的HanLP。 我们后续的讲解都是基于HanLP工具,它具有词法分析,句法分析,关键词提取以及文本分析等。优点是运行特别快,省内存,精度准且免费的特性。 安装HanLP库 ... 目录 前言安装HanLP库词典的加载 前言 目前开源的自然语言处理工具有NLTK,CoreNLP,LTP,HanLP。对于我们中国的程序员来说,一般使用哈工大的LTP,或者使用开源的HanLP。 我们后续的讲解都是基于HanLP工具,它具有词法分析,句法分析,关键词提取以及文本分析等。优点是运行特别快,省内存,精度准且免费的特性。 安装HanLP库 ...
- 目录 前言mmap(读文件)write(写文件) 前言 内存映射通常可以提高I/O的性能,因为使用内存映射时,不需要对每个访问都建立一个单独的系统调用,也不需要在缓冲区之间复制数据,内核和用户都能很方便的直接访问内存。 本篇,将详细介绍Python内存映射库:mmap。 mmap(读文件) 使用mmap()函数可以创建一个内存映射文件。该函数的第1... 目录 前言mmap(读文件)write(写文件) 前言 内存映射通常可以提高I/O的性能,因为使用内存映射时,不需要对每个访问都建立一个单独的系统调用,也不需要在缓冲区之间复制数据,内核和用户都能很方便的直接访问内存。 本篇,将详细介绍Python内存映射库:mmap。 mmap(读文件) 使用mmap()函数可以创建一个内存映射文件。该函数的第1...
- 目录 前言生成随机数种子random.sample随机元素SystemRandom非均匀分布正态分布近似分布 前言 在实际的开发中,经常会用到随机数生成。而random库专用于随机数的生成,它是基于Mersenne Twister算法提供了一个快速伪随机数生成器。 本篇,将详细讲解各种场景之下随机数的生成应用。 生成随机数 对于随机数的生成,r... 目录 前言生成随机数种子random.sample随机元素SystemRandom非均匀分布正态分布近似分布 前言 在实际的开发中,经常会用到随机数生成。而random库专用于随机数的生成,它是基于Mersenne Twister算法提供了一个快速伪随机数生成器。 本篇,将详细讲解各种场景之下随机数的生成应用。 生成随机数 对于随机数的生成,r...
- 目录 人脸检测函数检测图像中的N个人脸 人脸检测函数 在OpenCV中,人脸检测使用的函数是cv2.CascadeClassifier.detectMultiScale(),它可以检测图像中所有的人脸。其完整定义如下: def detectMultiScale(self, image, scaleFactor=None, minNeighbors=No... 目录 人脸检测函数检测图像中的N个人脸 人脸检测函数 在OpenCV中,人脸检测使用的函数是cv2.CascadeClassifier.detectMultiScale(),它可以检测图像中所有的人脸。其完整定义如下: def detectMultiScale(self, image, scaleFactor=None, minNeighbors=No...
- 目录 多模板匹配获取匹配位置的集合循环在循环中使用zip()替换坐标 实战多模板匹配 多模板匹配 在上一篇的实战中,我们通过人物眼睛的子图,找出了其在图像中出现位置。但是,有些情况下,并不仅仅只有一次,比如我们讲解傅里叶变换时,曾介绍一张草原的狮子图。如果匹配某个草,可能单个图像内会有很多,这个时候就要找出多个匹配结果。 而函数cv2.minMax... 目录 多模板匹配获取匹配位置的集合循环在循环中使用zip()替换坐标 实战多模板匹配 多模板匹配 在上一篇的实战中,我们通过人物眼睛的子图,找出了其在图像中出现位置。但是,有些情况下,并不仅仅只有一次,比如我们讲解傅里叶变换时,曾介绍一张草原的狮子图。如果匹配某个草,可能单个图像内会有很多,这个时候就要找出多个匹配结果。 而函数cv2.minMax...
- 目录 什么是Canny边缘检测获取图像的边缘 什么是Canny边缘检测 Canny边缘检测是一种使用多级边缘检测算法检测边缘的方法。该方法由John F. Canny于1986年发表。 Canny边缘检测主要分为4个步骤: (1)去噪。噪声会影响边缘检测的准确性,因此首先要将噪声过滤掉。 (2)计算梯度的幅度与方向 (3)非极大值抑制,即适当地让... 目录 什么是Canny边缘检测获取图像的边缘 什么是Canny边缘检测 Canny边缘检测是一种使用多级边缘检测算法检测边缘的方法。该方法由John F. Canny于1986年发表。 Canny边缘检测主要分为4个步骤: (1)去噪。噪声会影响边缘检测的准确性,因此首先要将噪声过滤掉。 (2)计算梯度的幅度与方向 (3)非极大值抑制,即适当地让...
- Python自然语言处理专栏目录 初体验HanLP—Python自然语言处理(1)切分算法—Python自然语言处理(2)字典树—Python自然语言处理(3)停用词过滤—Python自然语言处理(4)简繁体转换—Python自然语言处理(5)拼音转换—Python自然语言处理(6)语料库标注与训练模型—Python自然语言处理(7)预测分词—Python自然语言处理... Python自然语言处理专栏目录 初体验HanLP—Python自然语言处理(1)切分算法—Python自然语言处理(2)字典树—Python自然语言处理(3)停用词过滤—Python自然语言处理(4)简繁体转换—Python自然语言处理(5)拼音转换—Python自然语言处理(6)语料库标注与训练模型—Python自然语言处理(7)预测分词—Python自然语言处理...
- 目录 什么是字典树DoubleArrayTrieSegmentAhoCorasickDoubleArrayTrieSegment 什么是字典树 在自然语言处理中,字符串集合常用字典树存储,这是一种字符串上的树形数据结构。字典树中每条边都对应一个字,从根节点往下的路径构成一个个字符串。 字典树并不直接在节点上存储字符串,而是将词语视作根节点到某节点之间的... 目录 什么是字典树DoubleArrayTrieSegmentAhoCorasickDoubleArrayTrieSegment 什么是字典树 在自然语言处理中,字符串集合常用字典树存储,这是一种字符串上的树形数据结构。字典树中每条边都对应一个字,从根节点往下的路径构成一个个字符串。 字典树并不直接在节点上存储字符串,而是将词语视作根节点到某节点之间的...
- 目录 视频VideoCapture类初始化检查摄像头是否初始化成功捕获帧释放 属性设置grab()与retrieve()捕获摄像头视频捕获文件视频实现灰度摄像头 视频 视频是非常重要的视觉信息来源,它是视觉处理过程中经常要处理的一类信号。实际上,视频是由一系列图像构成,这一系列的图像被称为帧,帧是以固定时间间隔从视频中获取的。获取帧的速度称为帧速率,... 目录 视频VideoCapture类初始化检查摄像头是否初始化成功捕获帧释放 属性设置grab()与retrieve()捕获摄像头视频捕获文件视频实现灰度摄像头 视频 视频是非常重要的视觉信息来源,它是视觉处理过程中经常要处理的一类信号。实际上,视频是由一系列图像构成,这一系列的图像被称为帧,帧是以固定时间间隔从视频中获取的。获取帧的速度称为帧速率,...
- 在Python语言中,in是一个使用频率非常高的操作符,用于判断对象是否位于字符串、元组、列表、集合或字典中。in操作和人的思维方式高度吻合,写起来近乎于自然语言,充分体现了Python的哲学理念。 >>> 'or' in 'hello world' True >>> 5 in {1,2,3,4} False >>>... 在Python语言中,in是一个使用频率非常高的操作符,用于判断对象是否位于字符串、元组、列表、集合或字典中。in操作和人的思维方式高度吻合,写起来近乎于自然语言,充分体现了Python的哲学理念。 >>> 'or' in 'hello world' True >>> 5 in {1,2,3,4} False >>>...
- 目录 前言服务器代码客户端代码 前言 前文使用TCP面向流的套接字,今天讲解的UDP的工作方式与TCP/IP不同。UDP是用户数据报协议,是一个面向消息的协议。 一方面,UDP不需要一个长期活动连接,所以建立UDP套接字稍微简单一些。另一方面,UDP消息必须放在一个数据报中。 在IPv4中,数据报包含65507个字节,这些字节信息中还包括首部信息。因... 目录 前言服务器代码客户端代码 前言 前文使用TCP面向流的套接字,今天讲解的UDP的工作方式与TCP/IP不同。UDP是用户数据报协议,是一个面向消息的协议。 一方面,UDP不需要一个长期活动连接,所以建立UDP套接字稍微简单一些。另一方面,UDP消息必须放在一个数据报中。 在IPv4中,数据报包含65507个字节,这些字节信息中还包括首部信息。因...
- 文章目录 1. 关于 PIL 和 pillow 的关系 2. 模块介绍 3. 常用功能 3.1 打开图像文件 3.2 保存图像文件 3.3 创建空白图像 3.4 图像模式转换 3.5 通道合并与拆分 3.6 图像缩放 3.7 图像旋转 3.8 图像复制、裁切与粘贴 3.9 使用滤镜 3.10 绘图 3.11 截取屏幕 ... 文章目录 1. 关于 PIL 和 pillow 的关系 2. 模块介绍 3. 常用功能 3.1 打开图像文件 3.2 保存图像文件 3.3 创建空白图像 3.4 图像模式转换 3.5 通道合并与拆分 3.6 图像缩放 3.7 图像旋转 3.8 图像复制、裁切与粘贴 3.9 使用滤镜 3.10 绘图 3.11 截取屏幕 ...
- 目录 前言完全切分正向最长匹配逆向最长匹配双向最长匹配 前言 我们需要分析某句话,就必须检测该条语句中的词语。 一般来说,一句话肯定包含多个词语,它们互相重叠,具体输出哪一个由自然语言的切分算法决定。常用的切分算法有完全切分、正向最长匹配、逆向最长匹配以及双向最长匹配。 本篇博文将一一介绍这些常用的切分算法。 完全切分 完全切分是指,找出一段文本... 目录 前言完全切分正向最长匹配逆向最长匹配双向最长匹配 前言 我们需要分析某句话,就必须检测该条语句中的词语。 一般来说,一句话肯定包含多个词语,它们互相重叠,具体输出哪一个由自然语言的切分算法决定。常用的切分算法有完全切分、正向最长匹配、逆向最长匹配以及双向最长匹配。 本篇博文将一一介绍这些常用的切分算法。 完全切分 完全切分是指,找出一段文本...
- 本文目录 前言波形频谱Spectrum 波形对象信号对象 前言 音频处理属于大学课程《多媒体技术》,什么采样率,频谱等理论知识,博主这里会慢慢的根据实际的代码进行讲解,不会一笼统的纯理论知识一大堆摆上来,毕竟学习音频处理是为了我们处理日常生活中的工作。 关于音频处理的方式,后面的代码都会使用python语言进行处理,至于学完后可以干啥,肯定是大家非... 本文目录 前言波形频谱Spectrum 波形对象信号对象 前言 音频处理属于大学课程《多媒体技术》,什么采样率,频谱等理论知识,博主这里会慢慢的根据实际的代码进行讲解,不会一笼统的纯理论知识一大堆摆上来,毕竟学习音频处理是为了我们处理日常生活中的工作。 关于音频处理的方式,后面的代码都会使用python语言进行处理,至于学完后可以干啥,肯定是大家非...
- 目录 前言初识数组array基本用法数据转换 前言 一般来说,我们将Python中的list列表当作数组。但是Python中真正的数组是:array。 它看上去跟list很相似,但是list列表成员可以是任意类型的组合也可以是单一的类型组合,而array数组并不能是,它的所有成员必须是相同的类型。包括了所有的数值类型或其他固定大小的基本类型。 支持的... 目录 前言初识数组array基本用法数据转换 前言 一般来说,我们将Python中的list列表当作数组。但是Python中真正的数组是:array。 它看上去跟list很相似,但是list列表成员可以是任意类型的组合也可以是单一的类型组合,而array数组并不能是,它的所有成员必须是相同的类型。包括了所有的数值类型或其他固定大小的基本类型。 支持的...
上滑加载中
推荐直播
-
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中 -
华为云码道全新升级,多会话并行与多智能体协作2026/05/08 周五 19:00-21:00
王一男-华为云码道产品专家;张嘉冉-华为云码道工程师;胡琦-华为云HCDE;程诗杰-华为云HCDG
华为云码道4月份版本全新升级,此次直播深度解读4月份产品特性,通过“特性解读+实操演示+实战案例+设计创新”的组合,全方位展现码道在多会话并行与多智能体协作方面的能力,赋能开发者提升效率
正在直播
热门标签