Selenium_标签_开发者_华为云

博客(314)
视频(0)
论坛(0)
云声(0)
代码示例(0)

Selenium+BeautifulSoup+json获取 Script 标签内的 json 数据
Selenium爬虫遇到数据是以 JSON 字符串的形式包裹在 Script 标签中，假设Script标签下代码如下： <script id="DATA_INFO" type="applica...

诡途
发表于2021-11-19 02:07:14
5299 0 0

5.2k 0 0

Selenium爬虫遇到数据是以 JSON 字符串的形式包裹在 Script 标签中，假设Script标签下代码如下： <script id="DATA_INFO" type="applica...
JSON Selenium
Selenium自动下载qbt数据
Selenium模拟浏览器自动下载数据一开始固定休眠时，下载几个文件就会被踢下线，随机休眠后基本无问题了 from selenium import webdriver import time,os,...

诡途
发表于2021-11-19 01:17:21
5942 0 0

5.9k 0 0

Selenium模拟浏览器自动下载数据一开始固定休眠时，下载几个文件就会被踢下线，随机休眠后基本无问题了 from selenium import webdriver import time,os,...
Selenium
Selenium爬携程酒店评论+jieba数据分析实战
如果你想使用最少的时间相对客观的了解一样事物，那么最好的方式就是快速收集大量的关于它的评价，然后迅速地找出这些评价中的关键信息。而这道题目，有两个特别大的难点：1.如何快速收集大量的评论；2.如何迅速的从大量评论中抽取关键信息。基于python语言的爬虫技术和文本分析技术刚好可以克服这两大困难，帮助我们更快更客观的了解某样事物。...

格图洛书
发表于2021-11-19 01:01:54
4421 0 0

4.4k 0 0

如果你想使用最少的时间相对客观的了解一样事物，那么最好的方式就是快速收集大量的关于它的评价，然后迅速地找出这些评价中的关键信息。而这道题目，有两个特别大的难点：1.如何快速收集大量的评论；2.如何迅速的从大量评论中抽取关键信息。基于python语言的爬虫技术和文本分析技术刚好可以克服这两大困难，帮助我们更快更客观的了解某样事物。...
Selenium 数据挖掘
使用Selenium模拟浏览器，实现自动爬取数据
最近需要在一个网站下载一批数据。但是输入一个查询，返回三四万条结果，每次只能导出500条，而且每次还得输入下载条目的范围！这样点击下载，还不要了我的老命。于是乎想自动化这个过程。我的需求主要是两点：1. 要求自动化程度高。最好有直接模拟浏览器鼠标和键盘动作的成熟接口，比如在文本框输入，选择下拉列表，单选框，复选框，点击按钮等。2. ...

格图洛书
发表于2021-11-18 23:34:33
3523 0 0

3.5k 0 0

最近需要在一个网站下载一批数据。但是输入一个查询，返回三四万条结果，每次只能导出500条，而且每次还得输入下载条目的范围！这样点击下载，还不要了我的老命。于是乎想自动化这个过程。我的需求主要是两点：1. 要求自动化程度高。最好有直接模拟浏览器鼠标和键盘动作的成熟接口，比如在文本框输入，选择下拉列表，单选框，复选框，点击按钮等。2. ...
Selenium 数据挖掘
Python爬虫：Selenium鼠标点击二级菜单
selenium包中ActionChains类给出的示例如下： menu = driver.find_element_by_css_selector(".nav") hidden_submenu = driver.find_element_by_css_selector(".nav #submenu1") actions = ActionChains(driver)...

彭世瑜
发表于2021-08-14 00:54:04
3746 0 0

3.7k 0 0

selenium包中ActionChains类给出的示例如下： menu = driver.find_element_by_css_selector(".nav") hidden_submenu = driver.find_element_by_css_selector(".nav #submenu1") actions = ActionChains(driver)...
Python Selenium
error：selenium操作Firefox报错socket.error: [Errno 10054]
selenium操作Firefox报错socket.error: [Errno 10054] 开始以为是时间不够，增加等待时间，然后没有什么用查看：https://github.com/mozilla/geckodriver/releases 发现版本要求，再查看本地的Selenium 版本太低，是3.6的，果断升级 Firefox 57 (and great...

彭世瑜
发表于2021-08-14 00:40:49
5225 0 0

5.2k 0 0

selenium操作Firefox报错socket.error: [Errno 10054] 开始以为是时间不够，增加等待时间，然后没有什么用查看：https://github.com/mozilla/geckodriver/releases 发现版本要求，再查看本地的Selenium 版本太低，是3.6的，果断升级 Firefox 57 (and great...
Selenium Socket编程
Python：Selenium + Chrome添加认证代理
添加无认证代理，以参数形式添加 chromeOptions = webdriver.ChromeOptions() chromeOptions.add_argument('--proxy-server=http://ip:port') driver = webdriver.Chrome(chrome_options=chromeOptions) 123 添加认证...

彭世瑜
发表于2021-08-14 00:26:36
3958 0 0

3.9k 0 0

添加无认证代理，以参数形式添加 chromeOptions = webdriver.ChromeOptions() chromeOptions.add_argument('--proxy-server=http://ip:port') driver = webdriver.Chrome(chrome_options=chromeOptions) 123 添加认证...
Python Selenium
Python爬虫：selenium和Chrome无头浏览器抓取烯牛数据动态网页
烯牛数据地址： http://www.xiniudata.com/project/event/lib/invest 打开页面，能正常看到内容，查看源代码发现页面并没有出现我们需要的内容，说明这是异步加载的内容。数据抓取方式1：采用requests或scrapy，拿不到页面数据，api数据加密不好处理方式2：采用PhantomJS，尝试多次还是拿不...

彭世瑜
发表于2021-08-13 23:49:58
5184 0 0

5.1k 0 0

烯牛数据地址： http://www.xiniudata.com/project/event/lib/invest 打开页面，能正常看到内容，查看源代码发现页面并没有出现我们需要的内容，说明这是异步加载的内容。数据抓取方式1：采用requests或scrapy，拿不到页面数据，api数据加密不好处理方式2：采用PhantomJS，尝试多次还是拿不...
Python Selenium
Python爬虫：利用selenium爬取淘宝商品信息
# 项目简介：利用selenium爬取淘宝商品信息 """ 思路： 1、先打开浏览器，输入关键字，点击搜索，获取商品页总页数 2、通过遍历所有页面，获取商品页 3、获取页面的时候同时进行解析页面内容 4、将获取到的数据，存入mongodb中技巧： 1、先通过chrome测试需要的内容，再修改为phatomjs 2、每次需要模拟操作之前，可以设置等待条件，等待加载完...

彭世瑜
发表于2021-08-13 23:14:00
3962 0 0

3.9k 0 0

# 项目简介：利用selenium爬取淘宝商品信息 """ 思路： 1、先打开浏览器，输入关键字，点击搜索，获取商品页总页数 2、通过遍历所有页面，获取商品页 3、获取页面的时候同时进行解析页面内容 4、将获取到的数据，存入mongodb中技巧： 1、先通过chrome测试需要的内容，再修改为phatomjs 2、每次需要模拟操作之前，可以设置等待条件，等待加载完...
Python Selenium
爬虫篇 | 快速入门selenium（十一）
如果爬虫不会Selenium 就不要说自己会爬虫 Selenium简介 Selenium是一个用于web自动化测试的工具，Selenium测试直接运行在浏览器中，就好像一个真正的用户在操作一样支持大部分主流的浏览器，包括IE(7,8,9,10,11)，Firefox，Safari，Chrome，Opera等。我们可以利用它来模拟用户点击访问网站，绕过一些复杂...

毛利
发表于2021-07-15 09:36:45
3357 0 0

3.3k 0 0

如果爬虫不会Selenium 就不要说自己会爬虫 Selenium简介 Selenium是一个用于web自动化测试的工具，Selenium测试直接运行在浏览器中，就好像一个真正的用户在操作一样支持大部分主流的浏览器，包括IE(7,8,9,10,11)，Firefox，Safari，Chrome，Opera等。我们可以利用它来模拟用户点击访问网站，绕过一些复杂...
Selenium
selenium容易忽视的知识点
关闭图片加载 from selenium import webdriver options = webdriver.ChromeOptions() options.add_experimental_option('prefs', {'profile.managed_default_content_settings.images': 2}) browser = web...

毛利
发表于2021-07-15 09:27:08
3333 0 0

3.3k 0 0

关闭图片加载 from selenium import webdriver options = webdriver.ChromeOptions() options.add_experimental_option('prefs', {'profile.managed_default_content_settings.images': 2}) browser = web...
Selenium
python下的自动化测试--selenium 验证码输入问题
背景之前一直在研究scrapy下数据抓取，在研究ajax数据抓取时碰巧研究了一下selenium，确实很实用，不过只做scrapy下的数据抓取，不怎么合适一是性能的损耗，一直需要开一个浏览器二是对于爬虫来说，分析ajax的请求才是正事好吧，说远了，今天来扯一下我对于自动化测试一些见解。 python下的自动化测试库实在之多，selenium是浏览器测试的大杀器，关...

~大鱼~
发表于2021-05-28 03:29:16
4662 0 0

4.6k 0 0

背景之前一直在研究scrapy下数据抓取，在研究ajax数据抓取时碰巧研究了一下selenium，确实很实用，不过只做scrapy下的数据抓取，不怎么合适一是性能的损耗，一直需要开一个浏览器二是对于爬虫来说，分析ajax的请求才是正事好吧，说远了，今天来扯一下我对于自动化测试一些见解。 python下的自动化测试库实在之多，selenium是浏览器测试的大杀器，关...
Python Selenium 自动化测试
[selenium-grid]多机分布式环境下的selenium集群
源起还是爬虫里面的某个场景需要重度使用selenium场景，所以需要起这样一个集群对比单机 docker docker-compose 分布式集群我们在使用selenium 的时候，我们一般就使用以上的环境和模式,单机怎么操作呢，下载相应的webdriver 单机对于小型的使用环境，比如单线程操作，我们直接下载好相应版本的driver ，直接安装 sele...

~大鱼~
发表于2021-05-27 16:34:04
4415 0 0

4.4k 0 0

源起还是爬虫里面的某个场景需要重度使用selenium场景，所以需要起这样一个集群对比单机 docker docker-compose 分布式集群我们在使用selenium 的时候，我们一般就使用以上的环境和模式,单机怎么操作呢，下载相应的webdriver 单机对于小型的使用环境，比如单线程操作，我们直接下载好相应版本的driver ，直接安装 sele...
Selenium 分布式
[python好库推荐] selenium-driver 自动安装
背景在新创建python环境之后，总是免不了要去找selenium-driver 二进制文件，然后安装相应的python selenium包，实在是太麻烦了，下面介绍一种省时省力的方法 pip install webdriver-manager 12 pip install webdriver-manager  使用以上命令安...

~大鱼~
发表于2021-05-27 02:04:48
4989 0 0

4.9k 0 0

背景在新创建python环境之后，总是免不了要去找selenium-driver 二进制文件，然后安装相应的python selenium包，实在是太麻烦了，下面介绍一种省时省力的方法 pip install webdriver-manager 12 pip install webdriver-manager  使用以上命令安...
Python Selenium
Selenium 项目代码的优化与重构之路，滚雪球学 Python 番外篇
今天是持续写作的第 31 / 100 天。如果你有想要交流的想法、技术，欢迎在评论区留言。本篇文章主要承接的是《用 Selenium 搞定自动化测试项目，途牛搜机票。》，本文将对其代码进行优化与重构。文章目录封装元素定位函数提炼函数到单独的文件中Selenium 代码异常补充知识点 `implicitly_wait()` 方...

梦想橡皮擦
发表于2021-05-26 17:35:36
6598 0 0

6.5k 0 0

今天是持续写作的第 31 / 100 天。如果你有想要交流的想法、技术，欢迎在评论区留言。本篇文章主要承接的是《用 Selenium 搞定自动化测试项目，途牛搜机票。》，本文将对其代码进行优化与重构。文章目录封装元素定位函数提炼函数到单独的文件中Selenium 代码异常补充知识点 `implicitly_wait()` 方...
Python Selenium

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript