行业资讯
【正厚分享】Selenium简单工具介绍
2019-07-08

1.selenium抓取动态网页数据基础介绍

 

  1.1 什么是AJAX

  AJAX(Asynchronouse JavaScript And XML:异步JavaScript和XML)通过在后台与服务器进行少量数据交换,Ajax 可以使网页实现异步更新,这意味着可以在不重新加载整个网页的情况下,对网页的某部分进行局部更新。传统的网页(不使用Ajax)如果需要更新内容,必须重载整个网页页面。

  因为传统的网页在传输数据格式方面,使用的是XML语法,因此叫做AJAX,其实现在数据交互基本上都是使用JSON。使用AJAX加载的数据,即使使用了JS将数据渲染到了浏览器中,在右键->查看网页源代码还是不能看到通过ajax加载的数据,只能看到使用这个url加载的html代码。

 

  1.2 获取ajax数据的方式

  法1:直接分析ajax调用的接口。然后通过代码请求这个接口。

  法2:使用Selenium+chromedriver模拟浏览器行为获取数据。

 

  1.3 Selenium+chromedriver获取动态数据

  Selenium相当于是一个机器人。可以模拟人类在浏览器上的一些行为,自动处理浏览器上的一些行为,比如点击,填充数据,删除cookie等。chromedriver是一个驱动Chrome浏览器的驱动程序,使用他才可以驱动浏览器。当然针对不同的浏览器有不同的driver。以下列出了不同浏览器及其对应的driver:

  Chrome:https://sites.google.com/a/chromium.org/chromedriver/downloads

  Firefox:https://github.com/mozilla/geckodriver/releases

  Edge:https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/

  Safari:https://webkit.org/blog/6900/webdriver-support-in-safari-10/

 

 
 
 

咨询热线
预约试听:025-86665061
官方公众号:ZhenghouSoft
技术热线:025-86665061
联系地址
南京总部:南京市鼓楼区湖南路16号5楼
重庆中心:重庆市渝中区投资大厦6楼
武汉中心:江夏区光谷智慧园16栋
微信公众号
联系我们
咨询热线:025-86665061
友情链接
Copyright © 2018 专注软件测试培训、ISTQB考证、项目合作、Java开发-正厚软件官网,值得信赖;南京正厚软件 重庆正厚软件 成都正厚软件 武汉正厚软件官网 苏ICP备17057415号