Loading...
前言需求爬取‘国际海运网’的港口数据。页面分析可以看到,该页面布局为简单的线性表,目标信息位于标签\<table>中,没有ajax请求爬取思路分析前言提到,爬虫是以结果为导向的一种技术,无关乎技术栈的选择。既然目标信息位于简单的线性表中,所以考虑pandas 库中的read_html方法,理论上代码量和速度都会比使用requests库更好。有效url分析显然首页的/index并不...