提问题
提建议
网页数据爬取有吗
不会呀,比如证券网站的公开信息,本来就是不限制下载的
使用道具 赞 举报
下载不限制,遵循Robots协议没啥大问题,但是不遵循 爬取就可以被定义为违法,抓不抓看爬取的网站懒不懒的搭理(当然还有其他的 尽量看网站发布的爬取协议。。。。。。)。 想玩的话,可以在数据挖掘里面自己写python代码。 不过一般这类爬取的都是单独的代码程序,不会放在某个系统里面,而且为了效率单个网页会定单独的库而不是全库,也会定期去规避反扒机制。
本版积分规则 发表回复 回帖后跳转到最后一页
思迈特十三周年庆活动
免费