Python爬链接爬虫怎么写？

idm.org.cn 行业资讯 2021-11-11 817 1

首先我们要清晰一点是，所有的网页我们能看到的不管是文字还是图片还是动画，都是以html标记的，然后浏览器把这些标记可视化的美观的展示给我们，如果我们要做网络爬虫，那么我们的爬虫是没有视觉的，只有逻辑，在爬虫眼里只有html标签，其他的样式在爬虫眼里都是浮云，所以爬虫其实就是读取html标签(这里涉及一个知识点就是要能得到html标签，需要用到一个库是request库，通过网络请求拿到html元素)，然后把html标签中自己想要的东西给提取出来，这个就是一个网络爬虫了。逻辑就这么简单。如果有python使用经验的，建议使用爬虫框架scrapy

Python爬链接爬虫怎么写？第1张