不用敲代码，5分钟教会你爬虫 _爬虫

文章插图

爬虫是什么？
相信大家对爬虫都不陌生，特别是做过网站的站长，这里也简单跟大家解释一下：
如果我们把互联网比作一张大的蜘蛛网，数据便是存放于蜘蛛网的各个节点，而爬虫就是一只小蜘蛛，
它会沿着网络抓取自己的猎物（数据）爬虫指的是：向网站发起请求，获取资源后分析并提取有用数据的程序；
从技术层面来说就是通过程序模拟浏览器请求站点的行为，把站点返回的html代码/JSON数据/二进制数据（图片、视频）爬到本地，进而提取自己需要的数据，存放起来使用。
举个栗子：
比如我的工作是新媒体小编，现在要学写作取标题，最简单的方式就是去目标公众号/网站等复制他们的标题到Excel来进行分析。
这样的傻瓜式操作很简单，但是效率很低，也很慢，而最高效的方式是什么呢？就是通过爬虫直接爬取我需要的标题，而这个过程仅仅需要1分钟。
废话不多说，跟我一起来操作吧。
01
准备工作
在你的浏览器安装：“webscraper”扩展，直接在浏览器应用市场下载即可，推荐使用chrome浏览器。

文章插图

安装好之后，启用它。
进入你要爬取数据的页面，以下我将以知乎来为大家举例。比如我要爬取知乎小管家的所有文章标题，那么就先进入到知乎小管家的文章页面。

文章插图

然后，按下键盘的F12，进入开发者工具。
当然有些浏览器不同，可能F12进入不了，你可以使用以下快捷键：
win：Ctrl+Shift+I
mac：Cmd+Opt+I, 或者 Tools / Developer tools
或者直接在页面按鼠标右键选择审查元素，或者是检查。比如我的是chrome浏览器，就是检查。
然后调出浏览器开发者工具。