www.qjdy.com-奇迹赌场 > www.qjdy.com官网 > 其中express是服务端框架

原标题:其中express是服务端框架

浏览次数:100 时间:2019-08-29

nodejs爬虫系统

中间express是服务端框架

request相当于前面贰个的ajax央求

cheerio相当于jq

 

 

开始

先是大家先新建一个 crawler目录

执行 npm install express -g 命令 和  npm install express-generator -g 命令

 

接着 cd crawler 进入crawler目录   执行 npm install request --save-dev  和  npm install cheerio --save-dev             

 

然后在大家的目录下创立express项目  直接命令行实践 express

OK 大家的种类目录形成那么些样子:

 

 

接下来

大家首先安装下项目标依赖性,执行 npm install 就OK

 

这那样我们的早先时代工作就办好了。

 

接着

我们开采app.js

咱俩来修改他。

如下:

 

 1 var express = require('express');

 2 var app = express();

 3 

 4 app.get('/', function(req, res) {

 5   res.send('hello express');

 6 });

 7 

 8 app.listen(3000, function() {

 9   console.log('listening on 3000');

10 });

 

终极实施 supervisor app.js

(注:supervisor是nodejs中监督进度用的。举个例子大家修改了app.js 那么supervisor就能够活动去重启那些文件,无需我们手动去node app.js,客商能够经过 npm install supervisor -g 来安装。那一个也是我们在nodejs开垦中常用到的八个工具)

 

OK。

作者们开荒127.0.0.1:三千

看样子页面上输出了 hello express。 一切平常

 

就下去大家看下request。大家去到npm 里面 request的官方网址

 

来看有关他的选拔,我们把它趴下来:

 

 

 

修改大家的app.js

 

 1 var express = require('express');
 2 var app = express();
 3 var request = require('request');
 4 
 5 app.get('/', function(req, res) {
 6   request('http://www.cnblogs.com/galenyip', function (error, response, body) {
 7     if (!error && response.statusCode == 200) {
 8       console.log(body);// Show the HTML for the Google homepage. 
 9       res.send('hello express');
10     }
11   });
12 });
13 
14 app.listen(3000, function() {
15   console.log('listening on 3000');
16 });

 

 

地点修改成自个儿的博客地址吧。来爬爬小编这一个博客

 

OK,刷新我们的页面。等一会,会看出终端打字与印刷出了html相关新闻。

 

 

 

接着,

 

咱俩用上 cheerio

 

在app.js中 大家就入 var cherrio = require('cherrio');

 

 1 var express = require('express');
 2 var app = express();
 3 var request = require('request');
 4 var cheerio = require('cheerio');
 5 
 6 app.get('/', function(req, res) {
 7   request('http://www.cnblogs.com/galenyip', function (error, response, body) {
 8     if (!error && response.statusCode == 200) {
 9       $ = cheerio.load(body); //拿到body,作为选择器
10     }
11   });
12 });
13 
14 app.listen(3000, function() {
15   console.log('listening on 3000');
16 });

 

 

与此同有时间,大家得以见到  cheerio.load(body)正是大家获得的页面,把它作为总的接纳器。

 

而后的,大家就能够像操作jq同样操作这么些页面了。

 

 

 

它的api跟jq很像,那那几个就不做牵线了

 

 

 

其实,大家的整整爬虫就基本上了。

 

剩下的正是看客们根据自身的急需,去抓取页面包车型地铁dom,筛选等等等等。。。。

其中express是服务端框架 request也正是前面三个的ajax乞求 cheerio相当于jq 最初 首先我们先新建一个crawler目录 施行 npm install expres...

本文由www.qjdy.com-奇迹赌场发布于www.qjdy.com官网,转载请注明出处:其中express是服务端框架

关键词: ag电子游戏

上一篇:毛爷爷说的好好天天向上

下一篇:没有了