앤 리 경량급 파충류 도구 node - crawler
https://node-crawler.readthedocs.io/zh_CN/latest/
실질 적
파충 류 는 웹 페이지 를 분석 하고 인 터 페 이 스 를 분석 하 며 원 하 는 데 이 터 를 얻 고 데 이 터 를 얻 는 데 두 가지 방식 이 있다.
var express = require("express");
var router = express.Router();
router.get("/", function(req, res, next) {
//
res.header("Access-Control-Allow-Origin", "*");
res.header("Access-Control-Allow-Headers", "X-Requested-With, Content-Type");
res.header("Access-Control-Allow-Methods", "PUT, GET, POST, DELETE, OPTIONS");
// ,
var type = req.query.type;
var page = req.query.page;
type = type || "weixin";
page = page || "1";
//
var superagent = require("superagent"); // , , ajax api
var charset = require("superagent-charset"); // ,
var cheerio = require("cheerio"); // , 、 、 jQuery
//
var baseUrl = "https://www.qqtn.com/";
var route = "tx/" + type + "tx_" + page + ".html";
charset(superagent);
superagent
.get(baseUrl + route)
.charset("gb2312")
.end(function(err, sres) {
var items = [];
if (err) {
console.log("err", err);
res.json({
code: 400,
msg: "err",
data: items
});
return;
}
//
var $ = cheerio.load(sres.text);
// jquery ,
$("div.g-main-bg ul.g-select-img li a").each(function(idx, element) {
var $element = $(element);
var $subElement = $element.find("img");
var $thumbImgSrc = $subElement.attr("src");
items.push({
title: $element.attr("title"),
href: $element.attr("href"),
thumbSrc: $thumbImgSrc
});
});
res.json({
code: 200,
msg: "success",
data: items
});
});
});
module.exports = router;
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Node.js를 AWS서버에서 사용하는 실습간단한 예제와 함께 AWS에서 Node.js를사용하는 법을 배워보도록 하겠다. 해당 github에 있는 레포지토리로 사용을 할 것이다. 3000번 포트로 Listen되는 예제이고 간단히 GET, POST, DELET...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.