본문 바로가기

# 미사용

Chrome Headless Driver

웹브라우저의 기능 그대로

Puppteer은 구글 크롬 개발진에서 배포한 node.js용 크롬 웹드라이버 모듈이다.

실제로 크롬엔진으로 웹페이지를 열어 작업하기 때문에 스크린샷, 동적 웹페이지 파싱이 가능하다.


설치방법

npm install puppteer


API

기본적인 사용방법 및 기타 API는 Puppeteer API 명세서를 확인하기 바란다.


동적 웹페이지 파싱

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
const puppeteer = require('puppeteer');
 
let scrape = async () => {
    const browser = await puppeteer.launch({headless: true});
    const page = await browser.newPage();
    await page.goto('write your website.');
    //! 자바스크립트로 인한 동적 웹페이지가 완전히 로드되도록 충분히 기다린다.
    await page.waitFor(5000);
    const result = await page.evaluate(() => {
        //! 웹페이지에서 실행시킬 자바스크립트.
        let resultList = [ ];
        document
            .querySelectorAll('write your css selector.')
            .forEach((item)=>
            {
                resultList.push(item.innerHTML);
            });
        return resultList;
    });
    browser.close();
    return result;
};
scrape().then((value) => {
    console.log(value); // Success!
});
 
cs


'# 미사용' 카테고리의 다른 글

쿠키 세션 다루기  (0) 2018.02.25
라우터 다루기  (0) 2018.02.25
익스프레스 알아보기  (0) 2018.02.23
웹서버 시작하기  (0) 2018.02.12
파일 입출력 다루기  (0) 2018.02.10