Puppeteer 應用容器化 Intro Puppeteer是谷歌官方出品的一個通過DevTools協議控制headless Chrome的Node庫。可以通過Puppeteer的提供的api直接控制Chrome模擬大部分用戶操作來進行UI Test或者作為爬蟲訪問頁面來收集數據。 更多的介紹,可 ...
Puppeteer 應用容器化
Intro
Puppeteer是谷歌官方出品的一個通過DevTools協議控制headless Chrome的Node庫。可以通過Puppeteer的提供的api直接控制Chrome模擬大部分用戶操作來進行UI Test或者作為爬蟲訪問頁面來收集數據。
更多的介紹,可以參考這裡
項目中使用到了 Puppeteer 來做一些爬蟲項目,最後需要把應用容器化部署在 docker 上,於是就有了這篇文章。
自定義 docker image
谷歌官方還沒有推出一個官方的 docker 鏡像,Github上有一個 issue,有需要的話可以關註下,但是官方有一個 dockerfile 示例
於是自己在官方的 dockerfile 基礎上加以修改,製作了一個 image,docker hub 鏡像地址:https://hub.docker.com/r/weihanli/puppeteer/
Dockerfile 內容詳見: https://github.com/WeihanLi/docker-env/blob/master/docker-puppeteer/Dockerfile
怎麼使用
在 docker-compose 中使用
示例 docker-compose 文件:
version: '2' services: puppeteer-crawler: image: weihanli/puppeteer:latest container_name: puppeteer-crawler ports: - 10240:3000 volumes: - ./src:/app
我的項目結構是這樣的
- src (具體的項目代碼) Dockerfile docker-compose.yml
基於此鏡像構建新的鏡像
示例 Dockerfile:
FROM weihanli/puppeteer:latest COPY --chown=pptruser:pptruser ./src . EXPOSE 3000
這裡指定了
--chown=pptruser:pptruser
是因為官方建議不用使用 root 用戶,新建了一個 pptruser 的用戶組以及用戶,使用pptruser這個用戶去執行要執行的代碼,這裡是為了防止出現用戶許可權相關問題。
如果可以使用 docker-compose 的話,建議還是使用 docker-compose
docker 鏡像啟動之後預設執行的命令是 yarn start
,你只需要在 app 目錄下可以執行 npm run start
或者 yarn start
都是可以的,當然你也可以自定義要執行的命令來覆蓋預設的 Command
命令
Reference
End
最後如果你在考慮容器化一個 Puppeteer 應用,希望你可以使用這個鏡像,如果有什麼問題也歡迎和我聯繫,我會盡我所能去解決問題。