最近在寫(xiě)一個(gè)爬蟲(chóng),需要將網(wǎng)頁(yè)進(jìn)行解析供微信小程序使用。文字和圖片解析都好說(shuō),小程序也有對(duì)應(yīng)的text和image標(biāo)簽可以呈現(xiàn)。而更復(fù)雜的,比如表格,則比較棘手,不管是服務(wù)端解析還是小程序呈現(xiàn)都很費(fèi)勁,也很難覆蓋所有情況。于是我想,將表格對(duì)應(yīng)的HTML代碼轉(zhuǎn)成圖片,不失為一種變通的方法。
這里我們采用node-webshot模塊,它對(duì)PhantomJS進(jìn)行了輕量封裝,可以輕松地將網(wǎng)頁(yè)以截圖形式保存下來(lái)。
首先安裝Node.js和PhantomJS,然后新建一個(gè)js文件,加載node-webshot模塊:
const webshot = require('webshot');定義選項(xiàng):
const options = {// 瀏覽器窗口screenSize: {width: 755,height: 25},// 要截圖的頁(yè)面文檔區(qū)域shotSize: {height: 'all'},// 網(wǎng)頁(yè)類型siteType: 'html'};這里,瀏覽器窗口的寬度要根據(jù)網(wǎng)頁(yè)情況合理設(shè)置,高度可以設(shè)置為一個(gè)很小的數(shù)值,然后頁(yè)面文檔區(qū)域的高度一定要設(shè)置為all,寬度默認(rèn)為窗口寬度,這樣就可以把表格以最小的尺寸完整截圖。
接下來(lái),定義html字符串:
let html = "target rich text html code, eg: <table>...</table>";注意,里面的HTML代碼一定要去掉換行符,并將雙引號(hào)替換為單引號(hào)。
最后,截圖:
webshot(html, 'demo.png', options, (err) => {if (err)console.log(`Webshot error: ${err.message}`);});這樣,就實(shí)現(xiàn)了從HTML代碼到本地圖片的轉(zhuǎn)換,后續(xù)可以上傳到七牛云等。不管是服務(wù)端的解析,還是小程序的呈現(xiàn),都沒(méi)有什么難度了...
作者:林諾歐巴,來(lái)自原文地址 1.為了讓微信API能夠繞過(guò)CAS認(rèn)證檢查,將微信api入口部分設(shè)計(jì)為獨(dú)立的模塊。放入controller目錄下,命名為wechat。java文件為WechatController.java
文件大體內(nèi)容如下:
@Controller@RequestMapping("/wechat")public class WechatController {@RequestMapping(value="/dologin")public void dologin(HttpSession session,HttpServletRequest request, HttpServletResponse response)...}2.因?yàn)槔@過(guò)了CAS認(rèn)證,為了安全起見(jiàn),需要在這里做登陸檢查。 大體思路是在dologin成功之后,往session里面寫(xiě)一個(gè)標(biāo)記,比如寫(xiě)入用戶名session.setAtribute("username",username); 其他的服務(wù)接口在函數(shù)開(kāi)始的時(shí)候?qū)ession進(jìn)行檢查,session.get6Attribute("username");如果為空,表明沒(méi)有登陸。
3.修改web.xml文件的cas過(guò)濾條件。
<filter>....<init-param><param-name>ignorePattern</param-name><param-value>wechat</param-value></init-param></filter>