thinkphp 抓取網(wǎng)站的內(nèi)容并且保存到本地的實(shí)例詳解
hikphp抓取網(wǎng)站的內(nèi)容并且保存到本地的實(shí)例詳解我需要寫(xiě)這么一個(gè)例子,到電子課本網(wǎng)下載一本電子書(shū)。電子課本網(wǎng)的電子書(shū),是把書(shū)的每一頁(yè)當(dāng)成一個(gè)圖片,然后一本書(shū)就是有很多張圖片,我需要批量的進(jìn)行下載圖片操作。下面......
以下是【金聰采編】分享的內(nèi)容全文:
以下是【金聰采編】分享的內(nèi)容全文:
thinkphp 抓取網(wǎng)站的內(nèi)容并且保存到本地的實(shí)例詳解
我需要寫(xiě)這么一個(gè)例子,到電子課本網(wǎng)下載一本電子書(shū)。
電子課本網(wǎng)的電子書(shū),是把書(shū)的每一頁(yè)當(dāng)成一個(gè)圖片,然后一本書(shū)就是有很多張圖片,我需要批量的進(jìn)行下載圖片操作。
下面是代碼部分:
public function download() { $http = new /Org/Net/Http(); $url_pref = "http://www.dzkbw.com/books/rjb/dili/xc7s/"; $localUrl = "Public/bookcover/"; $reg="|showImg/('(.+)'/);|"; $i=1; do { $filename = substr("000".$i,-3).".htm"; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url_pref.$filename); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); $html = curl_exec($ch); curl_close($ch); $result = preg_match_all($reg,$html,$out, PREG_PATTERN_ORDER); if($result==1) { $picUrl = $out[1][0]; $picFilename = substr("000".$i,-3).".jpg"; $http->curlDownload($picUrl, $localUrl.$picFilename); } $i = $i+1; } while ($result==1); echo "下載完成"; }我這里是以人教版地理七年級(jí)地理上冊(cè)為例子 http://www.dzkbw.com/books/rjb/dili/xc7s/001.htm
網(wǎng)頁(yè)是從001.htm開(kāi)始,然后數(shù)字一直加
每個(gè)網(wǎng)頁(yè)里面都有一張圖,就是對(duì)應(yīng)課本的內(nèi)容,以圖片的形式展示課本內(nèi)容
我的代碼是做了一個(gè)循環(huán),從第一頁(yè)開(kāi)始抓,一直抓到找不到網(wǎng)頁(yè)里的圖片為止
抓到網(wǎng)頁(yè)的內(nèi)容后,把網(wǎng)頁(yè)里面的圖片抓取到本地服務(wù)器
抓取后的實(shí)際效果:

以上就是thinkphp 抓取網(wǎng)站的內(nèi)容并且保存到本地的實(shí)例詳解,如有疑問(wèn)請(qǐng)留言或者到本站社區(qū)交流討論,感謝閱讀,希望能幫助到大家,謝謝大家對(duì)本站的支持!

侵權(quán)舉報(bào)/版權(quán)申訴



