主頁 > 知識庫 > PHP實現(xiàn)的抓取小說網(wǎng)站內(nèi)容功能示例

PHP實現(xiàn)的抓取小說網(wǎng)站內(nèi)容功能示例

熱門標(biāo)簽:外呼系統(tǒng)能給企業(yè)帶來哪些好處 百度地圖標(biāo)注偏差 電銷機器人問門薩維品牌my 余姚電話機器人 咸寧銷售電銷機器人系統(tǒng) 400電話蘭州申請請 廣東廣州在怎么申請400電話 百度地圖怎樣標(biāo)注圖標(biāo) 開發(fā)地圖標(biāo)注類網(wǎng)站

本文實例講述了PHP實現(xiàn)的抓取小說網(wǎng)站內(nèi)容功能。分享給大家供大家參考,具體如下:

爬取免費內(nèi)容,弄到手機,聽書,妥妥的。

ini_set('user_agent','Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30; GreenBrowser)');
ini_set('max_execution_time', '0');
$base = 'https://www.qu.la/book/19434/';
$start = '7504808.html';
$content_grep = '/nbsp;nbsp;nbsp;nbsp;(.*)br\/>/';
//$content_grep = '/div id="content">(.*)br\/>/sS';
$next_grep = '/a id="pager_next" href=\"(\d+\.html)\" target="_top" class="next">下一章\/a>/';
$next = $start;
$file_name = '聽書了.txt';
while($next) {
  echo 'getting ' . $next . PHP_EOL;
  $result = file_get_contents($base . $next);
  preg_match_all($content_grep, $result, $match);
  $isTitle = true;
  $content = "";
  foreach($match[1] as $line) {
    $line  = str_replace("br/>", '', $line);
    $line  = str_replace(" ", '', $line);
    if($isTitle) {
      $content = $line . PHP_EOL . PHP_EOL;
      $isTitle = false;
    } else {
      $content .= '    ' . $line . PHP_EOL . PHP_EOL;
    }
  }
  $file = fopen($file_name, 'a');
  echo 'write length: ' . strlen($content) . PHP_EOL;
  fwrite($file, $content);
  fclose($file);
  echo '.';
  preg_match($next_grep, $result, $match);
  $next = $match[1];
}

更多關(guān)于PHP相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《php socket用法總結(jié)》、《php字符串(string)用法總結(jié)》、《PHP數(shù)學(xué)運算技巧總結(jié)》、《php面向?qū)ο蟪绦蛟O(shè)計入門教程》、《PHP數(shù)組(Array)操作技巧大全》、《PHP數(shù)據(jù)結(jié)構(gòu)與算法教程》、《php程序設(shè)計算法總結(jié)》及《PHP網(wǎng)絡(luò)編程技巧總結(jié)》

希望本文所述對大家PHP程序設(shè)計有所幫助。

您可能感興趣的文章:
  • PHP 抓取新浪讀書頻道的小說并生成txt電子書的代碼
  • 使用PHP curl模擬瀏覽器抓取網(wǎng)站信息
  • php抓取并保存網(wǎng)站圖片的實現(xiàn)代碼
  • PHP抓取、分析國內(nèi)視頻網(wǎng)站的視頻信息工具類
  • php抓取網(wǎng)站圖片并保存的實現(xiàn)方法
  • thinkphp 抓取網(wǎng)站的內(nèi)容并且保存到本地的實例詳解
  • PHP封裝的遠程抓取網(wǎng)站圖片并保存功能類
  • php抓取頁面與代碼解析 推薦
  • PHP實現(xiàn)抓取HTTPS內(nèi)容
  • php抓取頁面的幾種方法詳解

標(biāo)簽:重慶 十堰 臨沂 鷹潭 麗江 巴彥淖爾 銅陵 衡陽

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《PHP實現(xiàn)的抓取小說網(wǎng)站內(nèi)容功能示例》,本文關(guān)鍵詞  PHP,實現(xiàn),的,抓取,小說,網(wǎng)站,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《PHP實現(xiàn)的抓取小說網(wǎng)站內(nèi)容功能示例》相關(guān)的同類信息!
  • 本頁收集關(guān)于PHP實現(xiàn)的抓取小說網(wǎng)站內(nèi)容功能示例的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章