庫存狀況
「香港二樓書店」讓您 愛上二樓●愛上書
我的購物車 加入會員 會員中心 常見問題 首頁
「香港二樓書店」邁向第一華人書店
登入 客戶評價 whatsapp 常見問題 加入會員 會員專區 現貨書籍 現貨書籍 購物流程 運費計算 我的購物車 聯絡我們 返回首頁
香港二樓書店 > 今日好書推介
   
二樓書籍分類
 
爬蟲在手 資料我有:7堂課學會高效率Scrapy爬蟲(iT邦幫忙鐵人賽系列書)

爬蟲在手

沒有庫存
訂購需時10-14天
9789864347438
簡學群
博碩
2021年3月31日
150.00  元
HK$ 127.5  






ISBN:9789864347438
  • 規格:平裝 / 224頁 / 17 x 23 x 1.4 cm / 普通級 / 單色印刷 / 初版
  • 出版地:台灣


  • 電腦資訊 > 程式設計 > SQL

















    由淺入深了解Scrapy爬蟲框架,讓你從零開始建立高效率爬蟲!



      ◆自學網路爬蟲沒問題,手把手教學讓你無痛上手

      ◆完整的網路爬蟲和Scrapy知識,資料取得更輕鬆

      ◆學會各種套件和實作範例,讓你的爬蟲比別人更有效率




      本書內容改編自第11屆iT邦幫忙鐵人賽的AI & Data組優選網路系列文章─《爬蟲在手、資料我有 - 30 天 Scrapy 爬蟲實戰》。在AI的大時代中,「資料來源」是基礎中的基礎,但網路上的資料豐富又繁雜,總不可能都靠人工來蒐集資料。這時就是爬蟲出場的時候了!本書會帶讀者了解爬蟲的基礎知識,克服爬蟲常見的問題,最後可以寫出維護成本低、執行效率高的爬蟲程式。



    四大重點



      ★初學者必備的爬蟲指南,大大降低你的學習門檻


      網路爬蟲妙計已為你爬取完成!從安裝環境、認識架構、資料儲存、除錯到各類型網站實作,本書將一步步帶你學會網路爬蟲。



      ★全面解析各種知識,爬蟲能力再提升

      不只教你如何進行網路爬蟲,還要帶你深入Scrapy架構,並特別介紹NoSQL、反反爬蟲。提升你的爬蟲技能,擁有越級打怪的神力。



      ★活用各種套件,打造高效率爬蟲

      本書將手把手帶你活用各種套件,並從範例中學會撰寫精簡有效的程式碼,讓你克服問題、達成任務,邁向高效率的資料取得之路。



      ★爬取資料生活化,就像抓寶一樣好玩有趣!

      你會學到如何抓取PTT、Mobile01、新聞網站、股市網站資料,你想要的各種資料都能輕鬆取得。



      【下載範例程式檔案】

      本書範例檔下載網址:github.com/rex-chien/ithome-scrapy

    ?


     





    前言

    目錄



    第1章 基礎知識

    1.1 安裝開發環境

    1.2 網路資料常見的格式

    ?

    第2章 爬蟲基礎

    2.1 剖析來源資料

    2.2 從網路上取得資料

    ?

    第3章 基礎實戰–蒐集iThelp 文章資料

    3.1 列表頁

    3.2 換頁

    3.3 內文

    3.4 文章資訊

    3.5 回文

    ?

    第4章 資料持久化


    4.1 PostgreSQL

    4.2 NoSQL

    ?

    第5章 進階爬蟲

    5.1 反反爬蟲

    5.2 練習其他網站

    ?

    第6章 Scrapy 基礎

    6.1 Scrapy 架構

    6.2 開發環境

    6.3 實作Scrapy爬蟲

    6.4 Scrapy的結構化資料-Item

    6.5 在Scrapy中處理爬取結果-Item Pipelines

    6.6 在Scrapy中處理請求和回應-Downloader Middlewares

    6.7 Scrapy的設定

    6.8 在Scrapy中操作瀏覽器

    6.9 Scrapy的日誌

    6.10 蒐集Scrapy的統計資訊

    6.11 發送電子郵件

    ?

    第7章 實戰Scrapy

    7.1 Item Pipelines應用-儲存資料到 MongoDB

    7.2 在程式中啟動Scrapy爬蟲

    7.3 iThelp 的Scrapy 爬蟲

    7.4 中央社新聞的Scrapy 爬蟲

    7.5 PTT 的Scrapy 爬蟲

    7.6 相同剖析邏輯的多個資料來源




    其 他 著 作