2021-04-20 | PChome書店
Python網路爬蟲:大數據擷取、清洗、儲存與分析(王者歸來)
Python網路爬蟲:大數據擷取、清洗、儲存與分析(王者歸來)
作者:洪錦魁 出版社:深智數位 出版日期:2019-10-23 00:00:00
<內容簡介>
這是一本使用Python從零開始指導讀者的網路爬蟲入門書籍,全書以約350個程式實例,完整解說大數據擷取、清洗、儲存與分析相關知識,下列是本書有關網路爬蟲知識的主要內容。
認識搜尋引擎與網路爬蟲
認識約定成俗的協議robots.txt
從零開始解析HTML網頁
認識與使用Chrome開發人員環境解析網頁
認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
說明lxml模組
Selenium模組
XPath方法解說
css定位網頁元素
Cookie觀念
自動填寫表單
使用IP代理服務與實作
偵測IP
更進一步解說更新的模組Requests-HTML
認識適用大型爬蟲框架的Scrapy模組
在書籍內容,本書設計爬蟲程式探索下列相關網站,讀者可以由不同的網站主題,深入測試自己設計網路爬蟲的能力,以適應未來職場的需求。
金融資訊
股市數據
人力銀行
交友網站
維基網站
主流媒體網站
政府開放數據網站
社群服務網站
PTT網站
電影網站
星座網站
小說網站
台灣高鐵
露天拍賣網站
httpbin網站
python.org網站
github.com網站
ipstack.com網站API實作
Google API實作
Facebook API實作
探索網站成功後,本書也說明下列如何下載或儲存不同資料格式的數據。
CSV檔案格式
JSON檔案格式
XML、Pickle
Excel
SQLite資料庫
本書沿襲作者著作的特色,程
<作者簡介>
洪錦魁
一位跨越電腦作業系統與科技時代的電腦專家,著作等身的作家。
■ DOS 時代他的代表作品是 IBM PC 組合語言、C、C++、Pascal、資料結構。
■ Windows 時代他的代表作品是 Windows Programming 使用 C、Visual Basic。
■ Internet 時代他的代表作品是網頁設計使用 HTML。
■ 大數據時代他的代表作品是 R 語言邁向 Big Data 之路。
除了作品被翻譯為簡體中文、馬來西亞文外,2000 年作品更被翻譯為Mastering HTML 英文版行銷美國。
近年來作品則是在北京清華大學和台灣深智同步發行:
1:Java 入門邁向高手之路王者歸來
2:Python 入門邁向高手之路王者歸來
3:HTML5 + CSS3 王者歸來
4:R 語言邁向Big Data 之路
他的著作最大的特色是,所有程式語法會依特性分類,同時以實用的程式範例做解說,讓整本書淺顯易懂,讀者可以由他的著作事半功倍輕鬆掌握相關知識。
作者:洪錦魁 出版社:深智數位 出版日期:2019-10-23 00:00:00
<內容簡介>
這是一本使用Python從零開始指導讀者的網路爬蟲入門書籍,全書以約350個程式實例,完整解說大數據擷取、清洗、儲存與分析相關知識,下列是本書有關網路爬蟲知識的主要內容。
認識搜尋引擎與網路爬蟲
認識約定成俗的協議robots.txt
從零開始解析HTML網頁
認識與使用Chrome開發人員環境解析網頁
認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
說明lxml模組
Selenium模組
XPath方法解說
css定位網頁元素
Cookie觀念
自動填寫表單
使用IP代理服務與實作
偵測IP
更進一步解說更新的模組Requests-HTML
認識適用大型爬蟲框架的Scrapy模組
在書籍內容,本書設計爬蟲程式探索下列相關網站,讀者可以由不同的網站主題,深入測試自己設計網路爬蟲的能力,以適應未來職場的需求。
金融資訊
股市數據
人力銀行
交友網站
維基網站
主流媒體網站
政府開放數據網站
社群服務網站
PTT網站
電影網站
星座網站
小說網站
台灣高鐵
露天拍賣網站
httpbin網站
python.org網站
github.com網站
ipstack.com網站API實作
Google API實作
Facebook API實作
探索網站成功後,本書也說明下列如何下載或儲存不同資料格式的數據。
CSV檔案格式
JSON檔案格式
XML、Pickle
Excel
SQLite資料庫
本書沿襲作者著作的特色,程
<作者簡介>
洪錦魁
一位跨越電腦作業系統與科技時代的電腦專家,著作等身的作家。
■ DOS 時代他的代表作品是 IBM PC 組合語言、C、C++、Pascal、資料結構。
■ Windows 時代他的代表作品是 Windows Programming 使用 C、Visual Basic。
■ Internet 時代他的代表作品是網頁設計使用 HTML。
■ 大數據時代他的代表作品是 R 語言邁向 Big Data 之路。
除了作品被翻譯為簡體中文、馬來西亞文外,2000 年作品更被翻譯為Mastering HTML 英文版行銷美國。
近年來作品則是在北京清華大學和台灣深智同步發行:
1:Java 入門邁向高手之路王者歸來
2:Python 入門邁向高手之路王者歸來
3:HTML5 + CSS3 王者歸來
4:R 語言邁向Big Data 之路
他的著作最大的特色是,所有程式語法會依特性分類,同時以實用的程式範例做解說,讓整本書淺顯易懂,讀者可以由他的著作事半功倍輕鬆掌握相關知識。
最新科技新聞
-
iPhone 16到貨量Pro Max最少 透露蘋果拓市策略
(3 小時前) -
Gogoro人事大地震!陸學森辭任執行長 台灣總經理接任代理
(3 小時前) -
技術創新與經營轉型成果顯著 阿波羅電力成為TESLA Powerwall認證安裝廠商
(3 小時前) -
台積電鼓勵永續精神 助青年啟動行動力
(3 小時前) -
永續產品認準這個徽章 ClimeCo建立認證
(3 小時前)