注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計程序設(shè)計綜合Storm實時數(shù)據(jù)處理

Storm實時數(shù)據(jù)處理

Storm實時數(shù)據(jù)處理

定 價:¥49.00

作 者: (澳)安德森(Quinton Anderson)著 盧譽聲 譯
出版社: 機械工業(yè)出版社
叢編項: 大數(shù)據(jù)技術(shù)叢書
標 簽: 編程語言與程序設(shè)計 計算機與互聯(lián)網(wǎng)

ISBN: 9787111466635 出版時間: 2014-06-01 包裝: 平裝
開本: 16開 頁數(shù): 191 字數(shù):  

內(nèi)容簡介

  在大數(shù)據(jù)領(lǐng)域,Hadoop無疑是最炙手可熱的技術(shù)。作為分布式系統(tǒng)架構(gòu),Hadoop具有高可靠性、高擴展性、高效性、高容錯性和低成本的優(yōu)點。然而隨著數(shù)據(jù)體積越來越大,實時處理能力成為了許多機構(gòu)需要面對的首要挑戰(zhàn)。Hadoop是一個批處理系統(tǒng),在實時計算處理方面顯得十分乏力。storm是一個類似于Hadoop勺實時數(shù)據(jù)處理框架,也是一個非常有效的開源實時計算工具,通常被比作“實時的Hadoop”?!洞髷?shù)據(jù)技術(shù)叢書:Storm實時數(shù)據(jù)處理》通過豐富的實例,系統(tǒng)講解Storm的基礎(chǔ)知識和實時數(shù)據(jù)處理的最佳實踐方法,內(nèi)容涵蓋Storm本地開發(fā)環(huán)境搭建、日志流數(shù)據(jù)處理、Trident、分布式遠程過程調(diào)用、Topology在不同編程語言中的實現(xiàn)方法、Storm與Hadoop的集成方法、實時機器學習、持續(xù)交付和如何在AWS上部署Storm。此外,《大數(shù)據(jù)技術(shù)叢書:Storm實時數(shù)據(jù)處理》旨在圍繞Storm技術(shù)促進DevOps實踐,使讀者能夠開發(fā)Storm解決方案,同時可靠地交付有價值的產(chǎn)品。《大數(shù)據(jù)技術(shù)叢書:Storm實時數(shù)據(jù)處理》適合想學習實時處理技術(shù)或者想通過Storm實現(xiàn)實時處理方法的開發(fā)者閱讀。

作者簡介

  Quinton Anderson,軟件工程師,專注實時計算系統(tǒng)開發(fā)。他在構(gòu)建防御系統(tǒng)的實時通信系統(tǒng),以及財務(wù)與銀行服務(wù)中的企業(yè)級應(yīng)用程序方面有豐富的經(jīng)驗。他熱衷于開源,是Storm社區(qū)的活躍分子,樂于交付各種基于Storm的解決方案。譯者簡介 盧譽聲,資深軟件開發(fā)工程師,現(xiàn)就職于思科系統(tǒng)(中國)研發(fā)中心云產(chǎn)品研發(fā)部。他曾參與多個項目協(xié)議級別定義、SDK及服務(wù)器后端和前端的設(shè)計與研發(fā),在下一代實時云計算協(xié)作平臺的研發(fā)過程中積累了豐富的敏捷實踐與開發(fā)經(jīng)驗。此外,他還從事C/C++開發(fā)工作,對Clojare、JavaScript、Lua,以及移動開發(fā)平臺等也有一定研究。

圖書目錄

譯者序
前言
第1章 搭建開發(fā)環(huán)境
1.1 簡介
1.2 搭建開發(fā)環(huán)境
1.3 分布式版本控制
1.4 創(chuàng)建“Hello World”Topology
1.5 創(chuàng)建Storm集群——配置機器
1.6 創(chuàng)建Storm集群——配置Storm
1.7 獲取基本的點擊率統(tǒng)計信息
1.8 對Bolt進行單元測試
1.9 實現(xiàn)集成測試
1.10 將產(chǎn)品部署到集群
第2章 日志流處理
2.1 簡介
2.2 創(chuàng)建日志代理
2.3 創(chuàng)建日志Spout
2.4 基于規(guī)則的日志流分析
2.5 索引與持久化日志數(shù)據(jù)
2.6 統(tǒng)計與持久化日志統(tǒng)計信息
2.7 為日志流集群創(chuàng)建集成測試
2.8 創(chuàng)建日志分析面板
第3章 使用Trident計算單詞重要度
3.1 簡介
3.2 使用Twitter過濾器創(chuàng)建URL流
3.3 從文件中獲取整潔的詞流
3.4 計算每個單詞的相對重要度
第4章 分布式遠程過程調(diào)用
4.1 簡介
4.2 通過DPRC實現(xiàn)所需處理流程
4.3 對Trident Topology進行集成測試
4.4 實現(xiàn)滾動窗口Topology
4.5 在集成測試中模擬時間
第5章 在不同語言中實現(xiàn)Topology
5.1 簡介
5.2 在Qt中實現(xiàn)多語言協(xié)議
5.3 在Qt中實現(xiàn)SplitSentence Bolt
5.4 在Ruby中實現(xiàn)計數(shù) Bolt
5.5 在Clojure中實現(xiàn)單詞計數(shù)Topology
第6章 Storm與Hadoop集成
6.1 簡介
6.2 在Hadoop中實現(xiàn)TF-IDF算法
6.3 持久化來自Storm的文件
6.4 集成批處理與實時視圖
第7章 實時機器學習
7.1 簡介
7.2 實現(xiàn)事務(wù)性Topology
7.3 在R中創(chuàng)建隨機森林分類模型
7.4 基于隨機森林的事務(wù)流業(yè)務(wù)分類
7.5 在R中創(chuàng)建關(guān)聯(lián)規(guī)則模型
7.6 創(chuàng)建推薦引擎
7.7 實時在線機器學習
第8章 持續(xù)交付
8.1 簡介
8.2 搭建CI服務(wù)器
8.3 搭建系統(tǒng)環(huán)境
8.4 定義交付流水線
8.5 實現(xiàn)自動化驗收測試
第9章 在AWS上部署Storm
9.1 簡介
9.2 使用Pallet在AWS上部署Storm
9.3  搭建虛擬私有云
9.4 使用Vagrant在虛擬私有云上部署Storm

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) hotzeplotz.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號