注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡行業(yè)軟件及應用Splunk大數(shù)據(jù)分析

Splunk大數(shù)據(jù)分析

Splunk大數(shù)據(jù)分析

定 價:¥69.00

作 者: (美)Peter Zadrozny ,Raghu Kodali 著
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 計算機與互聯(lián)網(wǎng) 數(shù)據(jù)庫

ISBN: 9787111464297 出版時間: 2014-05-01 包裝: 平裝
開本: 16開 頁數(shù): 字數(shù):  

內(nèi)容簡介

  絕大多數(shù)物理現(xiàn)象、人類活動都會記錄在各種媒介中,而隨著數(shù)字化的普及,這一切又都將轉化為數(shù)據(jù),人類正在從“卷宗”社會走向“數(shù)字”社會。尤其是近年來伴隨著智能終端、移動互聯(lián)網(wǎng)以及物聯(lián)網(wǎng)等信息技術的發(fā)展,數(shù)字社會中的數(shù)據(jù)無論是在類型還是規(guī)模方面都在飛速發(fā)展,大數(shù)據(jù)以一種迅疾的速度滲透到我們生活、工作的各個領域。據(jù)統(tǒng)計,目前全球被創(chuàng)建和復制的數(shù)據(jù)總量已超過2ZB(1021B),遠遠超過人類有史以來所有印刷材料的數(shù)據(jù)總量(約200PB)。想要從龐大的數(shù)據(jù)庫中提取有用的信息或知識,就離不開大數(shù)據(jù)分析技術和工具。有觀點認為,對于已經(jīng)顛覆或將要顛覆傳統(tǒng)行業(yè)的應用(如電子商務、互聯(lián)網(wǎng)金融、物聯(lián)網(wǎng)),其核心競爭力之一就是大規(guī)模的數(shù)據(jù)分析能力,也就是我們說的大數(shù)據(jù)能力。相比傳統(tǒng)數(shù)據(jù),大數(shù)據(jù)具有規(guī)模大、類型廣、時效高等特點,存儲和處理這些數(shù)據(jù)必須引入新的技術和機制。Splunk是一種典型的大數(shù)據(jù)處理工具,能夠非常高效地按時序對數(shù)據(jù)進行存儲、索引、訪問,已廣泛應用在多個領域。為此,本書全面系統(tǒng)地介紹了大數(shù)據(jù)挖掘工具Splunk,從數(shù)據(jù)導入、訪問、挖掘等角度系統(tǒng)介紹Splunk的原理和使用方式,以幫助讀者快速掌握Splunk。在過去幾個月中,黃琰、凡蕙銘、韓超、賴旦冉、何君、藍賢赟參與了部分翻譯,傅桔選、沈書毅、葉瑋成擔任了部分校審工作,在此感謝他們認真的態(tài)度和極大的耐心。當然,本書的翻譯工作得以順利完成,還要感謝機械工業(yè)出版社的編輯以及其他所有工作人員在各方面的支持和幫助。最后,對給予我們無私幫助的那些人致以誠摯的謝意。譯者水平有限,書中疏漏在所難免,敬請讀者批評指正。

作者簡介

  作者:(美國)扎德羅津尼(Peter Zadrozny) (美國)Raghu Kodali 譯者:唐宏 陳健 Peter Zadrozny,資深軟件技術專家,OpalliosS公司創(chuàng)始人兼首席技術官,專注于利用大數(shù)據(jù)和云技術為客戶提供有價值產(chǎn)品。Peter還是圣荷西州立大學大數(shù)據(jù)相關課程的講師。他曾先后在多家大中型公司擔任行政和技術職務,并主導在歐洲開啟webLogic和在墨西哥啟動sun微操作系統(tǒng)。他在J2EE和性能工程領域有多部非常成功的著作,并且是流行開源項目Grinder的最初貢獻者。

圖書目錄

譯者序
致謝
第1章 大數(shù)據(jù)和Splunk / 1
1.1 什么是大數(shù)據(jù) / 1
1.2 非傳統(tǒng)的數(shù)據(jù)處理技術 / 5
1.3 Splunk是什么 / 6
1.4 關于本書 / 7
第2章 將數(shù)據(jù)導入Splunk / 9
2.1 數(shù)據(jù)的多樣性 / 9
2.2 Splunk如何處理多樣化的數(shù)據(jù) / 10
2.2.1 文件和目錄 / 11
2.2.2 數(shù)據(jù)生成器 / 16
2.2.3 生成樣本數(shù)據(jù) / 17
2.2.4 網(wǎng)絡資源 / 21
2.2.5 Windows數(shù)據(jù) / 21
2.2.6 其他資源 / 21
2.3 應用程序和附加組件 / 21
2.4 轉發(fā)器 / 26
2.5 小結 / 27
第3章 處理和分析數(shù)據(jù) / 28
3.1 了解組合訪問日志數(shù)據(jù) / 28
3.2 搜索和分析索引數(shù)據(jù) / 29
3.3 報表 / 35
3.3.1 使用最多的瀏覽器 / 35
3.3.2 排名前五的IP地址 / 37
3.3.3 瀏覽量來源最多的網(wǎng)站 / 38
3.3.4 有多少404事件 / 40
3.3.5 有多少事件包含購買行為 / 42
3.3.6 列出購買的商品 / 42
3.4 排序 / 44
3.5 過濾 / 45
3.6 添加和評估字段 / 47
3.7 聚合 / 48
3.8 小結 / 54
第4章 結果的可視化 / 55
4.1 數(shù)據(jù)可視化 / 55
4.2 Splunk是怎樣處理可視化的 / 55
4.3 chart / 60
4.3.1 制作每一個主機的GET和POST事件數(shù)量的圖表 / 61
4.3.2 制作每一個產(chǎn)品類別的購買數(shù)和瀏覽數(shù)的圖表 / 62
4.3.3 哪個產(chǎn)品種類受HTTP 404錯誤的影響 / 63
4.3.4 MyGizmoStore.com的購買趨勢 / 64
4.3.5 事務持續(xù)時間 / 66
4.4 timechart / 67
4.4.1 最高購買數(shù)量的產(chǎn)品 / 67
4.4.2 頁面瀏覽率和購買量 / 68
4.5 使用Google Maps應用程序來可視化 / 69
4.6 Globe / 71
4.7 儀表盤 / 72
4.8 小結 / 80
第5章 定義警報 / 81
5.1 什么是警報 / 81
5.2 Splunk如何提供警報 / 81
5.2.1 基于商品銷售量的警報 / 82
5.2.2 登錄失敗的警報 / 84
5.2.3 日志文件中關鍵性錯誤的警報 / 87
5.3 小結 / 88
第6章 網(wǎng)站監(jiān)測 / 90
6.1 監(jiān)測網(wǎng)站 / 90
6.2 IT運作 / 91
6.2.1 主機訪問量 / 91
6.2.2 無內(nèi)部訪問的主機訪問量 / 91
6.2.3 HTTP請求成功的流量 / 93
6.2.4 HTTP請求未成功的流量 / 93
6.2.5 返回HTTP錯誤狀態(tài)碼最多的頁面 / 94
6.3 業(yè)務 / 96
6.3.1 區(qū)域用戶統(tǒng)計 / 96
6.3.2 跳出率 / 97
6.3.3 獨立訪問者數(shù)量 / 98
6.4 小結 / 103
第7章 使用日志文件創(chuàng)建高級分析 / 104
7.1 傳統(tǒng)的分析方法 / 104
7.2 范式變更 / 105
7.3 語義日志 / 106
7.4 日志最佳實踐 / 113
7.5 小結 / 115
第8章 航班準點率項目 / 116
小結 / 118
第9章 將航班數(shù)據(jù)導入Splunk / 119
9.1 處理CSV文件 / 119
9.1.1 航班數(shù)據(jù) / 119
9.1.2 下載數(shù)據(jù) / 120
9.1.3 了解航班數(shù)據(jù) / 121
9.1.4 關于時間戳 / 123
9.1.5 將字段映射成一個時間戳 / 124
9.1.6 對所有航班數(shù)據(jù)建立索引 / 131
9.2 從關系數(shù)據(jù)庫中索引數(shù)據(jù) / 132
9.2.1 定義一個新的數(shù)據(jù)庫連接 / 132
9.2.2 數(shù)據(jù)庫監(jiān)測 / 133
9.3 小結 / 136
第10章 分析航空公司、機場、航班和延遲 / 137
10.1 分析航空公司 / 137
10.1.1 計算航空公司的總數(shù) / 138
10.1.2 可視化結果 / 139
10.2 分析機場 / 143
10.3 分析航班 / 146
10.4 分析延遲 / 151
10.4.1 各航空公司航班延遲情況 / 151
10.4.2 各機場航班延遲的原因 / 152
10.4.3 冬天與夏天的航班延遲情況 / 155
10.5 創(chuàng)建和使用宏命令 / 157
10.6 報告加速 / 158
10.7 加速統(tǒng)計 / 161
10.8 小結 / 166
第11章 分析一個特定航班的歷年數(shù)據(jù) / 167
11.1 航空公司名稱 / 167
11.1.1 字段查找自動化 / 172
11.1.2 從搜索中創(chuàng)建查找表 / 173
11.2 United flight 871航班 / 174
11.3 小結 / 178
第12章 分析推文 / 179
12.1 開發(fā)樣本流 / 180
12.2 將推文加載到Splunk中 / 183
12.3 Twitter / 185
12.4 最流行的單詞 / 188
12.5 實時的Twitter趨勢 / 191
12.6 小結 / 196
第13章 分析Foursquare簽到信息 / 197
13.1 簽到信息格式 / 198
13.2 時區(qū)注意事項 / 202
13.3 裝載簽到數(shù)據(jù) / 203
13.4 分析簽到信息 / 205
13.4.1 星期日早午餐搜索 / 205
13.4.2 Google地圖和熱門地點 / 209
13.4.3 地點的簽到模式 / 211
13.4.4 地點的簽到數(shù)量 / 212
13.4.5 分析性別活動 / 214
13.5 小結 / 217
第14章 情感分析 / 218
14.1 意見、觀點、信仰、信念 / 218
14.2 商業(yè)用途 / 219
14.3 情感分析的技術性工作 / 220
14.4 情感分析應用程序 / 222
14.4.1 全局性的命令 / 223
14.4.2 挖掘情感 / 224
14.4.3 語言的處理 / 226
14.4.4 訓練數(shù)據(jù)和測試數(shù)據(jù) / 227
14.5 世界情緒指數(shù)項目 / 231
14.5.1 收集RSS摘要 / 232
14.5.2 將新聞標題索引到Splunk中 / 234
14.5.3 定義情感語料庫 / 237
14.5.4 對結果進行可視化 / 240
14.6 小結 / 242
第15章 遠程數(shù)據(jù)收集 / 243
15.1 轉發(fā)器 / 243
15.1.1 流行的拓撲結構 / 244
15.1.2 安裝轉發(fā)器 / 246
15.2 部署服務器 / 248
15.2.1 配置部署服務器 / 250
15.2.2 配置轉發(fā)器 / 251
15.3 部署監(jiān)控 / 252
15.4 小結 / 253
第16章 可擴展性和高可用性 / 254
16.1 擴展Splunk / 254
16.2 聚類 / 259
16.3 小結 / 264
附錄A Splunk的性能 / 265
附錄B 有用的Splunk應用程序 / 281"

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) hotzeplotz.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號