注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)庫挖掘/數(shù)據(jù)倉庫New Internet:大數(shù)據(jù)挖掘

New Internet:大數(shù)據(jù)挖掘

New Internet:大數(shù)據(jù)挖掘

定 價:¥69.00

作 者: 譚磊 著
出版社: 電子工業(yè)出版社
叢編項:
標(biāo) 簽: 數(shù)據(jù)庫 計算機(jī)與互聯(lián)網(wǎng)

ISBN: 9787121196706 出版時間: 2013-03-01 包裝: 平裝
開本: 16開 頁數(shù): 376 字?jǐn)?shù):  

內(nèi)容簡介

  《New Internet:大數(shù)據(jù)挖掘》全面地介紹了如何使用數(shù)據(jù)挖掘技術(shù)從各種結(jié)構(gòu)的(數(shù)據(jù)庫)或非結(jié)構(gòu)(Web)的海量數(shù)據(jù)中提取和產(chǎn)生業(yè)務(wù)知識。作者梳理了各種數(shù)據(jù)挖掘常用算法和信息采集技術(shù),系統(tǒng)地描述了實際應(yīng)用時如何在互聯(lián)網(wǎng)日志分析、電子郵件營銷、互聯(lián)網(wǎng)廣告和電子商務(wù)上進(jìn)行數(shù)據(jù)挖掘,著重介紹了數(shù)據(jù)挖掘的原理和算法在互聯(lián)網(wǎng)海量數(shù)據(jù)挖掘中的應(yīng)用?!禢ew Internet:大數(shù)據(jù)挖掘》主要特點:全面介紹了數(shù)據(jù)挖掘和大數(shù)據(jù)的基本概念和技術(shù);大量采用了實際案例,實用性強(qiáng);詳細(xì)介紹了大數(shù)據(jù)挖掘領(lǐng)域最新的商業(yè)應(yīng)用。

作者簡介

  譚 磊復(fù)旦大學(xué)計算機(jī)學(xué)士,美國杜克大學(xué)計算機(jī)碩士,在美國微軟服務(wù)時間超過13年,曾經(jīng)擔(dān)任多家公司多個層級技術(shù)管理崗位,在搜索、互聯(lián)網(wǎng)廣告、數(shù)據(jù)挖掘、電子商務(wù)等方面有豐富的經(jīng)驗,是互聯(lián)網(wǎng)技術(shù)領(lǐng)域資深專家。

圖書目錄


第1章 緒論——從淘金客到礦山主
1.1 大數(shù)據(jù)時代的“四V”
1.2 什么是大數(shù)據(jù)挖掘
1.2.1 從數(shù)據(jù)分析到數(shù)據(jù)挖掘
1.2.2 Web挖掘
1.2.3 大數(shù)據(jù)挖掘之“大”
1.3 大數(shù)據(jù)挖掘的國內(nèi)外發(fā)展
1.3.1 數(shù)據(jù)挖掘的應(yīng)用發(fā)展
1.3.2 數(shù)據(jù)挖掘研究發(fā)展
1.4 本書內(nèi)容
第2章 一小時了解數(shù)據(jù)挖掘
2.1 數(shù)據(jù)挖掘是如何解決問題的
2.1.1 尿不濕和啤酒
2.1.2 Target和懷孕預(yù)測指數(shù)
2.1.3 電子商務(wù)網(wǎng)站流量分析
2.2 分類:從人臉識別系統(tǒng)說起
2.2.1 分類算法的應(yīng)用
2.2.2 數(shù)據(jù)挖掘分類技術(shù)
2.2.3 分類算法的評估
2.3 一切為了商業(yè)
2.3.1 什么是商業(yè)智能(Business Intelligence)
2.3.2 數(shù)據(jù)挖掘的九大定律
2.4 數(shù)據(jù)挖掘很糾結(jié)
2.5 數(shù)據(jù)挖掘的基本流程
2.5.1 數(shù)據(jù)挖掘的一般步驟
2.5.2 幾個數(shù)據(jù)挖掘中常用的概念
2.5.3 CRISP-DM
2.5.4 數(shù)據(jù)挖掘的評估
2.5.5 數(shù)據(jù)挖掘結(jié)果的知識表示
2.6 本章相關(guān)資源
第3章 數(shù)據(jù)倉庫——數(shù)據(jù)挖掘的基石
3.1 存放數(shù)據(jù)的倉庫
3.1.1 數(shù)據(jù)倉庫的定義
3.1.2 數(shù)據(jù)倉庫和數(shù)據(jù)庫
3.2 傳統(tǒng)的數(shù)據(jù)倉庫介紹
3.3 數(shù)據(jù)倉庫基本結(jié)構(gòu)
3.4 OLAP聯(lián)機(jī)分析處理
3.5 云存儲上的數(shù)據(jù)倉庫
3.5.1 Google公司的云架構(gòu)
3.5.2 開源的分布式系統(tǒng)Hadoop
3.5.3 Facebook的數(shù)據(jù)倉庫
3.5.4 NoSQL
3.6 本章相關(guān)資源
第4章 數(shù)據(jù)挖掘算法及原理
4.1 數(shù)據(jù)挖掘中的算法
4.2 數(shù)據(jù)挖掘十大經(jīng)典算法
4.3 分類算法(Classification)
4.4 聚類算法(Clustering)
4.5 關(guān)聯(lián)算法
4.5.1 關(guān)聯(lián)算法中的概念
4.5.2 關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘過程
4.5.3 關(guān)聯(lián)規(guī)則的分類
4.5.4 Apriori算法的執(zhí)行實例
4.5.5 關(guān)聯(lián)規(guī)則挖掘算法的研究與優(yōu)化
4.6 序列挖掘(Sequence Mining)
4.7 數(shù)據(jù)挖掘建模語言PMML
4.8 本章相關(guān)資源
第5章 在進(jìn)行數(shù)據(jù)挖掘之前
5.1 數(shù)據(jù)集成
5.2 為何要做數(shù)據(jù)預(yù)處理
5.3 數(shù)據(jù)預(yù)處理
5.3.1 數(shù)據(jù)清理
5.3.2 數(shù)據(jù)轉(zhuǎn)換
5.3.3 數(shù)據(jù)規(guī)約
5.4 本章相關(guān)資源
第6章 R語言和其他數(shù)據(jù)挖掘工具
6.1 R語言的歷史
6.1.1 R語言的特點
6.1.2 R語言和數(shù)據(jù)挖掘
6.2 其他數(shù)據(jù)挖掘工具
6.2.1 MATLAB
6.2.2 其他商用數(shù)據(jù)挖掘工具
6.2.3 開源數(shù)據(jù)挖掘工具Weka
6.3 數(shù)據(jù)挖掘和云
6.4 本章相關(guān)資源
第7章 互聯(lián)網(wǎng)上的日志分析
7.1 網(wǎng)站日志簡介
7.2 網(wǎng)站日志處理
7.2.1 Web日志預(yù)處理
7.2.2 Web日志分析和數(shù)據(jù)挖掘
7.3 郵件日志
7.4 本章相關(guān)資源
第8章 數(shù)據(jù)挖掘和電子郵件
8.1 郵件營銷與垃圾郵件過濾
8.2 數(shù)據(jù)挖掘和郵件營銷
8.2.1 如何有效地進(jìn)行郵件營銷
8.2.2 郵件營銷案例分享之一
8.2.3 郵件營銷案例分享之二
8.2.4 運用數(shù)據(jù)挖掘RFM模型提高郵件營銷效果
8.3 數(shù)據(jù)挖掘和垃圾郵件過濾
8.3.1 垃圾郵件
8.3.2 垃圾郵件過濾技術(shù)
8.3.3 垃圾郵件過濾案例
8.4 本章相關(guān)資源
第9章 數(shù)據(jù)挖掘和互聯(lián)網(wǎng)廣告
9.1 互聯(lián)網(wǎng)廣告
9.2 廣告作弊行為
9.3 網(wǎng)站聯(lián)盟廣告
9.4 網(wǎng)站聯(lián)盟廣告上的數(shù)據(jù)挖掘
9.4.1 數(shù)據(jù)助力網(wǎng)盟廣告
9.4.2 如何應(yīng)對網(wǎng)盟廣告作弊
9.5 本章相關(guān)資源
第10章 數(shù)據(jù)挖掘和電子商務(wù)
10.1 中國電子商務(wù)現(xiàn)狀
10.2 在互聯(lián)網(wǎng)上賣米
10.3 用數(shù)據(jù)來掌握客戶
10.3.1 客戶何時來、從哪來
10.3.2 客戶最喜歡哪種商品
10.3.3 競爭與反競爭分析
10.3.4 客戶還會買什么
10.3.5 哪些客戶是我們需要的
10.4 電子商務(wù)案例
10.4.1 電子商務(wù)企業(yè)案例一
10.4.2 電子商務(wù)企業(yè)案例二
10.5 本章相關(guān)資源
第11章 數(shù)據(jù)挖掘和Web挖掘
11.1 互聯(lián)網(wǎng)上的個性化–Like
11.1.1 Like=像
11.1.2 Like=喜歡
11.2 Web挖掘和SNS
11.2.1 SNS上的數(shù)據(jù)價值
11.2.2 SNS上的數(shù)據(jù)關(guān)聯(lián)關(guān)系
11.2.3 SNS上的用戶關(guān)系
11.3 數(shù)據(jù)挖掘和隱私
11.4 本章相關(guān)資源
第12章 數(shù)據(jù)挖掘和移動互聯(lián)網(wǎng)
12.1 移動互聯(lián)網(wǎng)的特殊性
12.1.1 鎖定用戶的數(shù)據(jù)價值
12.1.2 移動互聯(lián)網(wǎng)上數(shù)據(jù)的形式
12.1.3 移動互聯(lián)網(wǎng)地理位置信息的價值
12.2 數(shù)據(jù)挖掘和LBS
12.2.1 用PU學(xué)習(xí)算法做文本挖掘
12.2.2 用相似匹配算法做地點挖掘
12.3 移動互聯(lián)網(wǎng)數(shù)據(jù)面臨的問題
12.4 本章相關(guān)資源
附錄1 技術(shù)詞匯表
附錄2 英語參考文獻(xiàn)表
附錄3 中文參考文獻(xiàn)表
附錄4 微博
附錄5 博客和其他網(wǎng)址

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) hotzeplotz.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號