注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)網(wǎng)絡(luò)與數(shù)據(jù)通信網(wǎng)絡(luò)服務(wù)SAS數(shù)據(jù)挖掘與分析項(xiàng)目實(shí)戰(zhàn)

SAS數(shù)據(jù)挖掘與分析項(xiàng)目實(shí)戰(zhàn)

SAS數(shù)據(jù)挖掘與分析項(xiàng)目實(shí)戰(zhàn)

定 價(jià):¥79.80

作 者: 尚濤 著
出版社: 中國(guó)鐵道出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787113268503 出版時(shí)間: 2020-08-01 包裝: 平裝
開本: 16開 頁數(shù): 336 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書講述了在實(shí)際運(yùn)營(yíng)中核心的數(shù)據(jù)挖掘分析案例,為讀者重點(diǎn)展示了SAS在精準(zhǔn)營(yíng)銷、客戶流失預(yù)警、客戶分群、廣告點(diǎn)擊、信用卡欺詐、信用風(fēng)險(xiǎn)評(píng)分等領(lǐng)域中的具體應(yīng)用。 本書分為16章,以數(shù)據(jù)挖掘基礎(chǔ)知識(shí)介紹開始,循序漸進(jìn)地講述了Kaggle數(shù)據(jù)科學(xué)社區(qū)調(diào)查數(shù)據(jù)分析、考察汽車耗油量與里程數(shù)的關(guān)系分析、影響汽車銷售的關(guān)鍵因子分析、健身運(yùn)動(dòng)中耗氧量回歸分析、旅客量預(yù)測(cè)分析、客戶群分類判別分析、銷售公司的客戶分群、員工離職預(yù)測(cè)、廣告點(diǎn)擊率預(yù)測(cè)、產(chǎn)品精準(zhǔn)營(yíng)銷模型、電信客戶流失預(yù)警、銀行貸款用戶風(fēng)險(xiǎn)分析、信用風(fēng)險(xiǎn)評(píng)分卡的開發(fā)以及信用卡反欺詐預(yù)測(cè)模型等案例。后一章介紹了與數(shù)據(jù)挖掘項(xiàng)目中的時(shí)間成本有較大關(guān)系的SAS數(shù)據(jù)清洗的相關(guān)技術(shù)。 本書案例豐富,實(shí)用性較強(qiáng),特別適合從事數(shù)據(jù)挖掘、統(tǒng)計(jì)建模、機(jī)器學(xué)習(xí)、商業(yè)分析、運(yùn)營(yíng)分析等工作的人員使用,也可作為數(shù)學(xué)、統(tǒng)計(jì)學(xué)、金融管理、計(jì)算機(jī)等專業(yè)的學(xué)生學(xué)習(xí)SAS數(shù)據(jù)挖掘應(yīng)用的參考書籍。

作者簡(jiǎn)介

  尚濤,畢業(yè)于上海交通大學(xué)數(shù)學(xué)系,擁有數(shù)學(xué)專業(yè)碩士學(xué)位,研究方向?yàn)閿?shù)據(jù)挖掘及機(jī)器學(xué)習(xí)領(lǐng)域,曾任職于支付平臺(tái)、平安科技、易方達(dá)基金,現(xiàn)任職于南方基金,專注于信用風(fēng)險(xiǎn)評(píng)分、精準(zhǔn)營(yíng)銷、推薦系統(tǒng)、文本挖掘等領(lǐng)域數(shù)據(jù)挖掘項(xiàng)目的研發(fā)工作以及企業(yè)的數(shù)據(jù)化運(yùn)營(yíng)落地工作,擁有超過10年數(shù)據(jù)挖掘和優(yōu)化建模的經(jīng)驗(yàn),以及多年使用SPSS、SAS、R、Python等建模軟件的經(jīng)驗(yàn)。在從業(yè)經(jīng)歷中,多次為所在公司的業(yè)務(wù)方提供數(shù)據(jù)挖掘技術(shù)服務(wù),成功實(shí)施了眾多深受好評(píng)的數(shù)據(jù)挖掘項(xiàng)目,取得了較好的業(yè)務(wù)價(jià)值。

圖書目錄

第1章數(shù)據(jù)挖掘知識(shí)介紹
11數(shù)據(jù)挖掘算法簡(jiǎn)介
111分類
112聚類
113關(guān)聯(lián)
114預(yù)測(cè)
12分類模型的相關(guān)概念
121數(shù)據(jù)說明
122混淆矩陣
123ROC曲線和AUC面積
124提升(Lift)
125KS曲線
13數(shù)據(jù)挖掘過程中關(guān)鍵問題處理
131數(shù)據(jù)準(zhǔn)備
132定義變量及數(shù)據(jù)抽樣
133變量選擇
134缺失值處理
135模型比較
14SAS STAT介紹

第2章Kaggle數(shù)據(jù)科學(xué)社區(qū)調(diào)查分析
21描述性統(tǒng)計(jì)分析的主要內(nèi)容
211數(shù)據(jù)的頻數(shù)分析
212數(shù)據(jù)的集中趨勢(shì)分析
213數(shù)據(jù)的離散程度分析
214數(shù)據(jù)的分布
215繪制統(tǒng)計(jì)圖
22SAS描述性分析過程介紹
221PROC FREQ過程
222PROC MEANS過程
223PROC UNIVARIATE過程
23調(diào)查數(shù)據(jù)說明
24數(shù)據(jù)探索
25Kaggle社區(qū)用戶畫像分析
251人員屬性
252工作屬性
253技能屬性
254學(xué)習(xí)屬性

第3章考察汽車耗油量與里程數(shù)的關(guān)系
31項(xiàng)目背景
32非線性回歸簡(jiǎn)介
33非線性回歸過程說明
34廣義線性模型過程
35數(shù)據(jù)文件說明
36數(shù)據(jù)探索
37模型建立
38結(jié)果分析

第4章影響汽車銷售的關(guān)鍵因子分析
41數(shù)據(jù)說明
42因子分析的基本原理
421因子分析模型
422因子旋轉(zhuǎn)
423計(jì)算因子得分
43因子分析的步驟和SAS過程
431因子分析的步驟
432FACTOR過程說明
44模型開發(fā)及結(jié)果解釋
45主成分分析和因子分析的區(qū)別

第5章健身運(yùn)動(dòng)中耗氧量回歸分析
51線性回歸模型
52REG過程
521過程選項(xiàng)
522MODEL語句選項(xiàng)
523關(guān)鍵字選項(xiàng)
524PLOT語句選項(xiàng)
53數(shù)據(jù)說明
54相關(guān)性分析
55回歸分析
56逐步回歸
561逐步回歸過程
562利用逐步回歸選擇變量

第6章旅客量預(yù)測(cè)分析
61項(xiàng)目背景
62數(shù)據(jù)文件說明
63平穩(wěn)隨機(jī)過程概述
631自回歸模型
632滑動(dòng)平均模型
633自回歸滑動(dòng)平均模型
64ARMA模型的識(shí)別
641基于相關(guān)函數(shù)的定階方法
642利用信息準(zhǔn)則法定階
65模型參數(shù)的估計(jì)
66時(shí)間序列的分析步驟
67SAS系統(tǒng)的ARIMA過程
671ARIMA語句選項(xiàng)
672IDENTIFY語句選項(xiàng)
673ESTIMATE語句選項(xiàng)
674FORECAST語句選項(xiàng)
675ARIMA建模過程
68數(shù)據(jù)探索
681平穩(wěn)性檢驗(yàn)
682序列變換
69自相關(guān)函數(shù)檢驗(yàn)
610模型參數(shù)估計(jì)
611預(yù)測(cè)

第7章客戶群分類判別分析
71業(yè)務(wù)背景及數(shù)據(jù)說明
72判別分析的數(shù)學(xué)原理
73判別分析的SAS過程
731DISCRIM過程
732CANDISC過程
733STEPDISC過程
74數(shù)據(jù)探索
75客戶群判別模型建立
76模型應(yīng)用

第8章銷售公司的客戶分群分析
81項(xiàng)目背景
811客戶細(xì)分的概念
812客戶細(xì)分模型
813客戶細(xì)分模型的基本流程
814細(xì)分方法介紹
82聚類分析的數(shù)學(xué)原理
821聚類的數(shù)學(xué)原理
822距離和相似距離
823聚類方法
824聚類數(shù)的確定
825聚類分析步驟
83SAS中的聚類過程
831Cluster系統(tǒng)聚類過程
832Fastclus快速聚類過程
833Varclus方差聚類過程
834Tree聚類樹型輸出過程
84數(shù)據(jù)文件說明
85數(shù)據(jù)探索
851變量衍生
852變量標(biāo)準(zhǔn)化
853變量相關(guān)性分析
86模型建立
87客戶畫像分析
88模型應(yīng)用

第9章員工離職預(yù)測(cè)
91項(xiàng)目背景
92數(shù)據(jù)說明
93數(shù)據(jù)探索
94數(shù)據(jù)建模
941變量相關(guān)分析
942決策樹建模
95模型評(píng)估與應(yīng)用

第10章廣告點(diǎn)擊率預(yù)測(cè)
101業(yè)務(wù)背景
1011網(wǎng)絡(luò)廣告發(fā)展情況
1012計(jì)算廣告學(xué)
102數(shù)據(jù)說明
103數(shù)據(jù)不平衡的處理方式
1031收集更多的數(shù)據(jù)
1032改變模型性能評(píng)價(jià)指標(biāo)
1033重新對(duì)樣本進(jìn)行采樣
104模型開發(fā)與評(píng)估
1041樣本欠抽樣
1042模型開發(fā)
1043模型評(píng)估
105CTR模型的發(fā)展脈絡(luò)

第11章產(chǎn)品精準(zhǔn)營(yíng)銷推薦
111項(xiàng)目背景
1111業(yè)務(wù)背景
1112數(shù)據(jù)說明
1113項(xiàng)目目標(biāo)
112數(shù)據(jù)探索
1121變量描述性統(tǒng)計(jì)分析
1122變量缺失值處理
1123變量衍生處理
113模型建設(shè)
1131欠抽樣
1132數(shù)據(jù)集分割
1133模型開發(fā)
1134模型評(píng)估
114模型應(yīng)用
1141產(chǎn)品自動(dòng)化推薦系統(tǒng)
1142易受到市場(chǎng)環(huán)境等各種因素的影響
1143人群特征漂移需要不斷優(yōu)化模型

第12章通信客戶流失預(yù)警模型
121項(xiàng)目背景
1211客戶流失分析要解決的問題
1212分析客戶流失的類型
1213如何進(jìn)行客戶流失分析
122數(shù)據(jù)說明
123因變量定義
124樣本抽取
125數(shù)據(jù)探索
126模型開發(fā)
1261變量衍生
1262變量選擇
1263相關(guān)性處理
1264模型結(jié)果
127模型評(píng)估
1271開發(fā)樣本上的模型性能
1272驗(yàn)證樣本上的模型性能
128模型應(yīng)用

第13章銀行貸款用戶風(fēng)險(xiǎn)分析
131案例背景
132因變量定義
133樣本抽取
134數(shù)據(jù)探索
1341為什么要進(jìn)行數(shù)據(jù)探索
1342數(shù)據(jù)分布情況
135模型建設(shè)
1351變量衍生
1352變量選擇
1353共線性處理
1354模型結(jié)果
136模型性能評(píng)估
1361開發(fā)樣本上的模型性能
1362驗(yàn)證樣本上的模型性能
137模型應(yīng)用

第14章信用風(fēng)險(xiǎn)評(píng)分卡開發(fā)
141信用評(píng)分模型簡(jiǎn)介
142信用卡模型的開發(fā)過程
143案例背景及項(xiàng)目目標(biāo)確定
1431項(xiàng)目背景說明
1432確定項(xiàng)目目標(biāo)
144數(shù)據(jù)獲取
145數(shù)據(jù)質(zhì)量檢驗(yàn)
146項(xiàng)目參數(shù)設(shè)定
1461排除規(guī)則確定
1462表現(xiàn)和觀察窗口
1463確定“壞”的定義
1464滾動(dòng)率分析
1465客戶分群
147數(shù)據(jù)探索
1471數(shù)據(jù)分布分析
1472缺失值的處理
1473極端值的處理
148模型開發(fā)
1481證據(jù)權(quán)重(WOE)
1482信息值(IV)
1483變量選擇
1484變量分組
1485變量相關(guān)性分析
1486模型迭代開發(fā)
149模型評(píng)估
1491混淆矩陣
1492KS統(tǒng)計(jì)量
1493ROC曲線
1410評(píng)分卡創(chuàng)建
14101評(píng)分尺度變換
14102變量分值分配
1411評(píng)分卡實(shí)施
1412監(jiān)測(cè)與報(bào)告
1413拒絕推斷
1414運(yùn)用評(píng)分卡需要注意的事項(xiàng)

第15章信用卡反欺詐預(yù)測(cè)模型
151信用卡欺詐概述
1511信用卡欺詐的種類
1512智能反欺詐管理
1513其他反欺詐技術(shù)
152案例背景
153數(shù)據(jù)探索
154模型開發(fā)
1541不使用分層抽樣策略
1542使用分層抽樣策略
155總結(jié)

第16章SAS數(shù)據(jù)清洗技術(shù)
161數(shù)據(jù)清洗簡(jiǎn)介
1611數(shù)據(jù)清洗
1612數(shù)據(jù)探索
162數(shù)據(jù)導(dǎo)入
1621讀入數(shù)據(jù)到SAS系統(tǒng)的方法
1622指定數(shù)據(jù)文件的位置
1623讀入由空格分隔的原始數(shù)據(jù)
1624讀入列對(duì)齊的原始數(shù)據(jù)
1625讀入非標(biāo)準(zhǔn)格式的數(shù)據(jù)
1626讀入一個(gè)觀測(cè)占據(jù)多行的數(shù)據(jù)文件
1627讀入原數(shù)據(jù)文件的一部分
1628IMPORT過程讀入分隔數(shù)據(jù)文件
163數(shù)據(jù)格式處理
164SAS函數(shù)
1641字符函數(shù)
1642數(shù)值函數(shù)
165缺失值處理
166數(shù)據(jù)抽樣
1661等比例分層抽樣
1662不等比例分層抽樣
1663分層抽樣

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) hotzeplotz.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)