注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡數(shù)據(jù)庫數(shù)據(jù)庫挖掘/數(shù)據(jù)倉庫數(shù)據(jù)挖掘與R語言

數(shù)據(jù)挖掘與R語言

數(shù)據(jù)挖掘與R語言

定 價:¥49.00

作 者: (葡)Luís Torgo著 李洪成 陳道輪 吳立明譯
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 計算機與互聯(lián)網(wǎng) 數(shù)據(jù)庫

ISBN: 9787111407003 出版時間: 2013-02-01 包裝: 平裝
開本: 16 頁數(shù): 216 字數(shù):  

內(nèi)容簡介

  本書首先簡要介紹了R軟件的基礎(chǔ)知識(安裝、R數(shù)據(jù)結(jié)構(gòu)、R編程、R的輸入和輸出等)。然后通過四個數(shù)據(jù)挖掘的實際案例(藻類頻率的預測、證券趨勢預測和交易系統(tǒng)仿真、交易欺詐預測、微陣列數(shù)據(jù)分類)介紹數(shù)據(jù)挖掘技術(shù)。這四個案例基本覆蓋了常見的數(shù)據(jù)挖掘技術(shù),從無監(jiān)督的數(shù)據(jù)挖掘技術(shù)、有監(jiān)督的數(shù)據(jù)挖掘技術(shù)到半監(jiān)督的數(shù)據(jù)挖掘技術(shù)。全書以實際問題、解決方案和對解決方案的討論為主線來組織內(nèi)容,脈絡清晰,并且各章自成體系。讀者可以從頭至尾逐章學習,也可以根據(jù)自己的需要進行學習,找到自己實際問題的解決方案。 本書不需要讀者具備R和數(shù)據(jù)挖掘的基礎(chǔ)知識。不管是R初學者,還是熟練的R用戶都能從書中找到對自己有用的內(nèi)容。讀者既可以把本書作為學習如何應用R的一本優(yōu)秀教材,也可以作為數(shù)據(jù)挖掘的工具書。Data Mining with R:Learning with Case Studies by Luís Torgo(ISBN978?1?4398?1018?7).Copyright ?2011 byTaylor and Francis Group, LLC.Authorized translation from the English language edition publishedby CRC Press, part of Taylor & Francis Group LLC; All rightsreserved.China Machine Pressisauthorized to publish anddistribute exclusively the Chinese (Simplified Characters) languageedition?This edition is authorized for salein the People?sRepublic of China only (excluding Hong Kong, Macao SAR andTaiwan).No part of this publication may be reproduced ordistributed in any form or by any means, or stored in a database orretrieval system, without the prior written permission of thepublisher.Copies of this book sold without a Taylor & Francis sticker onthe cover are unauthorized and illegal.

作者簡介

  Luís Torgo,葡萄牙波爾圖大學計算機科學系副教授,現(xiàn)在在LIAAD實驗室從事研究工作。他是APPIA會員,同時還是OBEGEF的創(chuàng)辦會員。

圖書目錄

Data Mining with R:Learning with Case Studies

出版者的話
推薦序
中文版序
譯者序
前言
致謝
第1章簡介
1?1如何閱讀本書
1?2R簡介
1?2?1R起步
1?2?2R對象
1?2?3向量
1?2?4向量化
1?2?5因子
1?2?6生成序列
1?2?7數(shù)據(jù)子集
1?2?8矩陣和數(shù)組
1?2?9列表
1?2?10數(shù)據(jù)框
1?2?11構(gòu)建新函數(shù)
1?2?12對象、類和方法
1?2?13管理R會話
1?3MySQL簡介
第2章預測海藻數(shù)量
2?1問題描述與目標
2?2數(shù)據(jù)說明
2?3數(shù)據(jù)加載到R
2?4數(shù)據(jù)可視化和摘要
2?5數(shù)據(jù)缺失
2?5?1將缺失部分剔除
2?5?2用最高頻率值來填補缺失值
2?5?3通過變量的相關(guān)關(guān)系來填補缺失值
2?5?4通過探索案例之間的相似性來填補缺失值
2?6獲取預測模型
2?6?1多元線性回歸
2?6?2回歸樹
2?7模型的評價和選擇
2?8預測7類海藻的頻率
2?9小結(jié)
第3章預測股票市場收益
3?1問題描述與目標
3?2可用的數(shù)據(jù)
3?2?1在R中處理與時間有關(guān)的數(shù)據(jù)
3?2?2從CSV文件讀取數(shù)據(jù)
3?2?3從網(wǎng)站上獲取數(shù)據(jù)
3?2?4從MySQL數(shù)據(jù)庫讀取數(shù)據(jù)
3?3定義預測任務
3?3?1預測什么
3?3?2預測變量是什么
3?3?3預測任務
3?3?4模型評價準則
3?4預測模型
3?4?1如何應用訓練集數(shù)據(jù)來建模
3?4?2建模工具
3?5從預測到實踐
3?5?1如何應用預測模型
3?5?2與交易相關(guān)的評價準則
3?5?3模型集成:仿真交易
3?6模型評價和選擇
3?6?1蒙特卡羅估計
3?6?2實驗比較
3?6?3結(jié)果分析
3?7交易系統(tǒng)
3?7?1評估最終測試數(shù)據(jù)
3?7?2在線交易系統(tǒng)
3?8小結(jié)
第4章偵測欺詐交易
4?1問題描述與目標
4?2可用的數(shù)據(jù)
4?2?1加載數(shù)據(jù)至R
4?2?2探索數(shù)據(jù)集
4?2?3數(shù)據(jù)問題
4?3定義數(shù)據(jù)挖掘任務
4?3?1問題的不同解決方法
4?3?2評價準則
4?3?3實驗方法
4?4計算離群值的排序
4?4?1無監(jiān)督方法
4?4?2有監(jiān)督方法
4?4?3半監(jiān)督方法
4?5小結(jié)
第5章微陣列樣本分類
5?1問題描述與目標
5?1?1微陣列實驗背景簡介
5?1?2數(shù)據(jù)集ALL
5?2可用的數(shù)據(jù)
5?3基因(特征)選擇
5?3?1基于分布特征的簡單過濾方法
5?3?2ANOVA過濾
5?3?3用隨機森林進行過濾
5?3?4用特征聚類的組合進行過濾
5?4遺傳學異常的預測
5?4?1定義預測任務
5?4?2模型評價標準
5?4?3實驗過程
5?4?4建模技術(shù)
5?4?5模型比較
5?5小結(jié)
參考文獻
主題索引
數(shù)據(jù)挖掘術(shù)語索引
R函數(shù)索引

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) hotzeplotz.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號