注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計程序設(shè)計綜合搜索引擎原理、實踐與應(yīng)用

搜索引擎原理、實踐與應(yīng)用

搜索引擎原理、實踐與應(yīng)用

定 價:¥42.00

作 者: 盧亮,張博文 著
出版社: 電子工業(yè)出版社
叢編項:
標(biāo) 簽: 檔案學(xué)

ISBN: 9787121048104 出版時間: 2007-09-01 包裝: 平裝
開本: 16 頁數(shù): 289 字?jǐn)?shù):  

內(nèi)容簡介

  本書是搜索引擎業(yè)界資深的搜索引擎專家長久以來經(jīng)驗的積累與研究工作的心路歷程。本書從搜索引擎的歷史和現(xiàn)狀開始展開,為廣大讀者展現(xiàn)了搜索引擎簡單界面背后的復(fù)雜技術(shù)、原理和應(yīng)用,從數(shù)據(jù)挖掘到搜索引擎的數(shù)據(jù)結(jié)構(gòu),從搜索引擎爬蟲到分布式搜索引擎的設(shè)計均是作者精心研究的結(jié)果和過程,對研究搜索引擎的人士頗有實用價值和參考意義。本書適合剛搜索引擎行業(yè)乃至互聯(lián)網(wǎng)行業(yè)的從業(yè)人員、如網(wǎng)站設(shè)計者、程序員、個人網(wǎng)站的站主,本書還適合大中學(xué)院相關(guān)專業(yè)及培訓(xùn)機構(gòu)的相關(guān)培訓(xùn)作為參考書籍。

作者簡介

暫缺《搜索引擎原理、實踐與應(yīng)用》作者簡介

圖書目錄

第1章 搜索引擎的歷史和現(xiàn)狀
1.1 搜索引擎的歷史
1.2 搜索引擎的分類
1.3 搜索引擎的現(xiàn)狀
1.4 世界主要搜索引擎介紹
1.4.1 Google
1.4.2 百度
1.4.3 Technorati
1.4.4 A11theweb
1.4.5 Ask.com
1.4.6 MSN Search
 小結(jié)
參考文獻(xiàn)
第2章 數(shù)據(jù)挖掘
2.1 數(shù)據(jù)挖掘概覽
2.1.1 為什么要做數(shù)據(jù)挖掘
2.1.2 數(shù)據(jù)挖掘的任務(wù)
2.1.3 關(guān)聯(lián)挖掘和分析
2.1.4 多子類
2.1.5 聚類分析
2.1.6 序列模式分析
2.1.7 偏差分析
2.2 數(shù)據(jù)挖掘的常用技術(shù)
2.2.1 人工神經(jīng)網(wǎng)絡(luò)
2.2.2 統(tǒng)計分析
小結(jié)
參考文獻(xiàn)
第3章搜索引擎的數(shù)據(jù)結(jié)構(gòu)
3.1 存儲結(jié)構(gòu)
3.1.1 四種基本存儲方法
3.2 索引
3.2.1 倒排索引
3.3 結(jié)構(gòu)化查詢語言
3.4 海量數(shù)據(jù)系統(tǒng)
小結(jié)
參考文獻(xiàn)
第4章 搜索引擎的基本結(jié)構(gòu)
4.1 網(wǎng)絡(luò)爬蟲
4.2 排序
4.2.1 網(wǎng)頁的權(quán)重
4.2.2 向量空間模型VSM
4.2.3 擴展相關(guān)信息
4.3 索引系統(tǒng)
4.4 緩存機制
小結(jié)
參考文獻(xiàn)
第5章 搜索引擎爬蟲
5.1 深度優(yōu)先與廣度優(yōu)先
5.1.1 網(wǎng)頁鏈接情況概覽
 5.1.2 取得有效的網(wǎng)賈文字
 ……
第6章 搜索引擎索引系統(tǒng)
第7章 分布式搜索引擎設(shè)計
第8章 Goog1e搜索引擎的結(jié)構(gòu)
第9章 中文分詞
第10章 分類與聚類
第11章 內(nèi)容消重和SPAM消除
第12章 圖像搜索引擎
附錄

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) hotzeplotz.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號