信息檢索系統(tǒng)導(dǎo)論

定　價(jià)：￥35.00

作　者：	劉挺等編著
出版社：	機(jī)械工業(yè)出版社
叢編項(xiàng)：	重點(diǎn)大學(xué)計(jì)算機(jī)教材
標(biāo)　簽：	檔案學(xué)

購買這本書可以去

ISBN：	9787111246077	出版時(shí)間：	2008-12-01	包裝：	平裝
開本：	16開	頁數(shù)：	257	字?jǐn)?shù)：

內(nèi)容簡(jiǎn)介

　　本書對(duì)信息檢索及信息檢索系統(tǒng)的基本概念、原理、算法進(jìn)行詳盡介紹。主要內(nèi)容包括信息檢索模型、文本操作技術(shù)、文本索引和搜索技術(shù)、查詢處理與Web檢索技術(shù)、分布式信息檢索、文本分類與聚類、信息過濾等，并給出Web信息檢索的實(shí)現(xiàn)實(shí)例。本書內(nèi)容豐富，源于作者多年的教學(xué)及科研心得，適合作為高等院校計(jì)算機(jī)專業(yè)本科生及研究生相關(guān)課程的教材，也可作為技術(shù)人員研究信息檢索與搜索引擎的參考讀物。

作者簡(jiǎn)介

　　劉挺，教授，博士生導(dǎo)師。哈爾濱工業(yè)大學(xué)計(jì)算機(jī)研究所副所長(zhǎng)，信息檢索研究室主任。國家863”中文處理”重點(diǎn)項(xiàng)目總體組專家。中國中文信息學(xué)會(huì)理事．信息檢索專委會(huì)副主任．計(jì)算語言學(xué)專委會(huì)委員，《中文信息學(xué)報(bào)》編委。中國計(jì)算機(jī)學(xué)會(huì)中文信息技術(shù)專委會(huì)委員，YOCSEF委員。曾任IJCNLP、AIRS等國際會(huì)議的程序委員會(huì)委員，以及全國信息檢索會(huì)議NCIRCS的程序委貫會(huì)主席，JSCL的多屬委員等。主要研究方向?yàn)樾畔z索和自然語言處理，主持多項(xiàng)國家、部委、國際金作、企業(yè)合作等科研項(xiàng)目．在相關(guān)領(lǐng)域發(fā)表論文60余篇。

圖書目錄

序
前言
作者簡(jiǎn)介
教學(xué)建議
第1章緒論
1.1 信息檢索簡(jiǎn)介
1.1.1 信息檢索的概念和處理對(duì)象
1.1.2 信息檢索的基本流程
1.1.3 與信息檢索相關(guān)的學(xué)科
1.2 信息檢索的研究?jī)?nèi)容
1.2.1 信息檢索要解決的問題
1.2.2 信息檢索中的基礎(chǔ)研究課題
1.2.3 信息檢索中的關(guān)鍵技術(shù)
1.2.4 信息檢索中的應(yīng)用研究
1.3 信息檢索的歷史、現(xiàn)狀與未來
1.3.1 信息檢索的歷史
1.3.2 信息檢索的現(xiàn)狀與未來
1.4 本書結(jié)構(gòu)
本章小結(jié)
思考練習(xí)
第2章信息檢索模型
2.1 信息檢索模型的定義和分類
2.1.1 信息檢索模型的定義
2.1.2 信息檢索模型的分類
2.2 布爾模型
2.2.1 布爾模型的定義
2.2.2 布爾模型示例
2.3 向量空間模型
2.3.1 向量空間模型的定義
2.3.2 常見相似度計(jì)算方法
2.3.3 向量空間模型與布爾模型的比較
2.4 概率模型
2.4.1 概率模型的定義
2.4.2 概率模型的優(yōu)缺點(diǎn)
2.5 擴(kuò)展布爾模型
2.5.1 擴(kuò)展布爾模型簡(jiǎn)介
2.5.2 基本模糊集合模型
2.5.3 擴(kuò)展模糊集合模型
2.6 統(tǒng)計(jì)語言模型
2.6.1 語言模型簡(jiǎn)介
2.6.2 數(shù)據(jù)稀疏和平滑
2.6.3 基于語言模型的檢索模型
2.6.4 基于語言模型的信息檢索模型的優(yōu)缺點(diǎn)分析
2.7 隱性語義索引模型
2.7.1 隱性語義索引
2.7.2 隱性語義索引模型原理
2.7.3 隱性語義索引實(shí)例
2.7.4 隱性語義索引模型的特點(diǎn)
2.8 基于本體論的模型
2.8.1 本體論的概念
2.8.2 描述本體的語言
2.8.3 本體的構(gòu)造
2.8.4 常用的本體庫簡(jiǎn)介
2.8.5 本體論在信息檢索系統(tǒng)中的應(yīng)用
本章小結(jié)
思考練習(xí)
參考文獻(xiàn)
第3章信息檢索系統(tǒng)的評(píng)價(jià)
3.1 引言
3.2 性能評(píng)價(jià)指標(biāo)
3.2.1 準(zhǔn)確率和召回率
3.2.2 單值評(píng)價(jià)方法
3.2.3 一些特殊的評(píng)價(jià)方法
3.2.4 其他測(cè)度方法
3.3 國外信息檢索評(píng)測(cè)
3.3.1 TREC評(píng)測(cè)
3.3.2 NTCIR評(píng)測(cè)
3.3.3 CLEF評(píng)測(cè)
3.4 國內(nèi)信息檢索評(píng)測(cè)
3.4.1 863信息檢索評(píng)測(cè)
3.4.2 SEWM中文Web評(píng)測(cè)
3.5 信息檢索評(píng)價(jià)的研究
3.5.1 現(xiàn)有研究成果介紹
3.5.2 今后的研究問題與趨勢(shì)
本章小結(jié)
思考練習(xí)
參考文獻(xiàn)
第4章文本操作技術(shù)
4.1 引言
4.2 英文詞法分析
4.2.1 斷詞
4.2.2 詞干提取
4.3 中文詞法分析
4.3.1 最大匹配法
4.3.2 歧義詞切分
4.3.3 未登錄詞識(shí)別
4.3.4 分詞系統(tǒng)介紹
4.3.5 語料及評(píng)測(cè)
4.4 相關(guān)資源
4.4.1 停用詞表
4.4.2 詞典資源
4.5 英文拼寫檢查
4.5.1 形態(tài)還原
4.5.2 詞語相似度計(jì)算
本章小結(jié)
思考練習(xí)
參考文獻(xiàn)
第5章文本索引和搜索
5.1 引言
5.2 倒排文件
5.2.1 倒排文件簡(jiǎn)介
5.2.2 倒排文件的使用
5.2.3 倒排文件的建立
5.2.4 倒排文件的維護(hù)
5.2.5 倒排文件的壓縮
5.2.6 倒排文件性能分析
5.3 詞匯表的存取
5.3.1 排序數(shù)組
5.3.2 B樹
5.3.3 Trie樹
5.4 后綴數(shù)組
5.4.1 后綴數(shù)組的構(gòu)造
5.4.2 后綴數(shù)組的使用
5.4.3 后綴數(shù)組的分析
5.5 簽名文件
5.5.1 簽名文件的構(gòu)造
5.5.2 簽名文件的使用和維護(hù)
5.5.3 簽名文件的分析
5.6 文本搜索技術(shù)
5.6.1 BF算法
5.6.2 KMP算法
5.6.3 BM算法
5.6.4 精確模式匹配算法的選擇
本章小結(jié)
思考練習(xí)
參考文獻(xiàn)
第6章查詢處理技術(shù)
6.1 引言
6.2 查詢構(gòu)造方法
6.2.1 單一詞查詢
6.2.2 上下文查詢
6.2.3 布爾查詢
6.3 相關(guān)反饋與查詢重構(gòu)
6.3.1 向量空間模型中的反饋與查詢重構(gòu)
6.3.2 概率模型中的反饋與查詢重構(gòu)
6.3.3 布爾模型中的反饋與查詢重構(gòu)
6.3.4 相關(guān)反饋的評(píng)價(jià)
6.4 自動(dòng)查詢擴(kuò)展技術(shù)
6.4.1 查詢擴(kuò)展的全局分析方法
6.4.2 查詢擴(kuò)展的局部分析方法
6.4.3 基于詞典庫的查詢擴(kuò)展
6.5 交互式查詢擴(kuò)展
6.6 查詢處理的發(fā)展趨勢(shì)
本章小結(jié)
思考練習(xí)
參考文獻(xiàn)
第7章 Web檢索技術(shù)
7.1 引言
7.2 Web檢索的工作流程及系統(tǒng)結(jié)構(gòu)
7.2.1 工作流程
7.2.2 系統(tǒng)結(jié)構(gòu)
7.3 Web數(shù)據(jù)的采集
7.3.1 Web數(shù)據(jù)采集系統(tǒng)的工作原理
7.3.2 Web數(shù)據(jù)采集系統(tǒng)的相關(guān)概念及協(xié)議
7.3.3 Web數(shù)據(jù)采集系統(tǒng)的基本結(jié)構(gòu)
7.3.4 Web數(shù)據(jù)采集系統(tǒng)的分類
7.4 網(wǎng)頁的預(yù)處理
7.4.1 網(wǎng)頁去重
7.4.2 正文提取
7.5 相關(guān)性排序系統(tǒng)
7.5.1 早期的相關(guān)性排序技術(shù)
7.5.2 鏈接分析技術(shù)
7.5.3 多特征融合的相關(guān)性排序算法
7.6 Web檢索系統(tǒng)的其他模塊
本章小結(jié)
思考練習(xí)
參考文獻(xiàn)
第8章分布式信息檢索
8.1 引言
8.2 分布式信息檢索系統(tǒng)體系結(jié)構(gòu)
8.3 文檔集合的劃分
8.4 文檔集合的選擇
8.4.1 文檔集合的表示
8.4.2 集合選擇算法
8.4.3 文檔集合選擇算法的評(píng)價(jià)
8.5 檢索結(jié)果的合并
本章小結(jié)
思考練習(xí)
參考文獻(xiàn)
第9章 Web信息檢索實(shí)踐
9.1 引言
9.2 利用Lucene建立索引
9.2.1 在Lucene中建立索引的主要步驟
9.2.2 基本索引程序
9.2.3 深入控制Lucene索引過程
9.2.4 與索引相關(guān)的并發(fā)問題
9.3 利用Lucene進(jìn)行搜索
9.3.1 IndexSearcher
9.3.2 Hits
9.3.3 Query與QueryParser
本章小結(jié)
思考練習(xí)
參考資源
第10章文本分類與聚類
10.1 引言
10.2 文本分類
10.2.1 文本分類概述
10.2.2 文本分類的過程
10.2.3 分類算法
10.2.4 文本分類的評(píng)估指標(biāo)
10.2.5 相關(guān)評(píng)測(cè)和相關(guān)資源
10.3 文本聚類
10.3.1 文本聚類概述
10.3.2 層次聚類
10.3.3 基于劃分的聚類
10.3.4 基于密度的方法
10.3.5 自組織映射
10.3.6 基于模型的方法
10.3.7 文本聚類結(jié)果的描述
11.3.8 文本聚類的評(píng)價(jià)方法
本章小結(jié)
思考練習(xí)
參考文獻(xiàn)
第11章信息過濾技術(shù)
11.1 引言
11.2 信息過濾的概念及主要研究?jī)?nèi)容
11.2.1 信息過濾的概念和主要特點(diǎn)
11.2.2 信息過濾與信息檢索、信息抽取以及分類等研究的區(qū)別
11.2.3 信息過濾系統(tǒng)的分類體系
11.3 信息過濾系統(tǒng)的結(jié)構(gòu)及評(píng)價(jià)
11.3.1 信息過濾系統(tǒng)的組成
11.3.2 信息過濾系統(tǒng)的評(píng)價(jià)
11.4 基于內(nèi)容的信息過濾
11.4.1 信息過濾中應(yīng)用的統(tǒng)計(jì)模型
11.4.2 信息過濾中應(yīng)用的文本分類方法
11.5 協(xié)作過濾
11.5.1 基于用戶的協(xié)作過濾
11.5.2 基于模型的協(xié)作過濾
11.5.3 基于項(xiàng)目的協(xié)作過濾
本章小結(jié)
思考練習(xí)
參考文獻(xiàn)
第12章問答系統(tǒng)
12.1 引言
12.2 問答系統(tǒng)的發(fā)展歷程
12.3 問答系統(tǒng)的種類
12.3.1 問答系統(tǒng)分類方法
12.3.2 自然語言的數(shù)據(jù)庫問答系統(tǒng)
12.3.3 對(duì)話式問答系統(tǒng)
12.3.4 基于常問問題集的問答系統(tǒng)
12.3.5 基于大規(guī)模文檔集的問答系統(tǒng)
12.3.6 閱讀理解系統(tǒng)
12.3.7 基于知識(shí)庫的問答系統(tǒng)
12.4 基于常問問題集的問答系統(tǒng)實(shí)現(xiàn)
12.4.1 候選問題集的建立
12.4.2 句子相似度計(jì)算
12.5 基于大規(guī)模文檔集的問答系統(tǒng)實(shí)現(xiàn)
12.5.1 問答的任務(wù)與系統(tǒng)實(shí)現(xiàn)流程
12.5.2 問題分析
12.5.3 相關(guān)文檔檢索
12.5.4 句段檢索
12.5.5 答案抽取
12.5.6 問答結(jié)果的答案評(píng)測(cè)及其面對(duì)的問題和困難
本章小結(jié)
思考練習(xí)
參考文獻(xiàn)