一、怎樣在PDF格式的文本中運用快速搜索找到自己想要的東西
我用的是Foxit PDF IFilter
Foxit PDF IFilter旨在幫助用戶對大量的PDF 文檔進行索引,從而使用戶快速搜索到PDF文檔內的文本。這里所指的PDF文檔可以是文件,也可以郵件附件或數據記錄。
Foxit PDF IFilter支持以下微軟產品:Windows索引服務,MSN桌面搜索,IIS,SharePoint Portal Server, Windows SharePoint Services, Site Server,Exchange Server,SQL Server及其它基于微軟搜索技術之上的產品。以下我們使用“搜索引擎”來指稱這些產品。
Foxit PDF IFilter 是全文本搜索引擎的一個組件。通常搜索引擎分兩個步驟來工作:
步驟1,搜索引擎首先遍歷一個指定的位置,比如一個文件目錄或數據庫,然后在后臺為所有的文檔或最新更改過的文檔進行索引,并建立內部數據來存儲索引結果。
步驟2,用戶指定想要搜索的關鍵詞,接到搜索請求后,搜索引擎快速查閱索引結果,將所有包含關鍵詞的文檔反饋給用戶。
在步驟1中,搜索引擎本身并不會識別PDF文檔格式。因此,它要通過windows 注冊表來查詢一個相關的PDF IFilter, 那就是Foxit PDF IFilter. Foxit PDF IFilter 識別 PDF 格式。 它可以從文檔中過濾掉格式,抽取出文本,然后返回給搜索引擎。關于IFilter說明的更多信息,可以查看Microsoft Web site網站。
功能優勢
與用戶現有的Windows操作系統和各索引工具相兼容。
為搜索位于本地計算機,本地網絡或企業內部網內的PDF文檔,提供了一個簡易的解決方案。
極大的提高了精確定位文本信息的能力。
比同類競爭產品更小巧快速。
支持包含有中文/日文/韓文語言的PDF文檔。
支持源真正的64-bitCPU代碼。
支持多線程,可以充分利用服務器中的多個CPU,極大地提高索引效率。
轉載請注明出處華閱文章網 » 福昕閱讀器如何搜索詞句