一、什么是信息檢索
信息檢索是指將信息按一定方式進行收集、加工和存儲, 再根據用戶的需要找出所需信息的過程,它的全稱應該是信 息的存儲與檢索。
但通常我們講信息檢索僅指該過程的后一部分,即從數據庫中找出所需要信息的過程。至于該過程的前一部分,往往屬于數據庫的建庫工作范疇。
信息檢索按檢索內容來分,大致可分為文獻檢索、事實檢索和數值檢索。從WPI數據庫中檢索專利文獻,這屬于文獻檢索;從人事檔案數據庫中檢索某人的經歷,這屬于事實檢索;從證券交易市場檢索交易數據,這屬于數值檢索。
當今的數據庫都實現了圖、文、聲一體化的多媒體數據庫管理,所以上述三類數據內容中可以包含聲音、圖形、圖像和動畫。 信息檢索按工作方式來分,有聯機檢索和網上檢索兩種。
聯機檢索是用戶在局域網環境下進行檢索,能很快得到檢索結果。網上檢索是指用戶在因特網上檢索世界范圍內的信息,此時要使用搜索引擎,它們是建立在高性能計算機系統基礎上的一類數據庫檢索系統,著名的有英文的Yahoo(雅虎)、AltaVista、Infoseek以及中文的Sohoo(搜狐)等。
因特網上有豐富的信息資源,從政治經濟到科技文化等各項活動所需的信息,都可以從網上獲取^斗技人員通過信息檢索能在幾分鐘內 獲得世界上最新的研究動態和成果,青少年也可以在學校或家庭通過聯網的計算機從因特網上獲取教育資源、游戲資源等。利用計算機進行信息檢索已成為當今社會上各界人士獲取信息的有效手段,已成為人們生活不可缺少的一部分。
。
二、怎樣寫信息檢索與利用的論文3000或15000字
信息檢索的數據并行性研究 CAJ原文下載 PDF原文下載 【作者】 趙棒未. 徐國華. 白素懷. 【刊名】 情報學報 1994年02期 編輯部Email 《中文核心期刊要目總覽》來源期刊 ASPT來源刊 CJFD收錄期刊 【機構】 西安電子科技大學. 【聚類檢索】 同類文獻 引用文獻 被引用文獻 【摘要】 信息檢索的并行性研究包括數據并行和功能并行,而數據并行可表現為SIMD系統中的數據級并行以及分布式系統或MIMD系統中的數據集并行。
本文討論數據級并行檢索和數據庫的分布式并行檢索兩種方式,并在二者間作一簡單比較。 【光盤號】 INFO9404 如果需要,請鏈接下面地址,可以找到。
三、文獻檢索的方法和閱讀
文獻檢索: 針對你自己的方向,找相近的論文來讀,從中理解文章中回答什么問題,通過哪些技術手段來證明,有哪些結論?從這些文章中,了解研究思路,邏輯推論,學習技術方法. 1.關鍵詞、主題詞檢索: 關鍵詞、主題詞一定要選好,這樣,才能保證你所要的內容的全面.因為,換個主題詞,可以有新的內容出現. 2.檢索某個學者: 查SCI,知道了某個在這個領域有建樹的學者,找他近期發表的文章. 3.參考綜述檢索: 如果有與自己課題相關或有切入點的綜述,可以根據相應的參考文獻找到那些原始的研究論文. 4.注意文章的參考價值: 刊物的影響因子、文章的被引次數能反映文章的參考價值.但要注意引用這篇文章的其它文章是如何評價這篇文章的. 文獻閱讀: 1.注重摘要:摘要可以說是一個論文的窗口.多數文章看摘要,少數文章看全文.真正有用的全文并不多,過分追求全文是浪費,不可走極端.當然只看摘要也是不對的.多數文章題目、摘要簡單瀏覽后,直接把幾個Figure及Title與legend一看,一般能掌握大部分. 2.通讀全文:讀第一遍的時候一定要認真,爭取明白每句的大意,能不查字典最好先不查字典.因為讀論文的目的并不是學英語,而是獲取信息,查了字典以后思維會非常混亂,往往讀完全文不知所謂.可以在讀的過程中將生字標記,待通讀全文后再查找其意思. 3.歸納總結:較長的文章,容易遺忘.好在雖然論文的句子都長,但每段的句數并不多,可以每一段用一個詞組標一個標題. 4.確立句子的架構,抓住主題: 讀英文原版文獻有竅門的.我們每個單詞都認識讀完了卻不知他在說什么,這是最大的問題.在閱讀的時候一定要看到大量的關系連詞,他們承上啟下引領了全文.中國人喜歡羅列事實,給出一個觀點然后就是大量的事實,這也是中文文獻的特點,我們從小都在讀這樣的文章,很適應.西方人的文獻注重邏輯和推理,從頭到尾是非常嚴格的,就像GRE里面的閱讀是一樣的,進行的是大量重復、新舊觀點的支持和反駁,有嚴格的提綱,尤其是好的雜志體現得越突出.讀每一段落都要找到他的主題,往往是很容易的,大量的無用信息可以一帶而過,節約你大量的寶貴時間和精力. 5.增加閱讀量: 由于剛剛接觸這一領域,對許多問題還沒有什么概念,讀起來十分吃力,許多內容也讀不懂.后來隨著閱讀量的增加,最后可以融匯貫通.所以,對新手而言,應當重視閱讀文獻的數量,積累多了,自然就由量變發展為質變了.。
四、信息檢索一般需要哪些步驟
信息檢索的步驟 一、分析研究課題,明確檢索要求 課題的主題內容、研究要點、學科范圍、語種范圍、時間范圍、文獻類型等 二、選擇信息檢索系統,確定檢索途徑 1、選擇信息檢索系統的方法: (1)在信息檢索系統齊全的情況下,首先使用信息檢索工具指南來指導選擇; (2)在沒有信息檢索工具指南的情況下,可以采用瀏覽圖書館、信息所的信息檢索工具室所陳列的信息檢索工具的方式進行選擇; (3)從所熟悉的信息檢索工具中選擇; (4)主動向工作人員請教; (5)通過網絡在線幫助選擇。
2、選擇信息檢索系統的原則: (1)收錄的文獻信息需含蓋檢索課題的主題內容; (2)就近原則,方便查閱; (3)盡可能質量較高、收錄文獻信息量大、報道及時、索引齊全、使用方便; (4)記錄來源,文獻類型,文種盡量滿足檢索課題的要求; (5)數據庫是否有對應的印刷型版本; (6)根據經濟條件選擇信息檢索系統; (7)根據對檢索信息熟悉的程度選擇; (8)選擇查出的信息相關度高的網絡搜索引擎。 三、選擇檢索詞 確定檢索詞的基本方法:選擇規范化的檢索詞;使用各學科在國際上通用的、國外文獻中出現過的術語作檢索詞;找出課題涉及的隱性主題概念作檢索詞;選擇課題核心概念作檢索詞;注意檢索詞的縮寫詞、詞形變化以及英美的不同拼法;聯機方式確定檢索詞。
四、制定檢索策略,查閱檢索工具 1、制定檢索策略的前提條件是要了解信息檢索系統的基本性能,基礎是要明確檢索課題的內容要求和檢索目的,關鍵是要正確選擇檢索詞和合理使用邏輯組配。 2、產生誤檢的原因可能有:一詞多義的檢索詞的使用;檢索詞與英美人的姓名、地址名稱、期刊名稱相同;不嚴格的位置算符的運用;檢索式中沒有使用邏輯非運算;截詞運算不恰當;組號前忘記輸入指令“s”;邏輯運算符號前后未空格;括號使用不正確;從錯誤的組號中打印檢索結果;檢索式中檢索概念太少。
3、產生漏檢的原因或檢索結果為零的原因可能有:沒有使用足夠的同義詞和近義詞或隱含概念;位置算符用得過嚴、過多;邏輯“與”用得太多;后綴代碼限制得太嚴;檢索工具選擇不恰當;截詞運算不恰當;單詞拼寫錯誤、文檔號錯誤、組號錯誤、括號不匹配等。 4、提高查準率的方法有:使用下位概念檢索;將檢索詞的檢索范圍限在篇名、敘詞和文摘字段;使用邏輯“與”或邏輯“非”;運用限制選擇功能;進行進階檢或高級檢索。
5、提高查全率的方法有:選擇全字段中檢索;減少對文獻外表特征的限定;使用邏輯“或”;利用截詞檢索;使用檢索詞的上位概念進行檢索;把(W)算符改成(1N),(2N);進入更合適的數據庫查找。 五、處理檢索結果 將所獲得的檢索結果加以系統整理,篩選出符合課題要求的相關文獻信息,選擇檢索結果的著錄格式,辨認文獻類型、文種、著者、篇名、內容、出處等項記錄內容,輸出檢索結果。
六、原始文獻的獲取 1、利用二次文獻檢索工具獲取原始文獻 2、利用館藏目錄和聯合目錄獲取原始文獻 3、利用文獻出版發行機構獲取原始文獻 4、利用文獻著者獲取原始文獻 5、利用網絡獲取原始文獻 參考資料: 。