靈感範文站

位置:首頁 > 論文 > 論文精選

信息檢索論文通用多篇

信息檢索論文通用多篇

信息檢索論文 篇一

桶排序法,先把被排數據所分佈的區間[Dmin,Dmax](在這裏Dmax,Dmin分別爲被排數據的最大,最小值)劃分成N個大小相等的子區間,稱子爲“桶”,然後將N個數據根據其大小分配入相應的“桶”內(桶[1],桶[2],…,桶[N])。借籤桶排序中將數據根據其大小分配入相應“桶”的思想,我們在檢索時將已排好序的數據也根據其大小將其分配入相應的“桶”內,然後再在“桶”內進行二分檢索。假設按升序排列的N個數據已存放在data數組的元素data[0]~data[N-1]中,構造一個HASH函數爲:

(式中Dmax=data[N-1],Dmin=data[0],N爲數據個數)

二、基於HASH函數的二分檢索算法HS

算法HS使用二個數組,data數組的元素data[0]~data[N-1]中存放按升序排列的N個數據,address數組的元素address[1]~address[N]中用來存貯經HASH函數轉換後得到相同地址的數據個數。

算法HS

HS1[清address數組]將ddress[1]~address[N]都置0

HS2[Dmax中置最大值、Dmin中置最小值]Dmaxdata[N-1],Dmindata[0]

HS3[i置初始值]i0

HS4[求數據data[i]的HASH變換後的地址ad]ad

HS5[地址“碰撞”記數器address[ad]加1]address[ad]address[ad]+1

HS6[修改i]ii+1

HS7[比較i與N-1]若i<=N-1,則轉HS4,否則轉HS8。

HS8[address[0]置初值1]address[0]1

HS9[j置初始值]j1

HS10[求地址發生“碰撞”的數據在DATA數組中的首地址]address[j]=address[j]+address[j-1]

HS11[修改j]jj+1

HS12[比較j與N]若j<=N則轉HS10,否則轉HS13。

HS13[輸入一個被檢索的數據X]

HS14[對被檢索數據X用HASH函數得地址ad]

HS15[確定“塊”的下界low,上界high的值]lowaddress[ad-1],highaddress[ad]-1

HS16[在“塊”內進行二分檢索]在給定的下界與上界之間進行二分檢索,若找到,則返“檢索成功”信息,否則返加回“檢索失敗”信息。

HS17()[本算法結束]

三、平均檢索長度的分析

在本檢索算法中,首先將被檢索數據X經HASH函數轉換出一個地址,根據這個地址將被檢索的數據直接定位到相應的“塊”中,然後在“塊”中進行二分檢索。因此通過對所有“塊”內二分檢索法的平均檢索長度的計算就可求出本算法的平均檢索長度。二分檢索法的平均檢索長度爲:

下面我們來求本算法的平均檢索長度。假設在N個數據均勻分佈的情況下,經過本檢索算法中HASH函數轉換,每一個地址出現的概率相同,都等於1/N,因此,有m個數據轉換得到相同地址的概率爲:

(m=1,2,…,N)

參考文獻[1]的附錄中已證明:(1)

所以本檢索算法的平均檢索長度爲(2)

由上式(1)和式(2)兩個公式即可求得本算法的平均檢索長度,其平均檢索長度小於1.352(當N>100時)。

四、算法分析與實驗結果

1.本算法的創新之處在於通過HASH函數可將被檢索的數據X直接位置定位到相應的“塊”(通過HASH函數轉換後的地址相同的數據區間)中,再在“塊”中進行二分檢索。從而不再需要建立索引順索表檢索算法中的索引表,也就省去了索引順索表檢索算法中查找索引表確定所在“塊”的平均檢索長度。

2.此方法突破了HASH表的平均檢索長度是裝填因子(=(表中填人的記錄數)/(哈希表的長度)的函數,而不是N的函數的弱點。

3.在理想情況下,即數據完全是均勻分佈的情況下,本算法的平均檢索長度可達理論極限值ASL=1。即使是在最壞的情況下,當N個數據經HASH函數轉換後的地址均相同,所有數據均落在同一個“塊”中,其平均檢索長度ASL也只會下降到二分檢索法時的平均檢索長度。

4.本算法對於均勻分佈的數據是極爲有效的,通過計算得出其平均檢索長度小於1.352(N>100時),因此檢索效率很高。

5.本算法中的步驟HS1~HS12僅僅是爲檢索作的準備工作,相當於初始化的工作,只需在檢索開始時做一次即可。

6.實驗結果。爲了對本檢索算法的檢索效率進行驗證,我們用VB6.0編寫了本算法以及二分檢索法的程序,將二種檢索算法的平均檢索長度進行實際測定,實驗中所用的數據由VB6.0的隨時函數產生,數據的範圍爲(0~10000),實驗結果如下表所示:

VB6.0程序二種檢索算法平均檢索長度對比表

我們在實驗中測定平均檢索長度時,通過程序對所有數據逐個檢索,統計出檢索完所有數據需進行比較的總次數再除以數據總數後得出。上表中當N=100時,本算法實際測定的值(1.38)與理論計算(1.352)略有誤差,原因是我們用VB6.0中的隨機函數產生的隨機數在數據量較小時分佈不一定很均勻。從表1中可以看到:當數據量稍大一些(N>100),本算法的平均檢索長度的實測結果完全與理論分析一對致,並且遠小於二分檢索法的平均檢索長度。本算法的平均檢索長度隨着數據量N的增加幾乎不變。

[摘要]構造一個新的HASH函數,結合索引順序表和二分檢索法的思想,提出了一種高效率的信息檢索算法,通過理論計算和實驗證明此算法的平均檢索長度小於1.352(N>100)。

信息檢索論文 篇二

關鍵詞:信息檢索 信息分析 信息提煉 立體印刷

中圖分類號:TM63 文獻標識碼:A 文章編號:1674-098X(2016)09(c)-0100-02

在新的生活環境下,每個人都需要從各種各樣的信息源中收集、提煉有用信息,爲正確決策提供參考。一方面,人們可以利用網絡方便、自由、快捷的、查詢信息;但另一個方面,由於網絡環境的開放性,信息更新的快速性,使得信息資源出現分散、異構、無序的特性,極不利於人們有效開發和利用這些資源。面對信息急劇增長、技術不斷更新的新局面,需要我們對信息檢索技術進行深入的研究,從而提高網絡信息資源的利用率,尤其是科研工作者必須增強獲取、選擇和利用信息的能力。

1 信息檢索概述

信息檢索是將信息按一定的方式組織起來,並根據信息用戶提交的查詢條件檢索出相關文檔的過程和技術。信息檢索涉及數據庫技術、圖書和情罌蒲А⑷斯ぶ悄堋⒆勻揮鎇源理、機器學習等衆多知識和學科領域[1]。信息檢索作爲一門學科,主要研究信息的獲取、表示、存儲、組織和訪問。

1.1 信息檢索的意義

信息檢索是對信息進行集中表示、存儲、組織加工、統一管理,使用戶更容易得到所需要的信息,進而對信息進行加工,根據分析得出新的思路和方法,實現信息激活和增值。有效的信息檢索可以節省科技人員的時間,提高工作效率;幫助人們進行知識更新;繼承和借鑑前人勞動成果,促進科技的快速發展;協助管理者做出正確的決策。

1.2 信息檢索的四要素

信息檢索包含四個要素:信息意識、信息源、信息獲取能力、信息利用[2]。信息意識是信息檢索的前提,指人們藉助信息系統獲取所需信息所做出的能動反映,使人們對信息的敏感程度、選擇和運用信息能力;信息源是信息檢索的基礎,如專著、期刊、報告、學位論文、會議記錄、專利、標準、統計數據、政府出版物、檔案文獻信息等;信息獲取能力是信息檢索的核心,是指人們對信息的瞭解、查找、整理加工;信息利用是信息檢索的關鍵,即對信息進行有效的加工和利用。

1.3 檢索語言及方法

檢索語言是爲溝通文獻標引與文獻檢索而編制的人工語言,是連接信息存儲和檢索兩個過程中標引人員與檢索人員雙方思路的渠道。檢索語言主要包含分類、主題、代碼和自然四類語言[3]。分類語言是指用各種分類號來進行檢索的標識,按學科性質進行系統排列,包括主題、科學、圖書和專利分類語言;主題語言是直接以表達文獻主題的詞語作爲檢索標識,包括關鍵詞、標題詞、單元次和敘詞語言等;代碼語言是指將事物的某一方面特徵用代碼系統來標引和排列的檢索語言,例如,分子式索引系統;自然語言是指未經規範化處理的檢索語言。

信息檢索包括手工和計算機檢索,常用的檢索方法有拉網法、引文法、順查、逆差和抽查法、排除、限定和合取法。檢索途徑歸爲兩大類:一類是用信息的外部特徵,如責任者、題名、某種序號、機構名等作爲檢索標識;另一類是用描述信息內容的分類號、關鍵詞、主題詞等作爲檢索標識。通常直接輸入檢索字段直接點擊搜索,但需要精確查找目標文獻時,要利用高級檢索方式設置一些查詢條件,如查詢範圍、時間、方式(模糊和精確)、字段邏輯關係的編輯等。

2 信息檢索流程

信息檢索過程可分爲以下步驟:課題的確定――選擇合適的數據庫――初步擬定檢索式檢索――調整檢索策略(考慮準確性)――命中結果分析――批量下載――信息分析。下面以立體印刷技術的相關資料的蒐集爲例介紹信息檢索過程。

2.1 檢索工具選擇

對於日常信息的搜索,通常採用百度、谷歌等網站,但對於專業文獻的檢索則需要專門的數據庫,每個數據庫都有自己的特點。

(1)館藏書目查詢:書目是將圖書、期刊按一定規則收錄,並有序編排的檢索工具。通常包含題名、責任者、主題詞、分類號、索取號、ISBN/ISSN號、出版社等字段,輸入檢索詞即可檢索,大多數高校圖書館都有自己的館藏書目數據庫,檢索、下載。

(2)中國學術期刊全文數據庫:目前世界上最大且連續動態更新的數據庫,內容覆蓋工程技術、自然科學、農業、哲在新的生活環境下,每個人都需要從各種各樣的信息源中收集、提煉有用信息,爲正確決策提供參考。一方面,人們可以利用網絡方便、自由、快捷的、查詢信息;但另一個方面,由於網絡環境的開放性,信息更新的快速性,使得信息資源出現分散、異構、無序的特性,極不利於人們有效開發和利用這些資源。面對信息急劇增長、技術不斷更新的新局面,需要我們對信息檢索技術進行深入的研究,從而提高網絡信息資源的利用率,尤其是科研工作者必須增強獲取、選擇和利用信息的能力。

1 信息檢索概述

信息檢索是將信息按一定的方式組織起來,並根據信息用戶提交的查詢條件檢索出相關文檔的過程和技術。信息檢索涉及數據庫技術、圖書和情報科學、人工智能、自然語言處理、機器學習等衆多知識和學科領域[1]。信息檢索作爲一門學科,主要研究信息的獲取、表示、存儲、組織和訪問。

1.1 信息檢索的意義

信息檢索是對信息進行集中表示、存儲、組織加工、統一管理,使用戶更容易得到所需要的信息,進而對信息進行加工,根據分析得出新的思路和方法,實現信息激活和增值。有效的信息檢索可以節省科技人員的時間,提高工作效率;幫助人們進行知識更新;繼承和借鑑前人勞動成果,促進科技的快速發展;協助管理者做出正確的決策。

1.2 信息檢索的四要素

信息檢索包含四個要素:信息意識、信息源、信息獲取能力、信息利用[2]。信息意識是信息檢索的前提,指人們藉助信息系統獲取所需信息所做出的能動反映,使人們對信息的敏感程度、選擇和運用信息能力;信息源是信息檢索的基礎,如專著、期刊、報告、學位論文、會議記錄、專利、標準、統計數據、政府出版物、檔案文獻信息等;信息獲取能力是信息檢索的核心,是指人們對信息的瞭解、查找、整理加工;信息利用是信息檢索的關鍵,即對信息進行有效的加工和利用。

1.3 檢索語言及方法

檢索語言是爲溝通文獻標引與文獻檢索而編制的人工語言,是連接信息存儲和檢索兩個過程中標引人員與檢索人員雙方思路的渠道。檢索語言主要包含分類、主題、代碼和自然四類語言[3]。分類語言是指用各種分類號來進行檢索的標識,按學科性質進行系統排列,包括主題、科學、圖書和專利分類語言;主題語言是直接以表達文獻主題的詞語作爲檢索標識,包括關鍵詞、標題詞、單元次和敘詞語言等;代碼語言是指將事物的某一方面特徵用代碼系統來標引和排列的檢索語言,例如,分子式索引系統;自然語言是指未經規範化處理的檢索語言。

信息檢索包括手工和計算機檢索,常用的檢索方法有拉網法、引文法、順查、逆差和抽查法、排除、限定和合取法。檢索途徑歸爲兩大類:一類是用信息的外部特徵,如責任者、題名、某種序號、機構名等作爲檢索標識;另一類是用描述信息內容的分類號、關鍵詞、主題詞等作爲檢索標識。通常直接輸入檢索字段直接點擊搜索,但需要精確查找目標文獻時,要利用高級檢索方式設置一些查詢條件,如查詢範圍、時間、方式(模糊和精確)、字段邏輯關係的編輯等。

2 信息檢索流程

信息檢索過程可分爲以下步驟:課題的確定――選擇合適的數據庫――初步擬定檢索式檢索――調整檢索策略(考慮準確性)――命中結果分析――批量下載――信息分析。下面以立體印刷技術的相關資料的蒐集爲例介紹信息檢索過程。

2.1 檢索工具選擇

對於日常信息的搜索,通常採用百度、谷歌等網站,但對於專業文獻的檢索則需要專門的數據庫,每個數據庫都有自己的特點。

(1)館藏書目查詢:書目是將圖書、期刊按一定規則收錄,並有序編排的檢索工具。通常包含題名、責任者、主題詞、分類號、索取號、ISBN/ISSN號、出版社等字段,輸入檢索詞即可檢索,大多數高校圖書館都有自己的館藏書目數據庫,檢索、下載。

(2)中國學術期刊全文數據庫:目前世界上最大且連續動態更新的數據庫,內容覆蓋工程技術、自然科學、農業、哲學、醫學、人文社會科學等各個領域。可進行高級、專業、跨庫檢索以及期刊Ш健

(3)中國優秀博碩士論文數據庫:目前國內相關資源最完備、連續動態更新的高質量學位論文數據庫,包含理工、農業、醫藥、文史哲、法律、教育與社會科學、電子與信息科學、經濟以及專題文獻等。

(4)外文文摘數據庫:既包含單學科數據庫,如CA(化學)、PA(石油)、Georef、Medline等,又包含多學科綜合數據庫,如Dialog、EI、CSA、SCI、IEEE/IET、Spinger等。對於國際化的今天,外文檢索已成爲每個考研人員必備的技能。

(5)其他數據庫:Google學術中文和外文搜索、萬方、維普、知網、專利檢索系統以及標準文獻檢索數據庫等。數據庫文件普遍採用CAJ和PDF格式,須下載專門的瀏覽器來閱讀。

2.2 檢索詞確定

確定中文檢索詞:設置與論文名字相關的檢索詞進行檢索,如,立體印刷、3D印刷、立體圖像、立體印刷品;確定英文檢索詞:stereoscopic printing、3D printing、stereoscopic image printing、auto-stereoscopic image

2.3 檢索過程及結果分析

利用以上介紹的檢索方式以及各個數據庫的特點,選用中國知網、Google學術、碩博士論文數據庫、EI和專利網,結合設定的檢索詞進行文獻檢索,該文例子主要圍繞圖書、期刊、碩博士論文和專利來搜索。爲了便於對文獻的管理、引文編排,論文寫作採用EndNote插件建立分類文獻庫。在搜索文獻時注意儘可能將時間設定在近5年內,學位論文搜索優先,這樣對研究對象的背景、現狀首先有大概的瞭解;其次進行大量其它文獻的檢索,可以參考論文後的參考文獻、某個領域的專家或數據庫連接到的相似文獻等來擴展檢索。無論對於中文還是外文的搜索,不能盲目下載,必須注意文章摘要與目標對象是否有關,否則會加大有用文章篩選的工作量。

檢索到的文章由於存在相似性,一定要做好分類,方便快速查找。總的來看立體印刷技術相關文獻主要涉及人眼視覺理論、光柵成像、立體圖像製作、光柵材料及使用、立體印刷產品質量評價和市場分析、立體印刷工藝研究以及相關設備製造等。通過以上文章的搜索我們可以對立體印刷有大致的瞭解,對於寫綜述性的論文可以按照以上點來設置章節標題,如果要進行某一點的深入研究,需要認真研讀,將文章的各個點吃透,或進一步查閱相關資料。總之,文獻檢索不能盲目,初步檢索分析後,再次具有針對性性的進行檢索。

3 結語

該文圍繞信息檢索技術展開討論,首先,簡單的介紹了信息檢索的含義、目的、意義、檢索要素和方法等,讓大家對此有直觀的認識。其次,結合立體印刷技術綜述報告的例子,詳細的闡述了文獻的查找渠道、提煉、分析和總結過程,對以後工作和學習中有效的進行信息檢索具有一定的參考價值。

參考文獻

[1] 劉雙魁。信息檢索與利用[M].上海:東南大學出版社,2010:8.

[2] 祁延莉。信息檢索概論[M].北京:北京大學出版社,2013:7.

信息檢索論文範文 篇三

循證醫學與以往的傳統醫學臨牀經驗和實踐是有很大區別的,傳統醫學是以經驗醫學爲主,也就是根據個人多年臨牀工作經驗或以往臨牀工作人員的工作經驗,依據現有的臨牀資料和對疾病的瞭解來主觀的去爲病人診治。而循證醫學的診治原則是必須以真實客觀的科學研究證據與臨牀實踐相結合對病患安全的、正確的進行治療。

網絡信息檢索,顧名思義,也就是在網絡環境下進行的信息檢索,也就是將網絡上的真實的、有用的信息資源按照特定的方式存儲起來,再用科學的方法,利用不同檢索工具,爲我們用戶查找、解釋、傳遞信息和知識的整個業務過程。它有廣義和狹義兩種概念概念之分,廣義的網絡信息檢索包括信息存儲和信息查找兩個過程,而狹義的概念是廣義概念的後半部分,也就是僅指信息查找這一過程。狹義的概念是被廣泛應用的,也就是在各種專業數據庫中查找搜索所需知識信息的過程。網絡信息檢索這門課程在高校已經開展了30多年,對於我們現代大學生而言都不陌生,無論是綜合性的高校還是專業性比較強的工科、藝術、醫學等專科性的高校,都是非常重視信息檢索這門課程的開展。本研究就2016年以來近期調查河北省69所高校網絡信息檢索課程的開展情況來看,已全部實現所有本科類院校全部開展了信息檢索課程,專科類院校也有95%已經開展這門課程;在所有調查高校中把信息檢索課作爲必修課的高校佔所有高校的比例不足10%,把信息檢索課作爲選修課學分佔比重較高的高校佔所有高校比例爲35%,作爲選修課學分比重較低的高校佔所有高校的百分之45%,而將這門課程作爲公選課的高校佔所有高校比重的10%左右。而對於醫學高等院校甚至包括醫學院校的附屬醫院的醫生都是很重視着網絡信息檢索這門課程的學習。網絡信息檢索課的學習偏重於與醫學信息知識相聯繫的方向,把循證醫學的思維模式放入到網絡信息檢索課程的教學當中來,對於醫學及其相關專業的科研工作人員是非常重要的。現今的互聯網環境下,網絡信息呈爆炸式增長席捲全球,優略混雜,信息氾濫,網絡信息檢索可以教會老師和學生怎樣從海量信息中查找到有用信息,進而轉變成自己所掌握的知識;循證醫學研究的原則就是必須以科學研究證據爲前提而進行研究;網絡信息檢索相當於一個查找工具,而循證醫學相當於是被證明了正確的科學知識庫,通過查找工具去查找獲取科學知識,對於一個科研工作人員而言是非常正確的選擇,因此,對於醫學科研工作人員而言,在網絡信息檢索這門課中加入循證醫學思維是非常有必要的,二者有着密不可分的關聯性。

一、網絡信息檢索課國內開展現狀與不足之處

(一)網絡信息檢索課國內開展現狀

隨着互聯網技術的更新與飛速發展,信息檢索課教學內容與網絡信息、科學技術的發展有着密不可分的關係,對網絡信息有用知識的檢索與利用已經成爲現代大學生迫切需要掌握的技能之一。當前信息檢索課在大多數高校中使用的教材還都是紙版教材,電子版教材使用率還是比較低,從1984年國家教育部文書要求在各大高校開設文檢課以來已經經歷了32年的歷程,各個高校在幾十年的摸爬滾打中所使用的信息文獻檢索課的教材也都趨於穩定,直至今日我國國內出版信息檢索的教材約900餘種,本研究從不同的題名、主題、內容及載體等方面進行著作檢索,總結出現今信息檢索課的教材從學科專業的角度上大致可以分爲三類:一個是通用型教材,也就是大部分高校都是使用的一種教材,不限學科類別,都可以通用;一類是針對專業性比較強的專科性學校的教材,分別是醫學、軍事、農業、經濟等專業的教材;還有一類就是社會科學類的教材。現今使用通用教材的高校是最多的,佔到大約70%。現今出版的專門針對醫學的信息檢索教材比較少,且沒有統一的規定和約束,大部分醫學類高等院校也是使用通用型教材。

針對信息檢索課的教學改革研究,本文以中國知網數字檢索平臺對1984年以來近30度年對信息檢索課的教學改革研究的文獻綜述進行統計,進入 cnki網絡檢索平臺的高級檢索中的專業檢索界面,以“信息檢索課”或“文獻檢索課”爲一類主題檢索詞,以“教學改革”或“課程改革”爲另一類主題檢索詞進行二主題並列文獻檢索,共檢索出838條結果,以2000年爲分界線,2000年以前的研究性文獻共75篇,2000年以後共763篇,可見自互聯網技術的不斷成熟與應用,信息檢索這門課也在突飛猛進的發展,對其進行的研究也越來越多。更換主題檢索詞,還是以“信息檢索課”或“文獻檢索課”爲一類主題檢索詞,而另一類主題詞替換爲“醫學”、“醫院”或“醫療”進行二主題檢索,共檢索出563條結果,再增加並列主題詞‘教學改革’或‘課程改革’進行三主題並列檢索,共檢索出111條檢索結果。從以上三種主題檢索結果分析,其士論文0篇,碩士論文僅有兩篇關於信息檢索課程教學改革的,關於信息檢索這門課程的教學改革所做的研究性論文非常少。

(二)網絡信息檢索課存在的不足

1)信息檢索教材內容陳舊,更新較慢,且應用混論。信息檢索的教材一般經歷編纂、修改、出版這三個過程,這種週期一般都比較長,本身經歷了一到三年的時間才能出版[ 2 ],出版後的教材在應用到高校的教學中去後又會經歷更長時間的的應用,一般都是五年到十年的時間,而恰恰是在這麼長的週期中,網絡信息檢索技術在不斷更新、發展、進步,從信息資源的管理不斷完善到檢索工具功能的不斷更新和提高,譬如:各種專業數據庫從最開始的簡單基礎檢索到高級專業檢索,還有他們服務功能的不斷完善,有些數據庫增添了在線諮詢、名師講堂的新內容以及博客搜索的新應用等等。這些新的理論和技術不會在舊的教材教學中體現,導致了教學內容的落後。近20來年,國家並沒有下發過新的有關信息檢索這門課程教學的文件或通知,截止到2016年3月,國內共出版了約70多種關於醫學類的信息檢索教材,各大醫學類院校由於國家教育部並沒有做出硬性規定,因此,各個高校都是文檢教研室自行決定運用哪一種教材進行教學,隨意性非常大。教材不統一,導致教學內容也比較混論。

2)信息檢索課形式單一,電子化程度低。互聯網技術的飛速發展使得現今教學手段發生了翻天覆地的變化,過去的一手書、一手粉筆、一面黑板的教學模式已改爲現今的多媒體ppt教學模式。但是目前絕大多數高校所使用的教材仍然是單一性的紙板書爲主,應用電子教材的學校微乎其微,甚至對電子版的教材比較陌生。電子版教材是近幾年才發展起來的,它除了包含有紙質版的教材內容外,還包括配有導學光盤,電子課件以及課餘的習題集等,是紙質版教材、指導性學習光盤和網絡直播課程三位一體的新形教材。有些學校可能在專業必修課程的學習教材上已經應用到了電子媒體課件,但是在網絡信息檢索這門課程上的應用發展速度還是非常慢的,由於大部分高校是將信息檢索這門課作爲選修課來上的,並沒有引起對這門課的足夠重視,且教師的電子ppt教材製作水平參差不齊,因此課程形式的發展比較單一落後。

3)信息檢索課缺乏與實踐內容的對接,不利於培養學生實踐動手能力。現今的醫學類院校信息檢索課程仍然是以教材理論爲基礎義務性的將課程中的基礎理論知識、數據庫檢索以及檢索工具使用理論機械性的介紹給學生,依然停留在課本內容章節介紹的層面行,學生即使理解了理論性的概念知識,如果長時間不應用在實際的問題中,很快就會把這些知識遺忘掉。教學內容枯燥乏味,普遍缺乏案例實際講解與分析,亦或是案例太過陳舊,缺乏吸引性。信息檢索課的實踐教學時間要佔用到總課時的一半,這樣的教課效果可能最好[ 3 ]。因此,實踐教學必須要提上日程,依據面對的授課學生專業的不同,教師也應對實踐教學內容進行調整,如果要求以醫學生本專業內容按其本人興趣寫一個綜述性小論文,教師應以現場提問的方式教會學生選用什麼樣的檢索詞才能更好的檢索出與自己興趣相關的文獻綜述,進行現場檢索演示,這樣與學生互動,進行直接面對面的檢索與提問,更有利於提高學生的實踐動手能力,也有利於提高他們學習這門柘城的積極性。當學生髮現信息檢索課有利於自己專業學習能力提高時,會促進其更自覺的好好學習信息檢索這門課[ 4 ]。因此,怎樣更好的將醫學的專業學習和信息檢索課更好的聯繫在一起呢?下面就將循證醫學思維運用到信息檢索的教學中,以期對信息檢索教學現狀出現的問題實現改革。

二、基於循證醫學的信息檢索教學改革

(一)循證醫學對信息檢索課教學內容的豐富

現今醫學高等院校講解的醫學信息檢索課主要是講解一些檢索的基礎性概念以及針對學校擁有的各種專業數據庫教授一些檢索的基本方法和技能,但是由於學生缺乏實踐操作的機會,而枯燥乏味的概念又難以消化理解,即使課堂上學生掌握了所講解的內容,但是用不了多久就會完全忘記,導致學無所用。因此,一定要將信息檢索課的知識與學生的專業背景相聯繫起來。循證醫學遵循的原則是醫學臨牀實際遇到的問題,必須經考究分析找出科學證據,再結合臨牀經驗,做出的正確處理;將循證醫學的思維引入到信息檢索課中來,信息檢索的知識可以幫助循證醫學更快更準的找到文獻證據,而循證醫學又可以幫助學生更好的笑話理解信息檢索的知識[ 5 ],二者相輔相成,達到共同的目的:讓學生更好更快的掌握所學知識。譬如解決一個醫學問題:要求學生在醫院實習期間做一個小兒膿毒症調查。首先計劃好做這項調查分爲哪幾個環節,具體的實施步驟等。在做實際調查前教會學生首要做的就是檢索文獻,查找科學依據,這就是信息檢索課所需要掌握的技巧;第二,運用循證醫學思維篩選文獻並依據地域和環境實際因素等,得出最佳調查方案實施調查。循證醫學思維運用到信息檢索課的教學中來可以有助於學生更好的學習這門課程以及作出更好的科研。

(二)循證醫學對信息檢索課教學方法的創新:在線教學和自助教學

隨着高校校園網的逐步完善,現今大學生都會熟練地運用網絡進行交流,因此,採用現有網絡技術對學生實施在線和自助教學會有事半功倍的效果[ 4 ]。增強學生的自主性、自律性以及學習的積極性,使得網絡信息檢索課不僅提供給學生內容豐富的ppt知識,還給他們提供充分發揮能動性的機會,實施自助網絡教學,檢索課教師加以輔助性的指導,讓學生自己動手在網絡數據庫中自主學習,網上完成老師佈置的作業和考題,這樣就充分調動了學生主動學習的積極性,教師還可以根據醫學院校大學生的專業特點,提供醫學經典案例,鍛鍊學生充分發揮想象力,運用循證醫學原理蒐集文獻[ 5 ]。後期通過查看學生蒐集文獻,以相關文獻全面性和準確性作爲評價標準,找出學生存在的不足,再一對一的進行講解。這樣的互動式的實踐學習方法既有利於促進學生學習循證醫學知識,又有利於他們更好的掌握信息檢索課的檢索技能。

(三)循證醫學對信息檢索課教學模式和考覈方式的改革

大部分醫學類院校對網絡信息檢索課的考覈方式並沒有統一,而是根據教師自行決定,有的採用網絡提交作業的方式,有的採用現場筆試,但是無論何種考覈方式都存在一個問題,就是常常把循證醫學的內容忽略掉,試卷內容往往只包含一些檢索概念及技能,並沒有很好的將循證醫學思維融合進來,對學生動手能力及其信息素養能力的培養也就成了空談[6]。因此,必須將循證醫學思維設計進入信息檢索的考題中,這樣學生才更有興趣更好的掌握這門課程,譬如:讓學生依據個人興趣愛好寫一份醫學檢索報告。根據個人所選內容寫出檢索文獻的思路和檢索式。依據循證醫學注重實踐的思路,施行網絡上機隨機抽取試題的考試方式,每個學生抽取的試題都不一樣,考試內容隨機,比較靈活。這樣不但拓寬了學生的檢索思路,同時也增強了學生循證醫學思維的運用能力。循證醫學思維運用到網絡信息檢索課中來提高了學生的實操和信息素養能力。

互聯網地位的日益凸顯,使得各高校越來越重視網絡信息檢索這門課程,醫學院校中在循證醫學的輔助下,信息檢索課變得更加的多元化、立體化,學生可以更積極主動的好好學習這門課,網絡信息檢索課有着更光明的未來。

作者簡介:

信息檢索論文 篇四

一、前言

計算機的日益普及和計算機技術日益成熟,使得計算機在工業控制監測中的應用漸漸深入。但工業應用不同於其它方面,它要求有較強的實時性。現在有很多的DOS軟件在運行過程中通過掛接外部中斷方式實現DOS應用軟件與外設的實時通信,這種方法實現起來十分簡單。而在Windows中應用程序能否也能夠利用外部硬中斷實現外設與Windows應用程序的實時通信呢?答案是肯定的。這裏的關鍵是要解決好中斷代碼與Windows應用程序相互之間交換信息的問題。

從外設發送異步的硬中斷,通過中斷處理程序傳遞一條信息給Windows應用程序。這時可以初始化相關端口,準備好數據,然後進行數據傳送,從而做到實時通信。

實現Windows應用程序響應外部中斷的方法有很多,如Microsoft公司自己開發的SDK、DDK軟件包,使用嵌入式彙編等等。本文將介紹一種在BC++3.1的基礎上利用Windows3.1擁有的一些功能實現Windows實時通信的實例。

二、中斷代碼的位置

在Windows中,幾乎所有的異步事件都是由中斷處理程序來管理的。中斷處理程序包含在設備驅動程序中,由Windows在環境初始化中安裝。例如,KEYBOARD.DRV、MOUSE.DRV和COMM.DRV均含有中斷處理程序,以處理相應的鍵盤、鼠標和串行口的異步中斷。可以仿照標準設備驅動程序,編寫中斷處理代碼,以響應外設的通信請求,從而完成一次實時通信。

中斷代碼既可以包含在應用程序的可執行代碼中,也可以包含在動態連接庫(DLL)中。包含在應用程序中的代碼只能在一個程序中使用,而在動態連接庫中的代碼則可以在Windows系統中所有的應用程序所共享。這樣不僅在整個Windows系統中只有一箇中斷代碼的副本,提高了內存的使用效率,更重要的是可以防止由於同時存在多箇中斷代碼的副本而發生衝突。本文將在DLL中編制中斷處理程序。

當動態連接庫被裝入時,要調用DLL庫的入口點LibMain(),利用這一點可以執行一些初始化工作,可以分配一些內存塊,可以初始化一些全局變量或者靜態變量,可以安裝中斷服務程序的代碼等等。例如:

voidinterrupt(oldIsr)(--CPPARGS)

/*舊的中斷服務程序地址*/

LibMain(HANDLEhInstance,WORDwDataSeg,WORDcbHeapSize,L

PSTR

lpszCmdLine)

{

oldIsr=getvect(IRQNum);

/*IRQNum指中斷號*/

setvect(IRQNum,newIsr);

/*newIsr指新中斷服務程序代碼*/

return(1);

}

函數setvect()既可在實模式下,也可在保護模式下設置中斷處理向量。

上述代碼也可以放在一個由用戶設置的引出(export)函數中,在應用程序中用戶可以調用此引出函數來安裝中斷服務程序代碼。

由於中斷可以在任何時刻發生,中斷代碼必須駐留在內存中,並且在應用程序運行的過程中一直處於某一固定內存中。這一點無論是在實模式還是在保護模式下都是一致的。

在DLL的模塊定義文件中應注意:

1.CODE語句爲固定代碼段,即FIXED;

2.EXPORTS語句要引出被應用程序和其它DLL用作入口點的函數。

三、通信機制

編寫實時通信例程關鍵在於必須認識到,異步事件對應用程序的觸發是異步發生的,不在Windows的消息處理機制和多任務範圍內。爲了使通信例程能夠正確地工作,通信例程必須通知Windows有異步事件發生,且不能打斷應用程序的任務管理或消息流。要作到這一點,通信例程必須通過調用PostMessage或PostAppMessage函數嚮應用程序的消息隊列中加入一條消息。

需要注意的是,在DLL中調用PostMessage(HWNDhwnd,…)時,必須先確定hwnd的實際值,可以通過使用引出函數的辦法來實現,如下所示:

staticHWNDhWndApp;

voidFARPASCALSetIsrWin(HWNDhwnd)

{

hWndApp=hwnd;

}

然後在應用程序的窗口函數中,對WM-CREATE消息進行處理時調用此函數來初始化DLL中的靜態變量hWndApp:

CASEWM-CREATE:

SetIsrWin(hwnd);/*hwnd指應用程序窗口句柄*/

定義一個在應用程序中使用的消息:

#defineISRM-RUPTWM-USER+255最後在DLL中的中斷服務程序代碼中,調用PostMessage即可完成Windows應用程序和中斷服務程序代碼相互的信息交流:

voidinterruptnewIsr(--CPPARGS)

{

PostMessage(hWndApp,WM-RUPT,wParam,lParam);

}

四、程序實例

本示例先安裝在DLL中的外中斷服務代碼,通過386/AT總線上的中斷申請線(IRQ12)外觸發,由中斷服務代碼發送一條消息WM-RUPT通知Windows應用程序外設有實時通信請求,應用程序收到這條消息後,在窗口用戶區顯示一條信息,表明已和外設聯絡上,並同時鳴叫一聲喇叭。

信息檢索論文 篇五

1.1信息載體多樣化、信息存儲手段數字化。隨着計算機技術、數字化技術、信息加工和存儲技術的發展,信息載體逐步由傳統的紙質載體向磁性載體、電子載體等多種載體形式發展。信息的存儲手段也相應發生了革命性的變化。由以數字化的全文、文摘等方式向用戶提供的服務越來越多,越來越普遍,在很大程度上替代了傳統的印刷型文獻的服務範圍。

1.2信息檢索工具逐步由印刷型向數字化、電子化的數據庫轉變傳統檢索工具多爲印刷型,隨着科學技術的發展,檢索工具逐步轉爲數字型。國際上大型檢索數據庫的建立已有30多年的歷史,如Dialog系統和Medline系統已具有很大的規模,用戶遍及全世界。

1.3信息檢索方式發生了很大變化操作平臺Windows化,數據鏈接超文本化,通信手段網絡化,計算機檢索已成爲目前檢索技術發展的主要特徵。圖書館不僅是傳統的印刷型文獻信息中心,而且正逐步成爲數字化信息中心。目前大部分高校開通了遠程網絡數據庫,或建起了網絡數據庫的鏡像站點。信息檢索方式由手工轉爲計算機檢索,發生了根本性的變化。文獻檢索課實習方式也要隨之發生變化。

2.文獻檢索課實習內容改革

2.1手工檢索實習仍要保留,但要降低比重隨着計算機、網絡技術的迅猛發展,作爲文獻檢索課實習的兩大組成部分的手工檢索實習和計算機檢索實習的地位正在發生重大變化。計算機文獻檢索系統的快捷、靈活、方便等優點,正逐步佔領信息檢索的統治地位。但計算機檢索是近幾年才發展起來的,收錄年限較短,文獻覆蓋面較小,仍不能完全取代手工檢索,因此,還需保留手工檢索教學與實習。手工檢索實習方面,重點是讓學生掌握檢索工具書的具體使用方法。一般的檢索工具書是按分類法檢索語言和主題詞檢索語言來組織其文獻信息的。所以有必要讓學生了解分類法和主題詞這兩種組織文獻信息的科學方法。通過實習,把收集到的文獻信息資料進行分類,這是一種對信息的組織管理能力,也是對信息的評價過程,通過這種分類,學生對信息包含的概念,信息增量、信息特性,就會有更清楚、深刻的認識。同時,從分類途徑檢索信息也是信息獲取的重要手段。對於主題詞,一方面,可以對收集、檢索到的文獻信息資料用主題詞的方法進行組織、概括、管理;另一方面可以利用檢索工具書的主題索引來檢索信息,使學生具備從收集、摘錄的信息中概括出主要的觀點,能綜合主要的觀點來重建新的概念的能力。可以設計作業來訓練學生運用這兩種科學方法檢索、組織信息的能力。

2.2側重計算機檢索實習

2.2.1增加計算機方面的基礎知識介紹與實習。隨着計算機、網絡技術的飛速發展和多媒體技術的廣泛應用,信息檢索手段的自動化和網絡化程度不斷提高,信息傳播的深度與廣度達到了前所未有的水平。文獻檢索實習離不開計算機,離不開計算機網絡,文獻檢索實習中首先應增加計算機基本應用技能練習,爲掌握中外計算機信息檢索系統的使用方法和技巧打下結實基礎。

2.2.2增加網絡、通訊的基本知識和使用方法的實習。增加網絡、通訊的基本知識和使用方法的實習,特別是網絡信息的傳輸、交流與利用,如FTP、E-mail、BBS等。增加網絡信息資源的種類與特點,網絡數據庫和Internet信息利用方面的知識,對著名的網絡數據庫、虛擬圖書館、專業檢索網站、網上電子期刊檢索、網絡信息作重點介紹。尤其是培養學生使用互聯網搜索引擎。目前,針對學生畢業論文的寫作重點介紹一些專門的信息檢索系統。比如一些著名的檢索工具的網絡版:Dialog聯機檢索系統,STN聯機檢索系統;CNKI工程的系列產品:中國期刊全文數據庫、中國優秀博碩士學位論文數據庫等;超星電子圖書、書生電子圖書等;springer數據庫,Ebsco數據庫等。

2.2.3網絡資源查詢工具及其使用方法等予以介紹與實習。計算機檢索實習的另一個重點就是網絡信息資源檢索,其主要內容就是介紹檢索網絡信息資源的一些重要的搜索引擎及其使用方法,如:Google、Excite、Infos-eek、Yahoo!、網易(NetEase)、搜狐(Sohu)、新浪(Sina)等進行關鍵詞、網頁、分類目錄和網站搜索的能力,使學生能快速地查找所需信息。要讓學生通過以上的學習,能夠比較熟練地掌握網絡的基本知識和使用方法,掌握常用社會科學及農業數據庫的使用,學會正確選擇數據庫,運用機檢的基本方法和技巧,構造檢索表達式,比較不同檢索表達式的不同檢索結果,積累檢索經驗,掌握機檢的一般規則和技巧。對網絡信息可以自如地檢索、閱讀、下載、保存。通過信息資源的收集、整理、閱讀、鑑別和科技論文的寫作,重點培養學生的自學能力、科研創新能力。

3.實習方法改革

除手工檢索仍按傳統方法實習外,在計算機網絡技術環境下,文獻檢索課實習應以網絡爲基礎,製作多媒體課件,利用網絡和多媒體進行實習演示。手工檢索實習與計算機檢索實習比重爲3比7或4比6較好。對不同專業重點講解不同數據庫,如給經濟管理專業的學生重點講授中文期刊數據庫(清華同方)、中文科技期刊數據庫(重慶維普)、萬方數據庫、EBSCO數據庫之外,要重點介紹《中國經濟信息網》的使用方法、技巧。以課件形式詳細演示各數據庫打開方式、檢索策略、檢索步驟及注意事項等。每人一臺計算機,也可以幾人一組,共同協作完成某課題,可作示範性打印,並要求寫出檢索報告。在教學講授之後,要緊接着安排實習,加深對課堂講授知識的印象。對不同專業設置不同課題,有針對性的進行實習。要求學生熟練掌握本專業主要數據庫的使用方法,會用搜索引擎查找所需的各類信息,會利用E-mail,BBS、Netmeeting提問、答疑、交流,進行交互式、討論式教學,讓學生自己動手、動腦,主動地思考問題,最大限度地發揮學生的能動性。同時要求學生把畢業選題作爲實習課題,手工檢索與計算機檢索同時使用,寫出實習報告,闡述畢業選題及目前國內外研究現狀,確定畢業課題立足點和研究方向,並附檢索到的文獻。只有這樣,才能跟上時展,把學生真正帶到快、精、廣地獲取文獻信息的前沿。

4.文獻檢索課實習改革支撐條件

4.1要具備計算機、網絡基礎設施

文獻檢索課實習中的手工實習部分,應配備好足夠的文獻檢索工具書,建立傳統文獻檢索實習室;計算機檢索部分要求在網絡環境下,採用先進的機檢教學設備,良好的網絡環境,單獨建立計算機檢索實習室或利用電子閱覽室作爲實習基地,開展光盤檢索、網絡教學,增加計算機檢索實習學時。要建立有一定規模的多功能電子閱覽室至少要有50臺計算機,建立小光盤局域網,同時聯接校園網及INTERNET才能滿足機檢教學實習順利進行的要求。

信息檢索論文範文 篇六

[摘要]:因特網上的信息資源,是指以數字形式記錄,以多媒體形式表達,存貯在網絡計算機磁介質、光介質及各類通信介質上的信息集合。對網絡信息資源及其檢索進行必要的研究,有助於人們快速準確地獲取網上有用信息,推動社會信息化與信息社會化的雙向發展。因此本文闡述了網絡環境下的信息資源檢索策略及其應用。

[關鍵詞]:網絡環境,信息檢索,信息過濾,文本挖掘

一、引言

21世紀是一個高度信息化的社會,信息就是生產力,在各個行業信息化發展的同時,人們對信息檢索的完備、準確、快捷會有更嚴格的要求和期望。作爲文獻信息中心的圖書館也迎來了一個全新的信息環境,豐富的網絡信息資源爲圖書館的信息服務提供了廣泛的資源基礎,使網絡環境下的信息資源檢索策略發生了重大的變化。

二、網絡信息的特點

(一)數量巨大而龐雜。Internet是一個基於TCP/IP協議連接世界各國數以百萬計算機網絡的通訊網,是一個集各種信息資源爲一體的信息資源網。政府、機構、企業、個人等都可以在網上信息,因此它己成爲無所不包的龐雜信息源,並具有跨地區、分佈廣、多語種、高度資源共享的特點。

(二)內容範圍廣泛。網上的信息源幾乎涵蓋了人類知識的全部領域,既有人文科學、社會科學、自然科學、工程技術信息,也有大量生活服務、娛樂消遣等方面的信息。

(三)信息類型豐富。其主要形式有網絡出版,包括電子期刊、網上圖書、電子工具書等;各種動態信息主要包括新聞、廣告、股市行情、天氣、交通、會議等;還有大量的書目數據庫、聯機數據庫、軟件資源以及個人主頁、電子郵件等。這些信息都是數字式、多媒體,既有文本的信息,也有大量的圖形、圖像、音頻、視頻信息。

(四)動態性強。網上信息具有高度動態性,各種信息處在不斷生產、更新淘汰的狀態,同時連接在一起的各網絡、網站、網頁都時時刻刻在變化。網絡信息還具有交互式特點,如BBS、聊天、遊戲等。

(五)信息組織特殊、控制性差。因特網上信息的組織以超文本技術鏈接,構成立體網狀文獻鏈,把不同國家地區、不同服務器、各種網頁、各類不同文獻的相關信息都通過節點鏈接起來,使得檢索相關文獻、相關信息非常方便,加強了信息間的關聯度,形成了一個網狀結構。

(六)有序與無序,集中與分散並存。互聯網上的信息沒有統一控制,雖然從局部來說某個網站、某個數據庫是有控制的、相對集中的、有序和規範的,但總的來說互聯網的信息沒有統一的控制,信息質量良蕎不齊,信息也處於分散、無序、不規範的狀態之中。

三、網絡環境下的信息資源檢索策略及其應用

科學技術的日新月異和用戶需求的不斷提高促使網絡檢索工具相應發展,網絡環境下的信息資源檢索策略及其應用可以分爲以下幾個方面:

(一)信息過濾技術及其應用

Internet開放式的環境,爲人們檢索和利用信息提供了極大的方便,但同時,網絡環境也爲人們及時準確地檢索到所需信息帶來了麻煩。信息過濾技術就是在這樣的背景下開始受到人們的重視,它的目的就是讓搜索引擎具有更多的“智力”,讓搜索引擎能夠更加深入、更加細緻地參與到用戶的整個檢索過程中,從關鍵詞的選擇、檢索範圍的確定到檢索結果的精煉,幫助用戶在浩如煙海的信息中找到和需求真正相關的資料。

在用戶的檢索過程中,信息過濾可以通過多種途徑實現。第一,關鍵詞的選擇。當用戶要檢索不太熟悉的領域時,系統可以通過提供機讀類詞表的方法方便用戶選詞,也可以通過後控詞表等方法自動擴大或縮小(通常是通過近義詞表擴大)檢索範圍,提高查全率和查準率;第二,利用過濾模型。過濾模型是目前Internet上信息過濾主要方法,它是通過設計過濾軟件並附加到網絡信息檢索的程序中以增加過濾功能。這主要表現在兩個方面,一方面,搜索程序在進行信息搜索時可通過過濾功能過濾掉一些認爲價值不大或沒有價值的信息;另一方面,用戶也可根據自己的需求選擇服務項目與內容,通過過濾機制快速找到所需的信息資源。其方法是根據需求設置過濾條件,如不希望獲取的網址、某類主題的內容、某種類型或範圍的信息等,程序在運行時一旦觸發條件,則可將有關信息刪除或拒之門外,而其他信息仍可輸入。

(二)文本挖掘技術及其運用

文本挖掘是知識管理研究領域的新興分支之一,爲文本信息的整理、分析、挖掘提供了有效的手段。傳統的信息檢索或信息訪問,主要根據用戶提供的查詢條件從文檔數據庫中檢索出相關的文檔信息。爲了提高信息訪問的準確性,檢索系統增加了相關處理,如文檔分類、自動文摘、主題詞自動抽取等方法,使用戶能夠方便查找到所需信息。在文本挖掘處理中,大多采用神經網絡模型描述文本及文檔數據庫各概念之間,以及概念和文檔之間、文檔與文檔之間的相互關係在信息檢索中,無須分析文檔中概念之間的相互關係,只要依據用戶的查詢,返回相關文檔集合。但是,文本挖掘不僅能夠區分不同的概念,還能夠分析不同概念結點之間的相互關聯關係。

1、文本內容挖掘在檢索中的應用。文本內容挖掘是指從文檔內容及其描述中獲取知識的過程,由於用傳統的信息檢索技術對文本文檔的處理不夠深入,因此,可以利用文本內容挖掘技術來對網絡信息檢索中的文本文檔處理部分進行進一步的完善。

2、文本結構挖掘在網絡信息檢索中的應用。文本的信息組織方式採用了一種非平面結構,一般來說文本的信息組織方式是根據內容來進行組織的。但是由於文本的這些結構信息比較難以處理,所以搜索引擎一般不處理這些信息,而是將文本頁面作爲平面機構的文本進行處理。但是,在文本結構挖掘中,通過對文本文檔組織結構的挖掘,搜索引擎可以進一步擴展搜索引擎的檢索能力,改善檢索效果。

3、文本行爲挖掘在網絡信息檢索中的應用。文本行爲挖掘是一種通過挖掘總結出用戶的檢索行爲的模式。用戶的檢索行爲一直是信息檢索中重要的研究內容,通過文本行爲挖掘,不僅可以發現多數用戶潛在共同的行爲模式,而且還可以發現單個用戶的個性化行爲,對這些模式進行研究,可以更好地對搜索引擎的檢索效果進行反饋,以便進一步改進搜索策略,提高檢索效果。

(三)全文檢索技術及其運用

我國對全文檢索技術的研究已經有一段時間了,也取得了一定的成果。主要集中在漢字全文檢索、超文本全文檢索、網絡環境下的全文檢索技術等方面。全文檢索作爲一種發展迅速的檢索技術,近年來已得到廣泛的關注並走向市場。有學者提出的“漢字全文檢索系統的關鍵技術與實現”,在對中西文全文檢索系統進行分析比較的基礎上,提出了一種新的索引建立方式,並在此基礎上,實現了支持模糊提問的全文檢索。同時獨立設計了自己的數據結構和算法,以及利用VisualC++在Windows環境下加以實現。全文檢索技術的運用包括:1、檢索主題要求對全文檢索效果的影響:通過適當擴大檢索範圍或多字段聯組檢索來改善檢索主題專指度過高;縮小檢索主題範圍,提高查找專指度,採取適當的檢索策略,來限制檢索主題範圍太寬;提高檢索主題要求的明確性;2、組配檢索式對全文檢索效果的影響,導致在確定檢索詞時,不僅僅要考慮到各檢索詞本身的切題與匹配。在這方面雖然取得一些成績,但是國內的全文檢索軟件全是商品化的,其技術都不公開,導致低水平重複;漢語本身有難度,國內目前還沒有公開的詞庫及可用的自然語言理解模塊,重複研究的現象比較嚴重。

(四)自然語言處理技術及其運用

自然語言處理(naturallanguageprocessing,簡稱NLP)是語言信息處理的一個重要分支。所謂自然語言處理就是計算機對自然語言的形、音、義等信息的理解及詞、句子、篇章的輸入、輸出、存儲和識別等多方面的加工。尤其側重於研究計算機對於句子、篇章的處理。

自然語言處理在網絡信息檢索中的應用方式主要有以下幾種:

1、自動標引

由計算機實現文獻標引,分爲抽詞標引和賦詞標引兩種類型,前者是從文獻中自動抽出能表徵文獻主題的詞作爲標引詞,而後者則在此基礎上引入預先編制的詞表來規範自動抽取出的詞,不過這種詞表從其生成來看與規範語言詞表本質上是不同的,自動標引的目的是賦予文獻自然語言標引詞,以使檢索時直接用自然語言詞進行匹配查找。

2、自動文摘

利用計算機來完成文獻文摘的編制。其一般過程爲:(1)原始文獻的錄入,使之轉化爲機讀形式;(2)確定每個單詞和句子的“意義”與權值的測量標準;(3)通過計算每個單詞和句子的權值來分析輸入計算機內的文獻,選出一組最能代表文獻主題內容的句子;(4)排列和打印句子,形成文摘。

3、文本檢索

文本是文獻題名或文摘、文獻的正文。文本檢索就是不對文獻進行標引,而是以自然語言表達檢索課題。它需要藉助計算機的自動匹配功能直接在篇名、文摘、正文中查找。文本檢索要掌握字符串匹配、截詞檢索、位置邏輯檢索等技術。

四、結論

總的說來,變化是因特網發展的永恆主題,也是網絡信息檢索的發展主題。隨着因特網技術的發展,網絡信息檢索將不斷的改進和完善,越來越滿足人們的網絡信息的獲取需求。

[參考文獻]:

1黎小妮網絡信息資源檢索研究圖書館學刊2006(5)

2王平網絡環境下信息資源及信息檢索遵義科技2006(3)

3陳劍網絡信息資源檢索存在的問題及解決對策情報資料工作2005(5)

信息檢索論文 篇七

關鍵詞:信息素養;高職院校;文獻檢索課

在當今知識社會和信息時代,信息素養是大學生必須具備的基本素質。目前在高職院校中培養大學生信息素養主要的途徑之一就是文獻檢索課程。隨着高職院校的快速發展,尤其是信息技術的不斷髮展,互聯網的不斷普及,對於大學生信息獲取、信息分析、信息利用能力的要求也越來越高。如何改進和創新文獻檢索課程的教學,有效提升大學生信息素養,是高職院校面臨的一個重要課題。

1 文獻檢索課是開展大學生信息素養教育的重要途徑

信息素養的定義最早是由美國信息產業協會主席Paul Zurkowski於1974 年提出來的,他把信息素養定義爲:“人們在解決問題時利用信息的技術和技能”。美國圖書館協會在其1989年的報告中明確信息素養的概念,爲:“個體能夠認識到何時需要信息,能夠檢索、評估和有效地利用信息的綜合能力”。隨着信息社會的發展,終身學習的能力是我們必須具備的基本素養。而終身學習能力在很大程度上取決於自身信息獲取、分析和利用的能力,即信息素養。高職院校培養的是應用型人才,其理論教育相對較少,這就要求所培養的人才要有較強的自學和獨立研究能力,因此,培養信息素養尤爲重要。

目前在高職院校中培養信息素養的主要形式和主要渠道就是文獻檢索課程。文獻檢索課程的教學目標是增強學生信息意識,培養學生獨立獲取、收集、分析、處理信息的能力,改善知識結構,爲自主學習、繼續學習和終身學習打下良好的基礎。其核心是培養學生的信息意識和全面提高學生的信息能力。同時,文獻檢索課整個教學過程不僅僅是讓學生去尋找知識、識記知識,還有意識地培養學生的創造性思維,培養學生提出問題、分析問題及解決問題的能力,這種思維和能力的培養將爲其現在的學習和日後的工作奠定良好的基礎。

高職院校圖書館作爲文獻資料和信息中心,是爲教學和科研服務的學術機構, 在學校中佔據着重要的地位。 同時,圖書館也是大學生汲取知識,開闊視野,陶冶情操的重要場所。隨着網絡的日益普及和自動化、電子化程度的提高,高職院校圖書館的服務內容、手段和方式都發生了巨大變革,圖書館教育職能得到了拓展,其教育和信息服務功能已上升到主導地位。開展信息素質教育,培養學生的信息意識和獲取利用信息的能力成爲圖書館新的工作重點。因此,加強文獻檢索課程建設,將信息素養教育貫穿全部教學過程,普及信息觀念意識,增強大學生的信息素養,是高職院校圖書館面臨的一個重要課題。

2 高職院校文獻檢索課教學的現狀及存在的問題

我國高職院校文獻檢索課程興起於21世紀初,多年來爲培養學生的信息素養髮揮了重要的作用。但是由於種種原因,目前文獻檢索課的教學還存在着不少問題,主要體現在以下幾個方面。

高職院校對文獻檢索課的重視程度,遠不如本科院校。高職院校注重學生的專業技能的培訓,實訓是教學的重點。一般採取“2+1”的人才培養模式,前兩年在校學習,第三年到企業實習實訓。因此,學生的課時相對比較緊張,文獻檢索課多作爲公共選修課,其教學經費的投入、教師的安排、教學計劃的編制等都不如其他學科受到學校的重視,學生選修的也不多。

2.2 教學內容單一,與專業學習結合較少

文獻檢索課在教學內容的選擇上也普遍存在問題。有些教學內容中是模仿本科院校的內容,不符合高職院校學生的知識層面。並且,據調查瞭解,各高職院校基本上都以公共選修課的形式來開設文獻檢索課,面向全院學生,不分專業和年級。教學只能兼顧所有專業,側重介紹一些基本理論,基本的檢索技能以及圖書館購置的電子資源等,很少涉及信息法律和信息道德的教育,也無法與專業學習相結合,不能滿足學生的專業化、個性化的信息需求,缺少對學生的吸引力,學習效果難以保證。

2.3 教學方法單一,實踐教學不足

文獻檢索課的定位應該是一門實用的方法課,教授的應該是文獻檢索方法,在教學過程中應該側重學生操作技能的培養和實際應用能力的提高。但是,目前文獻檢索課的授課雖然大部分採用了多媒體的現代教學手段,但教學模式仍然是以課堂講解爲主,動手實踐爲輔,這種教學模式難以發揮學生學習的積極性與主動性,也不符合文檢課的教學目標,教學效果不佳,不利於大學生信息素養的培養和提高。

2.4 師資力量薄弱

文獻檢索課的實踐性要求任課教師不僅要掌握圖書館學、情報學等相關理論知識,具有較好的計算機應用能力,而且要具備一定的專業知識背景。目前多數高職院校的文獻檢索課的教師是由圖書館員兼職。他們當中大多數人雖然比較熟悉文獻檢索的基本知識以及文獻檢索的方法,但對各專業課程相關的知識卻較爲匱乏,不能有針對性地開展教學工作。並且,由於得不到重視,文獻檢索課的教師缺少必要的進修、培訓機會,知識不能得到及時更新。這些都在一定程度上制約了大學生信息素養教育的發展。

3 加強文獻檢索課程建設,提高大學生信息素養

3.1 高度重視,加強宣傳

首先,高職院校的領導層要充分認識到信息時代大學生學習文獻檢索課程,提高信息素養的現實作用和長遠意義,以及文獻檢索課程對於學生學習其他課程和提高綜合素質的特殊作用。要高度重視文獻檢索課程的教學,將其納入學校的課程體系和教學計劃中,爲文獻檢索課程建設提供政策支持和加大資金投入。

其次,採取板報宣傳、網絡宣傳和專題講座等多種形式,廣泛宣傳信息素養的重要性以及文獻檢索課程的目的和意義,營造一個推廣信息素養教育的大環境,使廣大師生提高認識,增強興趣,共同參與到文獻檢索課程的教學活動中去。

3.2 更新文獻檢索課程的教學理念

文獻檢索課程的教學必須樹立信息素養教育的理念。傳統的文獻檢索課教學思想已經不符合時代的要求。通過文獻檢索的方法來拓寬學生的視野,提高學生的自學能力和研究能力纔是文獻檢索課的重要理念。文獻檢索課程的教學目標應該定位在培養學生的信息素養上,提升學生在信息時代自主學習的能力,使文獻檢索課程教學由培養檢索技能提升到提高信息素養,將信息素養育與終身學習相結合。

3.3 調整文獻檢索課程的教學內容

一個人的信息素養主要體現在信息意識、信息能力和信息道德三個方面。傳統的文獻檢索課程教學側重於文獻檢索理論、數據庫的使用、檢索技能的培訓等,很少涉及到信息意識、信息法律和信息道德的教育。因此,高職院校文獻檢索課程的教學內容要增補這些方面的內容,教導學生在獲取和利用信息時要自覺遵循信息道德和信息法規,培養學生嚴謹正直的科學態度。

同時,由於網上信息資源的日趨豐富,圖書館也正由傳統型向數字化方向的發展,因此,高職院校應確立以網絡信息檢索與利用爲主體的教學內容,在介紹文獻檢索的理論和常用數據庫使用方法的基礎上,着重講解計算機檢索的策略和技巧,把館藏文獻利用、網絡信息資源利用和計算機檢索聯繫在一起。

3.4 完善文獻檢索課程的實踐教學

由於文獻檢索課程實踐性很強,高職院校應注重學生實踐能力的培養,加強實踐環節,要根據不同的專業相應地增加實習課時。可將課堂講授與上機實習相結合,穿行,講授1—2種數據庫即佈置一些典型課題讓學生上機實習,針對課題查找相關資料,撰寫檢索報告等,讓學生進一步熟悉和掌握檢索的具體步驟、方法和技巧,從而逐步提高學生分析課題和收集利用信息資料的能力。

此外,還可以把文獻檢索課程與學生畢業設計或實習相結合,增加文獻分析和綜述的寫作內容;佈置和指導學生參加社會實踐活動,帶着問題去調查研究等,從而真正達到“學以致用”的教學目標,切實提高大學生的信息檢索能力和分析解決問題的能力。

3.5 加強文獻檢索課程的師資建設

教師的素質直接影響學生的學習興趣和教學效果。一名合格的文獻檢索課程教師,除掌握一定的文獻情報知識,具備情報信息操作能力,還必須熟悉計算機操作技能,有較強的教學組織能力和語言表達能力。目前,各高職院校都特別缺乏此類複合型的文獻檢索課程教師。因些,必須大力加強師資隊伍的建設。一方面,高職院校圖書館可以引進一些圖情專業和計算機專業的人才來充實師資力量,使師資隊伍結構更加合理和完善;另一方面,學校還應加大經費投入,爲文獻檢索課程教師提供進修和學習深造的機會,促使師資隊伍的整體素質不斷提高。教師本人也要樹立終身學習的觀念,不斷提高自身素養,積極參與科學研究、科技查新、課題信息服務等,並將實踐經驗運用到教學中,理論聯繫實際,這樣纔能有效提高教學效果,實現提升學生信息素養的教學目標。

4 結語

提高大學生信息素養是信息時代的需要。文獻檢索課是培養大學生信息素養的重要途徑,文獻檢索課程的建設直接影響到大學生信息素養教育水平的高低。高職院校圖書館必須適應新時期高職教育和時展的需要,不斷地改革和創新,提高文獻檢索課的教學實效,切實增強大學生的信息素養,提高他們的學習能力,爲實現高職教育的人才培養目標作出應有的貢獻。

參考文獻

[1]徐萬胥,劉向永。美國當代信息技術教育思潮評價[J].中國電化教育,2002,(11):72-74.

[2]邢燕麗。信息素質教育改革與大學生創新能力培養[J].圖書館工作與研究,2009,(3):93-96.

[3]劉培蘭。信息檢索通識課程創新教學模式研究與實施對策[J].圖書館學研究(理論版) ,2010,(7):71-74.

[4]李杉杉,周靜珍。新形勢下文獻檢索課由檢索技能型向信息素養型模式轉變的探討[J]. 科技情報開發與經濟2010,(28):8-11.

[5]談政。高職院校信息檢索課教學現狀與改革探討[J].職業時空,2011,(7):37-38.