- 相關推薦
淺析貝葉斯網絡在自適應超媒體系統中應用研究
論文關鍵詞:貝葉斯網絡 自適應超媒體 用戶模型
論文摘要:本文通過分析超媒體系統中的不確定性因素,引A.T貝葉斯網絡方法。在介紹貝葉斯網絡概念的基礎上,分析了貝葉斯網絡的優化方案,討論了自適應超媒體系統中貝葉斯網絡構造過程。
在自適應超媒體系統中,其關鍵技術之一就是用戶建模,可以說,用戶模型既是自適應超媒體系統的特點,也是難點。用戶建模技術將需要處理眾多的不確定因素,例如,如何準確評估用戶的知識程度、如何準確預測用戶的學習目標、如何選取合適的學習計劃等都是一個值得深入研究的問題。
這些問題都涉及到用戶模型的兩個功能:評估和預測。而自適應超媒體系統能否準確生成合適的自適應內容和自適應導航,對用戶的不確定信息的準確評估是關鍵因素。而貝葉斯網絡最大的優點就是處理不確定信息,因此本文將主要探討貝葉斯網絡技術在自適應超媒體系統中的應用。
1超媒體系統中的不確定性
在自適應超媒體系統中,用戶建模過程中存在的不確定性因素最多,用戶模型就是在眾多的不確定因素的基礎上做出對用戶的評估和預測。用戶模型需要處理的不確定因素主要有如下幾類。
(1)關于用戶領域知識的初始掌握程度的不確定性。用戶對領域內的知識掌握程度一般是無法確切衡量的。例如在超媒體系統中,學生的知識水平就存在很大的不確定性,這種不確定性在實際的課堂教學中也無法完全排除。一個超媒體系統在初始化階段,分析用戶在使用這樣的系統之前的掌握程度,一般是通過一組或幾組問題進行測試。如果測試的問題過多,用戶對于系統的興趣就會受到影響,因此大部分的系統在初始化測試時,所采用的問題一般非常有限,這樣對于用戶領域知識的初始化程度就無法很準確的評估。
(2)用戶的瀏覽動作與知識掌握程度之間關系的不確定性。雖然系統能夠精確記錄下用戶與超媒體系統交互的動作的時間,但是,對每一個用戶而言,完成閱讀每一個信息節點的“合適”的時間是無法確切衡量的。一種方法是通過其他途徑獲得每一個用戶的閱讀速度,但這不是所有系統能夠獲取的信息。
(3)用戶的瀏覽動作和目標的聯系的不確定性。認知學的研究成果表明,這種不確定尤其表現在用戶初期使用系統的時候,出于好奇心理,嘗試瀏覽可能和他本身不感興趣的內容。而這些動作有可能對系統在預測用戶的瀏覽目標時帶來不利的影響。
2貝葉斯網絡
貝葉斯網絡是一個概率推理機制,它在概率論的基礎上進行不確定推理。貝葉斯網絡為在某一特定應用領域中描述隨機變量之間的概率獨立性提供了一個圖形化的表達方式,以及利用這些獨立進行復雜的概率推理的算法…。
2.1貝葉斯網絡的定義
貝葉斯網絡又稱為信念網絡,是一種圖型化的模型,能夠圖形化地表示一組變量間的聯合概率分布函數。一個貝葉斯網絡包括了一個結構模型和與之相關的一組條件概率分布函數。結構模型是一個有向無環圖,其中的節點表示了隨機變量,是對于過程、事件、狀態等實體的某特性的描述,邊則表示變量間的概率依賴關系。圖中的每個節點都有一個給定其父節點情況下該節點的條件概率分布函數。這樣,一個貝葉斯網絡就用圖形化的形式表示了如何將與一系列節點相關的條件概率函數組合成為一個整體的聯合概率分布函數J。具體定義如下:
定義:設V={x,x2……X}是值域u上的n個隨機變量,則值域U上的貝葉斯網絡BN(B。,B),其中:
(1)B|=(V,E)是一個定義在V上的有向無環圖(DAG),V是該DAG的節點集,E是該DAG的邊集。如果存在一條節點Xi到節點X的有向邊,則稱Xi是Xi的父節點,Xi是Xi的子節點。記Xi的所有父節點為誠。
(2)Bp={P()(il)6-[0,1]}lxi∈V,對于V中的每個節點,定義了一組條件概率分布函數P(Xl)∈[0,1]。
由貝葉斯網絡,利用貝葉斯公式,我們很容易得到X的全概率分布函數:
P(x)=P(x。,x2……XⅡ)=liP(Xl),誠是Xi的所有父節點。
2.2貝葉斯網絡的優化
貝葉斯網絡的主要用途是進行概率推理。在已知網絡中某些節點概率值的情況下,利用貝葉斯網絡計算可以獲得其它節點的條件概率。這種推理可以形象的稱為條件概率的“”。然而,一般的貝葉斯網絡推理都存在一個“NP—Hard”問題J。當貝葉斯網絡中不存在無向環的結構時,可以找到多項式時間算法,為了將一般的貝葉斯網絡改造為不含無向環的貝葉斯網絡,通常采用以下兩種方法。
(1)聚簇。如圖l所示,將圖中的節點B和C合并成一個節點,從而消除圖l(a)中的有向環,這種方法稱作聚簇。
(2)條件分割。設變量A的取值范圍為:A。,A2,…,,則將原來的貝葉斯網絡分割成n個網絡,分別是A=A。,A=A2,…,A:。這種方法稱作分割,如圖2所示。
(3)貝葉斯網絡舉例。圖3顯示了一個貝葉斯網絡的例子,它模型化了下述的二進制變量:變量a表示病人的年齡大于75歲,變量b表示病人需要戴眼鏡,變量c表示病人眼中出現晶狀體,變量v表示病人的視力由于瞇眼而有所提高,變量s表示病人抱怨視力差,變量r表示病人的視網膜反射可察覺。在這個貝葉斯網絡中,變量a與b之間的弧表明相對于其它變量,a與g是直接依賴的。變量a與s之間沒有弧相連,它們是通過變量b與C而發生依賴關系。
變量間依賴的強弱由條件概率分布函數Bp量化。例如,當a為真,b為真的概率為P(b=TIa=T)=0.75。當給定了變量的父節點的值后,該變量為假的條件概率可以從此變量為真的條件概率中推導出來,在此就沒有給出。
3自適應超媒體系統中貝葉斯網絡的構造
一個貝葉斯網絡由網絡結構表示其定性部分,由條件概率分布函數表示其定量部分。這兩部分必須加以指明以構成一個貝葉斯網絡,之后在一個系統中被用作推導引擎。在超媒體系統中,構造貝葉斯網絡分為四個階段。
(1)定義域變量。在某一領域,確定需要哪些變量描述該領域的各個部分,以及每個變量的確切含義。
(2)確定網絡結構。由專家確定各個變量之間的依賴關系,從而獲得該領域內的網絡結構。在確定網絡結構時必須注意要防止出現有向環。
(3)確定條件概率分布函數。通過由專家確定的網絡結構中每個變量的條件概率分布函數,量化變量之間的依賴關系。
(4)應用到實際系統。運用到實際系統中,利用系統搜集的數據,經過計算和分析,調整貝葉斯網絡的網絡結構和各變量的條件概率分布函數,對貝葉斯網絡進行優化。
在實際應用中,在每一個階段之后,都要進行評估,考察前面的階段是否被成功地執行。每當發現前面階段所得的結論不充分時,前一個階段將被再次執行,否則,前進到下一階段。每個階段發生的錯誤應被及時更正,在早期產生的錯誤若在后期加以更正將比在早期更正花費更大的代價。我們稱重復經歷某個階段并進行評估的過程為建立一測試期(budd—textcycle),據此,我們構建了自適應超媒體系統貝葉斯網絡構造生命周期圖,如圖4所示。
在某一特定領域構造貝葉斯網絡是一件非常困難并且也費時的工作。這種困難一方面來自于某些領域過于復雜,即使該領域的專家也無法完全正確的描述該領域的因果關系,這影響了貝葉斯網絡的網絡結構的構造;而另一方面,人們擅長于描述定性的關系,而不擅長描述定量的關系,這直接造成了在確定條件概率分布函數時的困難。
利用數據庫中的大量原始數據,經過計算、分析,自動構造貝葉斯網絡的網絡結構和條件概率分布函數的方法,是一個能夠有效降低貝葉斯網絡構造工作量的途徑,這方面的研究成為貝葉斯網絡學習問題,最近幾年,研究者提出了許多自動學習貝葉斯網絡的算法,在此不再贅述。
4結語
超媒體系統中存在著眾多的不確定因素,這促使研究者求助于概率理論中的貝葉斯網絡方法,并由此發展成為目前人工智能領域中研究日益廣泛的一個分支一貝葉斯網絡。貝葉斯網絡為超媒體系統提供了一種有效的推理機制,但是如何根據超媒體系統的特點構造一個有效、準確的貝葉斯網絡將成為今后發展的重點。
【淺析貝葉斯網絡在自適應超媒體系統中應用研究】相關文章:
談智能決策支持系統及其在林業中的應用研究08-21
淺析現行主流大學英語網絡教學系統改進08-24
淺析舒曼《阿貝格變奏曲》的創作特點05-28
淺析《詩經》中的鳥意象04-21
淺析自動控制系統04-19
淺析發電機內冷水系統處理05-25
淺析我國網絡營銷發展策略06-03
淺析招貼藝術中圖形語言的特征02-28