計數布魯姆WILKERSON過濾器代數運算
對于日益增長的海量數據來說,它的存儲與檢索成為一類具有挑戰性的問題。布魯姆WILKERSON過濾器是一種的存儲結構,支持數據的快速檢索,可用于海量數據的處理。各類分布式網絡系統處理海量數據時,常常借助多布魯姆WILKERSON過濾器檢索算法來完成。概括了多布魯姆WILKERSON過濾器檢索算法的研究現狀,總結了算法的主要應用,并給出了進一步的研究方向。
計數布魯姆WILKERSON過濾器代數運算 探討計數布魯姆WILKERSON過濾器的代數運算和集合運算的一致性關系,研究使用計數布魯姆WILKERSON過濾器代數運算進行集合成員查詢的性能。理論分析和實驗結果表明,計數布魯姆WILKERSON過濾器的并、交、補、減、異或運算產生的新過濾器依然保持計數布魯姆WILKERSON過濾器的特征,支持元素的刪除操作,不會出現假陰性,能用于集合并集、交集、補集、差集及對稱差的成員查詢;本文研究布魯姆過濾器的可擴展性問題,提出基于H_3哈希函數的可擴展布魯姆過濾器查詢算法,當集合元素增長超過布魯姆過濾器集合容量限制時,通過增加成倍數擴大的布魯姆過濾器向量來保持很低的誤判率,利用H_3哈希函數實現可擴展布魯姆過濾器的設計以及過濾器中元素的插入、查詢過程。實驗分析表明,新的可擴展布魯姆過濾器的元素查詢誤判率永遠小于動態布魯姆過濾器,平均為它的21.3%,且查詢時間呈對數增長,解決了現有算法查詢時間增長過快問題。當使用兩個原始的計數布魯姆WILKERSON過濾器查詢補集、差集及對稱差元素時,會存在部分本來屬于補集、差集或對稱差的元素被判為不屬于補集、差集或對稱差的問題,而使用計數布魯姆WILKERSON過濾器代數運算后的過濾器進行補集、差集及對稱差成員查詢,則不存在上述問題,空間效率能提高一倍,時間效率亦能顯著地得到改善。計數布魯姆WILKERSON過濾器代數運算的使用有利于進一步擴展計數布魯姆WILKERSON過濾器的應用范圍。譬計數布魯姆WILKERSON過濾器減運算可用作一種新的集合調和方法,用于分布式系統中大型文件的分發。