數(shù)據(jù)倉庫技術(shù)和rfid的聯(lián)系
RFID作為一種自動識別標(biāo)簽,是通過射頻信號來自動識別目標(biāo)對象從而獲取相應(yīng)的數(shù)據(jù)。RFID標(biāo)簽有很多種的識別方式,但最為常見的是存儲一個唯一的序列號來標(biāo)識一個人或者物品的信息。它是通過一個帶有天線的微芯片來傳輸信息,芯片借助天線將識別信息傳輸給一個RFID閱讀器。這種技術(shù)讓用戶能通過一個RFID閱讀器遠距離、非接觸地讀取數(shù)據(jù),在這個過程中閱讀器和芯片之間不需要有機械或光學(xué)的接觸,并且這個過程不需要人工干預(yù),在任何環(huán)境當(dāng)中均可自發(fā)完成。
RFID會使得原來的供應(yīng)鏈管理系統(tǒng)變得更為智能,它改進了原始的二維條形碼,使得相應(yīng)的貨物跟蹤和訂單管理的過程變得簡易。近幾年沃爾瑪開始在它們的供應(yīng)鏈系統(tǒng)中使用這種技術(shù),RFID還被廣泛應(yīng)用于軍事、郵政、航空、醫(yī)療等領(lǐng)域。由RFID的廣泛應(yīng)用而帶來的新事物就是“物聯(lián)網(wǎng)”,它意味著人們能通過無線網(wǎng)絡(luò)隨時獲取數(shù)以億計物品的位置及相關(guān)信息。
數(shù)據(jù)倉庫領(lǐng)域?qū)?/span>RFID數(shù)據(jù)的研究主要分為三個方向:第一個方向在于安全地收集和管理rfid電子標(biāo)簽攜帶的信息;第二個方向是清理RFID數(shù)據(jù)中的誤差數(shù)據(jù);第三個方向是創(chuàng)建一個多維度的數(shù)據(jù)倉庫,以提供對大量RFID數(shù)據(jù)集的OLAP操作。這也是本文的討論內(nèi)容。RFID數(shù)據(jù)完全不同于傳統(tǒng)的關(guān)聯(lián)技術(shù)或者數(shù)據(jù)倉庫技術(shù)中的數(shù)據(jù),對這些不同之處的研究正是對RFID數(shù)據(jù)進行數(shù)據(jù)建倉工作的起點,RFID數(shù)據(jù)主要有如下一些特性:
數(shù)據(jù)簡單:RFID所產(chǎn)生的數(shù)據(jù)可視為一個RFID元數(shù)據(jù)的流,元數(shù)據(jù)的結(jié)構(gòu)主要是EPC、LocaTIon、TIme,EPC是Electronic Product Code的縮寫,即電子產(chǎn)品代碼,它用來唯一識別一個物品。LocaTIon是RFID閱讀器讀取該物品時的所在位置,TIme就是讀取時的時間。這種數(shù)據(jù)格式并沒有攜帶太復(fù)雜的信息,簡單易讀。
數(shù)據(jù)海量:RFID應(yīng)用的重要挑戰(zhàn)就是由此產(chǎn)生的海量數(shù)據(jù)。
數(shù)據(jù)誤差:RFID數(shù)據(jù)的另一個重要問題是RFID閱讀器在產(chǎn)生數(shù)據(jù)流時會有誤差。在實際應(yīng)用當(dāng)中RFID閱讀率大概在60%~70%之間。
允許冗余:RFID閱讀器每隔固定一段時間就會產(chǎn)生一個(EPC,location,time)格式的元數(shù)據(jù),當(dāng)一個物體停留在相同的地點一段時間就會有很多元數(shù)據(jù)產(chǎn)生,這就形成的數(shù)據(jù)的冗余,我們同樣需要對這些冗余進行處理。
RFID數(shù)據(jù)清理
數(shù)據(jù)清洗是在數(shù)據(jù)處理過程中最常見的問題之一,比如在數(shù)據(jù)倉庫當(dāng)中進行各種預(yù)定義的成熟操作當(dāng)中都涉及到這一過程。在RFID當(dāng)中的數(shù)據(jù)主要存在以下三種問題:缺失值,數(shù)據(jù)錯誤,數(shù)據(jù)冗余。
缺失值和數(shù)據(jù)錯誤這類問題在RFID應(yīng)用當(dāng)中非常常見,因為一些簡陋的無線閱讀器在無線通信過程中會出錯。很多學(xué)者針對這類問題提出了若干解決方案,比如有效的RFID數(shù)據(jù)流過濾技術(shù)、比如ESP(Extensible Sensor Stream Processing,在線清洗多層框架系統(tǒng)),再有基于定長滑動窗口的清洗技術(shù)等等。其中ESP作為主要的數(shù)據(jù)流清洗方法分為五個階段,每個階段都對應(yīng)一個不同數(shù)據(jù)處理的邏輯過程。ESP系統(tǒng)針對數(shù)據(jù)的時間粒度和空間粒度,通過說明性的查詢語言來解決用戶定義的功能,并通過實驗證明ESP也適合于RFID數(shù)據(jù)流。
數(shù)據(jù)冗余的問題在RFID應(yīng)用當(dāng)中也非常嚴(yán)重。數(shù)據(jù)的冗余主要有兩個層面:在閱讀層面的冗余以及數(shù)據(jù)層面的冗余。
①閱讀層面的冗余:這種冗余是指一個rfid電子標(biāo)簽在同一個地點被不同的RFID閱讀器重復(fù)讀取。解決這種問題的一個辦法是,當(dāng)一個RFID閱讀器打開時其它有交叉部分的閱讀器暫時關(guān)閉;其次,每個RFID閱讀器計算出它所覆蓋的RFID標(biāo)簽的數(shù)目,然后將這個數(shù)據(jù)向它所覆蓋的每個RFID標(biāo)簽中書寫。如果一個閱讀器一個標(biāo)簽都沒有鎖定,則這個閱讀器為多余的。但是這個算法當(dāng)中有一個假定,就是每個閱讀器會在同一位置持續(xù)很長時間,然而在實際中很多閱讀器是隨時移動的。
②數(shù)據(jù)層面的冗余:每一個閱讀器產(chǎn)生RFID元數(shù)據(jù)(EPC,location,time),當(dāng)一個物品停留在一個地方一段時間后會持續(xù)產(chǎn)生這樣的元數(shù)據(jù),解決方法將元數(shù)據(jù)處理成(EPC,location,time_in,time_out)這樣的數(shù)據(jù)格式。在多數(shù)時候許多物品都是一起移動的,比如一整集裝箱的洗發(fā)水從工廠出來后,在各物流中心中轉(zhuǎn),直至被擺放到貨架上。因此,我們用(EPC list,location,time_in,time_out)格式來進行儲存有助于減少冗余。
因為RFID數(shù)據(jù)的諸多特性,RFID數(shù)據(jù)倉庫的建立也不同于傳統(tǒng)的數(shù)據(jù)倉庫。假設(shè)我們已經(jīng)將數(shù)據(jù)進行了清洗,得到了以(EPC,location,time_in,time_out)格式的數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)處理技術(shù)也許能夠找出在指定地點,指定時間的相應(yīng)信息,但是對這些數(shù)據(jù)之間的聯(lián)系則缺少相應(yīng)的研究方法,比如如何尋找某些類別的商品從A地到B地的相關(guān)信息方面,并沒有很好的處理技術(shù)。為了滿足用戶對信息的需求,并結(jié)合RFID數(shù)據(jù)本身的特點,我們可以構(gòu)建RFID數(shù)據(jù)倉庫并進行數(shù)據(jù)處理的一些相關(guān)技術(shù)。建立RFID數(shù)據(jù)倉庫。
RFID數(shù)據(jù)有很多自己的特性,需要進行復(fù)雜的數(shù)據(jù)清洗工作,這就需要在處理過程中對數(shù)據(jù)進行壓縮,并創(chuàng)建有效的數(shù)據(jù)倉庫結(jié)構(gòu)來存儲這些數(shù)據(jù),在減少RFID數(shù)據(jù)量的同時保留數(shù)據(jù)本身攜帶的相關(guān)信息。這在數(shù)據(jù)壓縮算法、數(shù)據(jù)倉庫模型等方面都提供了可供繼續(xù)研究的內(nèi)容。以上就是rfid電子標(biāo)簽生產(chǎn)廠家靈天智能今天分享的內(nèi)容,了解更多資訊關(guān)注我們。m.sizhongjiaoyu.cn