IT科技

當前位置 /首頁/IT科技 > /列表

大數據處理流程可以概括為幾步

大數據處理流程可以概括為四步:

大數據處理流程可以概括為幾步

1、收集數據。

原始數據種類多樣,格式、位置、存儲、時效性等迥異。數據收集從異構數據源中收集數據並轉換成相應的格式方便處理。

2、數據存儲。

收集好的數據需要根據成本、格式、查詢、業務邏輯等需求,存放在合適的存儲中,方便進一步的分析。

3、數據變形。

原始數據需要變形與增強之後才適合分析,比如網頁日誌中把IP地址替換成省市、傳感器數據的糾錯、用户行為統計等。

4、數據分析。

通過整理好的數據分析5W,幫助企業決策。

大數據(big data),IT行業術語,是指無法在一定時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》 中大數據指不用隨機分析法(抽樣調查)這樣捷徑,而採用所有數據進行分析處理。大數據的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。

TAG標籤:數據處理 概括 流程 #