到底多大才是“大數(shù)據”?“大數(shù)據之‘大’并不在于其表面的‘大容量’,而在于其潛在的‘大價值’。”《大數(shù)據:正在到來的數(shù)據革命》一書的作者、知名信息管理專家涂子沛在第十屆國家信息化專家論壇上指出,數(shù)據的價值在于計算,未來將興起一個全計算型的社會,特別是以物聯(lián)網為核心的機器計算和社會計算,開放數(shù)據的目的是鼓勵創(chuàng)新、推動網絡經濟的發(fā)展、促進中國經濟向精細化轉型。

  從全球數(shù)據技術投入的資金分布來看,傳統(tǒng)的小數(shù)據仍然占據絕對的重頭。據國際數(shù)據集團(IDG)統(tǒng)計,2012年,全球對小數(shù)據分析工具的投資為349億美元,而對大數(shù)據分析工具Hadoop的投資僅為1.3億美元,不及前者的1%。IDG的結論是,傳統(tǒng)的小數(shù)據軟件滿足了企業(yè)和組織95%的需求。涂子沛認為,目前行業(yè)發(fā)展的最新態(tài)勢,是“大”、“小”數(shù)據分析工具趨于一體化并在向“云”遷徙。

  未來的計算機會越來越小,會無處不在,跟日常環(huán)境聯(lián)系到一起。涂子沛指出,我們的智能手機就是一臺計算機,有傳感器也有攝像頭,它可以收集數(shù)據,反饋數(shù)據。美國氣象局用來做氣象檢測的傳感器是隨著汽車不停行進的,從紐約到波士頓,每10秒鐘收集一次數(shù)據,一天收集十幾萬次數(shù)據,實時傳輸?shù)綌?shù)據中心。在1989年,就已經出現(xiàn)了數(shù)據挖掘。摩爾定律解決了一個問題,就是無論有多少信息,我們都可以以很低的成本保存下來。普適計算解決的問題是使得人類收集信息的能力越來越強,感應器、手機、無線網絡、望遠鏡、仿真計算都在產生數(shù)據,就是說保存數(shù)據的能力很強,收集數(shù)據的能力很強,到1989年數(shù)據挖掘出現(xiàn)之后,人類分析數(shù)據的能力也空前增強。

  涂子沛指出,通過開放數(shù)據,大數(shù)據還可以成為啟動透明政府的利器。這對當下的中國,現(xiàn)實意義毋庸諱言。數(shù)據增值的關鍵在于整合,但自由整合的前提是數(shù)據的開放。開放數(shù)據是指將原始的數(shù)據及其相關元數(shù)據以可以下載的電子格式放在互聯(lián)網上,讓其他方自由使用。開放數(shù)據和公開數(shù)據是兩個不同的概念,公開是信息層面的,是一條一條的;開放是數(shù)據庫層面的,是一片一片的。開放也不一定代表免費,企業(yè)的數(shù)據,可以以收費的形式開放。開放也是有層次的,可以對某個群體、某個組織,也可以對整個社會開放。在大數(shù)據的時代,開放數(shù)據的意義,不僅僅是滿足公民的知情權,更在于讓大數(shù)據時代最重要的生產資料數(shù)據自由地流動起來,以催生創(chuàng)新,推動知識經濟和網絡經濟的發(fā)展,促進中國的經濟增長由粗放型向精細型轉型升級。

責任編輯:admin