首頁

關於華報

主編的話

華報電子版面閲讀下載

刋登廣吿

發行訂閲

招聘職位

聯係我們

 
 

 

 

匹兹堡/哥倫布/辛辛那提消息 

     

大数据和未来国际政治(《互聯網的顛覆浪潮終將冲向政治領域》之二)

文 揚 2014年2月12日

 

在2013年剛開始熱議“大數據”這個觀念的人們,會發現自己不知不覺已落伍過時。2014年的人們顧不上再空談其概念和意義,他們蜂擁到大數據的各個富礦當中,埋頭于各種開發應用。據業內人士預測,大數據技術很快會出現在社會各個領域。
     從數據本身來講,大數據的3個V(volume,velocity and variety)都是呈指數級發展的,翹首向上的曲線圖明白無誤地吿訴人們,大數據的下一個數量級(無論叫什么)也將很快到來。一篇名爲《2020年的數字宇宙》的硏究報吿計算出,從2005年到2020年,“數字宇宙”的規模將增加300倍之多,從130EB增加到40ZB,也就是40萬億GB,約爲地球上所有海灘上的沙粒數量的57倍。
     從古至今,海邊沙子、天上星星,一直都是“不可勝數”的同義詞,而在大數據時代的今天,它們竟成了不在話下的“小數據”。
     伴隨數據爆炸式發展,數據處理技術也飛快發展,目前還屬於新奇玩意的數據批處理和存儲技術,轉眼就成了通用的計算基礎設施,成了企業數據架構的核心組件。這意味着,目前還掌握在數據科學家手中的專業,將很快成爲一般技能,幾年之內,人們運用MapReduce和Hadoop等大數據工具,也許就像當年接受MS Office時的情况一樣。
      再看看資本方面。根據業界權威Gartner發佈的統計,被大數據技術所驅動的IT支出,也呈現出成倍增長的勢頭,到2016年,全球將達到550億美元,比2011年翻一番。
     到了這個時候,再懷疑新技術革命是不是新一輪忽悠已沒有意義,無論是資本驅動,還是技術驅動,總之,現實正緊追忽悠,忽悠正變成現實,兩者合一了。
     Google公司每天要處理超過24 PB(2的50次方字節)數據,Facebook每天收録30億次點擊和上傳,Twitter上每天有超過4億條微博發佈。這些領跑大數據時代的公司,當然不是在自娛自樂,它們都極爲認眞地看待它們每日每時收集到的海量數據,把數據當作其核心資産。雖然巨頭們還不急于推出太過驚世駭俗的應用,但人們明白,由於信息構成了世界的本質,一旦大數據開始不受約束地顯示其力量,世界的各個領域都將被顛覆。
     在目前這個階段,大數據對個人的顛覆已輕鬆完成。曾幾何時還被視爲個人隱私堅固盾牌的三大措施——吿知與許可、模糊化、匿名化,在大數據時代都已名存實亡。隨着數據量越來越大,數據來源越來越多,個人毫無抵抗地變成了透明體。若一個小小的智能電錶都有能力憑它所收集的用電數據推測你的生活方式和起居規律,那又何况你的手機、電腦和銀行卡?又何况街上無處不在的攝像頭?一家英國報紙曾説過,如果《一九八四》的作者喬治·奧威爾活到現在,他會發現在他的倫敦公寓60米範圍內,起碼有30多架攝像頭在監視着他的一舉一動。世界早已進入了“超級老大哥”時代,個人的自由意志在喪失,個人的生存價値在消散。
大數據對團體的顛覆也輕而易舉。一個廣爲人知的案例是:爲了揭示日本相撲賽事中非法操縱比賽的情况,芝加哥大學的經濟學家們使用了11年中超過64000場比賽的記録數據,果眞發現了消極比賽的發生規律,讓業內的潜規則大白于天下。
這還屬於很初級的應用。在目前的PB級時代,大數據技術剛剛成熟,還只是小試牛刀,從巨量的歷史數據中隨意抽取一部分相關關係,建立幾個簡單的算法模型,預測一下流感的傳播、機票的打折、電影的票房、交通的狀况…顯得很無害,很友善,很爲人民服務。但每年數百億美元所養育的大數據技術當然不只是爲了小小的“練習題”,十年之內,大數據的規模就將從PB級跨入EB級(2的60次方字節),再跨入ZB級(2的70次方字節)。坐擁歷史上空前規模的數據量和空前發達的數據處理技術,“超級老大哥”們還會滿足于小規模、小範圍的顛覆嗎?
     如果能夠輕而易舉破解日本相撲業內部不爲人知的“行規”,那么,從理論上講,任何一個團體和組織的內部“行規”、隱秘知識、核心機密,都有可能通過海量的公開數據進行破解。而且,面對呼嘯而來的大數據海浪,組織的規模和內部的信息封鎖都不再構成障礙,安保能力的增長只是算術級的,數據能力的增長卻是指數級的,在這場競賽中,開始可能道高一尺魔高一丈,後來就會道高兩尺魔高八丈,可以肯定,大數據全勝!
     問題來了。主權國家這個人類社會的利維坦,不過就是個較大規模的組織。十年之內,今天看起來還巍然屹立堅不可摧的國家,也終將面臨大數據浪潮的滌蕩。就像破解日本相撲賽事,很快就會有人宣佈,他利用大數據技術精準地破解了某個國家的特殊行爲模式。
     希臘的債務危機是如何形成的?日本的右傾化會走多遠?伊朗核計劃的眞實狀况如何?“薄荷四國”的提法是噱頭還是現實?…這類題目的話語權將很快從政治分析師轉到數據分析師手中,前者憑藉經驗和邏輯所建立起來分析框架,將被後者的海量數據冲得稀里嘩啦。
     在新加坡國立大學馬凱碩敎授近日發表的一篇文章中,作者開篇即提出問題:“中國強硬的新姿態背後傳達出怎樣的信息?是一個強有力的政府在宣吿中國從今將表現得像一個眞正的大國;還是一個弱勢政府屈服於國內民族主義風潮?眞相如何,外界不得而知,但我們能夠推斷,如果中國繼續堅持強硬立場,其在亞太地區獲取多少利益,便要在全球層面付出多少代價。這是中國未來不得不面對的新困境。”
     在大數據時代,人們很快就不這樣説話了。針對一國政府與國內民族主義風潮的互動關係,甚至會有現成的模型,隨時通過大數據進行檢驗。至於一國在地區層面與全球層面的利益交換,也可以輕易數據化,得出基于量化指標的結論。
      十年之內,各國政府都會設有應對大數據國際政治的專門機構。中國政府會發佈大數據報吿,揭示日本的軍國主義歷史演變軌迹;日本也會針鋒相對,發佈關於中國軍力增長的大數據分析,甚至預測出中國建立海外軍事基地的時間。隨着各國政府從大數據分析中獲得的新知識、新觀察、新洞見越來越多,國際政治的整體局面必將大爲改觀。
     但國家本身卻不是這場數據革命的主導者,而是被動的接受者和追隨者。“除了上帝,其他人必須用數據説話”,據説這是硅谷經理人的信仰,那些每日每時都在收集着“富可敵國”的數據資源的巨頭企業,其實也早已擁有了“強可敵國”的大數據力量,在所有人都必須用數據説話的時代,它們就是新的上帝。是它們在引領變革,在將硅谷的信仰的行爲規範推向全世界。如此看來,Google, Facebook, Twitter等公司在目前這個階段的相對低調和隱忍,更顯得其狀不祥,大有風暴前短暫平靜的模樣。
     而一個基本事實是,最大的大數據公司都在美國,用國家來衡量,美國早已是囊括了大數據資源最多的國家。如果大數據終將導致權力的重新分配,美國將再次佔據優勢。這是大數據時代國際政治格局的另一個維度,也不得不正視。
文 揚 2014年2月12日

 
     
   
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

 

 

返回主页