大數(shù)據(jù)背景下的統(tǒng)計(jì)學(xué)新需求
大數(shù)據(jù)時(shí)代的迅猛發(fā)展,在全球范圍內(nèi)掀起了前所未有的浪潮。這股浪潮不僅是對(duì)統(tǒng)計(jì)學(xué)產(chǎn)生了沖擊,甚至連政府的統(tǒng)計(jì)需求也受到了不小的影響。
對(duì)政府統(tǒng)計(jì)而言,大數(shù)據(jù)采用多種數(shù)據(jù)收集方式、整合多種數(shù)據(jù)來(lái)源,并采用現(xiàn)代信息技術(shù)和架構(gòu)高速處理及挖掘數(shù)據(jù),具有高度應(yīng)用價(jià)值和決策支持功能。一方面,統(tǒng)計(jì)調(diào)查主體的多元化發(fā)展趨勢(shì)和電子商務(wù)等領(lǐng)域的迅速發(fā)展,給統(tǒng)計(jì)數(shù)據(jù)的生產(chǎn)方式帶來(lái)了很大的挑戰(zhàn),不斷沖擊著政府統(tǒng)計(jì)管理體系與統(tǒng)計(jì)理念。另一方面,計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)和空間信息技術(shù)的巨大進(jìn)步,為提高統(tǒng)計(jì)生產(chǎn)力提供了廣闊空間。海量的電子化、非結(jié)構(gòu)化數(shù)據(jù),極大地豐富了統(tǒng)計(jì)數(shù)據(jù)的來(lái)源。
種類(lèi)繁多的“大數(shù)據(jù)”,正日益成為官方統(tǒng)計(jì)部門(mén)研究應(yīng)用的方向。在這樣的背景下,探索大數(shù)據(jù)在政府統(tǒng)計(jì)中的應(yīng)用,把握這一促進(jìn)政府統(tǒng)計(jì)改革發(fā)展的機(jī)遇,對(duì)政府統(tǒng)計(jì)有著劃時(shí)代的意義。盡管近代統(tǒng)計(jì)學(xué)已經(jīng)發(fā)展了上百年,但是大數(shù)據(jù)時(shí)代的到來(lái)依然暴露出了統(tǒng)計(jì)學(xué)已有方法的缺陷,從抽樣調(diào)查和設(shè)計(jì)、數(shù)據(jù)管理和存儲(chǔ)到統(tǒng)計(jì)分析和計(jì)算,海量數(shù)據(jù)分析的需求都部分地顛覆了傳統(tǒng)的統(tǒng)計(jì)方法,這對(duì)統(tǒng)計(jì)學(xué)和統(tǒng)計(jì)學(xué)家是嚴(yán)峻的挑戰(zhàn)。
來(lái)自喬治·華盛頓大學(xué)的胡善慶教授依托豐富的政府實(shí)踐經(jīng)歷,提出了支持現(xiàn)代治理的統(tǒng)計(jì)學(xué)2.0的概念。相對(duì)于統(tǒng)計(jì)學(xué)2.0,胡善慶教授稱(chēng)近代統(tǒng)計(jì)學(xué)是1.0時(shí)代,其特點(diǎn)是,統(tǒng)計(jì)數(shù)據(jù)來(lái)自普查或隨機(jī)抽樣,而非隨機(jī)收集的數(shù)據(jù)是無(wú)研究?jī)r(jià)值的。在20世紀(jì)這個(gè)統(tǒng)計(jì)學(xué)的黃金時(shí)代,統(tǒng)計(jì)學(xué)是作為一門(mén)應(yīng)用科學(xué)而存在的,統(tǒng)計(jì)學(xué)作為國(guó)際語(yǔ)言在政府、社會(huì)、經(jīng)濟(jì)和科學(xué)中幫助解決了許多實(shí)際問(wèn)題。
以美國(guó)為例,美國(guó)政府廣泛采用隨機(jī)抽樣調(diào)查的方式,各行各業(yè)統(tǒng)計(jì)應(yīng)用普遍化,小樣本亦可產(chǎn)生大量數(shù)據(jù),計(jì)算機(jī)商業(yè)化帶來(lái)了計(jì)算方法的創(chuàng)新,統(tǒng)計(jì)軟件支持?jǐn)?shù)據(jù)收集與分析,數(shù)據(jù)文化深入到美國(guó)社會(huì)的各個(gè)層面。但是在21世紀(jì)統(tǒng)計(jì)學(xué)面臨很大挑戰(zhàn),過(guò)去是有問(wèn)題才收集數(shù)據(jù),然后建立合適的統(tǒng)計(jì)模型來(lái)揭示觀測(cè)到的數(shù)據(jù),大數(shù)據(jù)時(shí)代則不同,需要從泥沙俱下的大數(shù)據(jù)中提煉出有價(jià)值的知識(shí)和信息,而這些有價(jià)值的知識(shí)和信息顯然是非預(yù)期的。
中國(guó)目前的很多追蹤調(diào)查項(xiàng)目都存在耗時(shí)過(guò)長(zhǎng)的問(wèn)題,中國(guó)的城鎮(zhèn)化、智慧城市建設(shè)、政府簡(jiǎn)政放權(quán)、推進(jìn)監(jiān)管、國(guó)家統(tǒng)計(jì)局四大工程項(xiàng)目等都面臨諸多統(tǒng)計(jì)上的挑戰(zhàn)和需求,海量縱向數(shù)據(jù)的應(yīng)用,多種數(shù)據(jù)來(lái)源的整合,快速以及簡(jiǎn)便的呈現(xiàn)結(jié)果,嚴(yán)格保護(hù)數(shù)據(jù)和系統(tǒng)安全,提高精度和可靠性等都是對(duì)統(tǒng)計(jì)的新要求。無(wú)論美國(guó)還是中國(guó),使用20世紀(jì)的統(tǒng)計(jì)方法都不能解決21世紀(jì)的治理需求。如果我們可以用同樣的效率和成本收集數(shù)據(jù),實(shí)時(shí)分析總體,還需要隨機(jī)抽樣嗎?過(guò)去80年的數(shù)理統(tǒng)計(jì)何去何從?
大數(shù)據(jù)時(shí)代的重要意義在于大部分?jǐn)?shù)據(jù)已經(jīng)數(shù)字化,易于批量存儲(chǔ)和處理,并且數(shù)據(jù)來(lái)源多樣化、快速化,舊數(shù)據(jù)也可以有新用途。統(tǒng)計(jì)學(xué)2.0時(shí)代包含一個(gè)動(dòng)態(tài)的框架,要求有能力提供實(shí)時(shí)的結(jié)果和動(dòng)態(tài)的分析報(bào)告,動(dòng)態(tài)的框架可以提供更科學(xué)、更高精度、更能跟蹤、更快速的隨機(jī)抽樣。
基于此,胡善慶教授展望了2020年人口信息管理制度的整個(gè)框架,提出了統(tǒng)計(jì)學(xué)創(chuàng)新的一些獨(dú)到觀點(diǎn),比如,大數(shù)據(jù)需要統(tǒng)計(jì)設(shè)計(jì)、數(shù)據(jù)清洗和信息數(shù)據(jù)提煉才可能有價(jià)值或達(dá)到信息挖掘的最佳效果,統(tǒng)計(jì)學(xué)專(zhuān)長(zhǎng)于分辨數(shù)據(jù)質(zhì)量和抽取最優(yōu)化信息,國(guó)際隊(duì)伍建設(shè)需要專(zhuān)業(yè)人才、完善的教育系統(tǒng)、悠長(zhǎng)歷史、優(yōu)良信譽(yù)和扎實(shí)嚴(yán)謹(jǐn)?shù)乃季S、理論和應(yīng)用基礎(chǔ)等。動(dòng)態(tài)框架不但保留了框架原本的目的,即為普查以及隨機(jī)抽樣提供結(jié)構(gòu)基礎(chǔ),還有其他方面巨大的應(yīng)用潛力,這完全取決于統(tǒng)計(jì)學(xué)界的想象力和創(chuàng)新精神。統(tǒng)計(jì)學(xué)家應(yīng)該欣然歡迎大數(shù)據(jù)時(shí)代的到來(lái),并把它看作是統(tǒng)計(jì)學(xué)本身的一個(gè)大變革,帶動(dòng)統(tǒng)計(jì)學(xué)在運(yùn)用數(shù)據(jù)研究社會(huì)和人類(lèi)知識(shí)的實(shí)踐中達(dá)到一個(gè)新的高度。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
推薦專(zhuān)題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 特斯拉Robotaxi上路,馬斯克端上畫(huà)了十年的餅
- 7 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 8 AI的夏天:第四范式VS云從科技VS地平線機(jī)器人
- 9 張勇等人退出阿里合伙人
- 10 深圳跑出40億超級(jí)隱形冠軍:賣(mài)機(jī)器人年入6.1億,港股上市