本文系國脈集團總經理、首席規劃師鄭愛軍女士于4月21日在國脈互聯舉辦的“2017第二屆政務大數據發展與合作研討會暨數據母體產品發布會”上的演講,內容通過現場速記整理。
“數據母體·城市大數據一體化解決方案”,是由國脈海洋和清數科技聯合推出的一個重磅產品,一共分為四個部分:產品背景、產品介紹、產品價值和產品服務。
一、產品背景
數據時代的到來,影響并改變著政府、商業和我們的生活。
(一)時代背景
1.數據正在重塑我們當今時代的資源觀
數據時代的浪潮比想象的還要迅猛,人類社會正在進入數據時代,從關注網絡、系統到注重數據,已成為當前信息化的重要視角與核心任務。
2.數據治理能力正在成為智慧城市競爭的新優勢
誰掌握數據,誰就有競爭力和話語權。未來如果一個城市未能掌握數據,不能運用數據,那么這個城市的競爭力將會越來越下降。
3.智慧城市是數據驅動的城市
創新依賴于數據能力的創新服務,沒有高質量的數據就沒有高品質的服務。智慧城市的創新要先構建優質的城市數據體系。
(二)發展現狀
1.數據思維和意識缺乏
政府部門普遍缺乏“大數據思維”,對數據開放和共享持拒絕或消極態度,相互推諉、扯皮現象時有發生,對大數據的重視程度還不夠,用數據說話、用數據決策、用數據管理、用數據創新的機制還未形成。
2.數據管理能力與方式落后
目前政府大多只是做了簡單的數據質量檢查、數據歸檔、數據安全等分散性的數據處理工作,缺少數據的甄別、分類、整合和加工,無法及時有效的對信息資源進行提取、集成和分析,數據治理尚處于初級階段,數據價值亟待挖掘。
3.數據資源質量難以保障
由于各級地方政府和部門在開展信息化建設時往往各自為政,應用系統模式多樣、功能不一、架構自定,造成信息來源不清晰,數據命名、類型、格式差異巨大等問題,數據質量難以獲得保障,數據使用困難重重。
4.數據管理法律與制度缺失
當前我國數據管理及管理者責權相應法律法規建設基本上還是一個盲區,無法對數據的收集、加工、傳遞、發布等全過程進行管理和監督,這就造成了數據采集、比對、共享、開放的難度超出了想象,打破“信息孤島”舉步維艱。
(三)重大機遇
數據時代亟待對數據進行一體化管理,這給我們帶來重大機遇。機遇在于:
1.智慧城市不斷深化發展。大數據已經遍布智慧城市的方方面面,監控視頻數據、城市地理信息、交通數據、人口數據以及環境監測數據等各行業數據量正呈現爆發式增長,數據的分析、挖掘、提煉、應用等越來越受到重視。
2.政策紅利。2015年我國政府發布了《促進大數據發展行動綱要》,數據強國上升到國家戰略層面;2016年《政務信息資源共享管理暫行辦法》明確 “以共享為原則,不共享為例外”。
3.政府的轉型升級。政府治理透明化、社會管理扁平化、公共服務多元化成為趨勢,如何利用數據管理,為公眾提供更精準的服務,是信息化條件下建設服務型政府的重要內容。
4.云計算、移動互聯網、物聯網、人工智能等新技術快速發展。
(四)面臨挑戰
圍繞重大的機遇,我們提出了三個面臨的挑戰:
1.智慧城市數據中心虛火較大。大家可以看到,隨著智慧城市建設步伐的加快,以及培育云計算、大數據等新興產業的經濟發展需求,幾乎每個城市至少有2個以上數據中心,不僅帶來巨大資源損耗,且沒有發揮重要價值,缺乏數據應用的數據中心比比皆是。
2.數據管理部門角色發生轉變。大數據不僅帶來了開放共享意識、包容的心態、科學思考模式,也帶來政府管理的變革。過去,數據管理部門是系統運維保障者,負責搜集數據、管理數據、保障低層次的運維,現在要對數據資源進行管理、挖掘,開放與創新利用。那么,這些人才在哪里?數據運營官在哪里?大數據局的角色、價值定位是什么?這些都有待我們進行思考。
3.數據管理能力直接影響著政府效益。數據管理核心是實現業務價值和公共服務能力提升,如果海量異構數據不能進行很好的挖掘和相關性分析,數據本身的價值和能力無法通過服務化方式開放出來,推進社會治理與政府職能轉型也就無從談起。
二、產品介紹
圍繞上述四大現狀、三大機遇和三個挑戰,我們提出了“數據母體·城市大數據一體化解決方案”。
1.產品概念
這里我給大家介紹一下“數據母體”的概念。“數據母體”是針對不同的數據源按統一定義的格式被提取出來,從數據導入、標準建池、交換共享、數據審計、運營監控到數據應用、決策分析、公共服務,形成完整的城市大數據治理與管理體系。是依托“數據基因”來構建的城市大數據平臺,從數據標準、管理、運行到決策形成完整的數據生態鏈,不斷擴展數據邊界,孕育數據應用,提升數據的應用率,最后構建城市的數據生態。
2.整體架構
“數據母體”這個概念是基于什么樣的架構呢?基于“數據基因”的資源模板、數據元池、模型設計、資產管理、標準化建設、資源分析,到建立“數據池”,“數據池”是基于政府做的基礎數據和主題數據,基礎數據包括人口庫、法人庫、信用庫、證照庫等,主題數據,比如有些省是一帶一路,有些省以農業為主、交通為主等,這個主題的應用,包括重大工程的主題數據,這些我們都會列入到“數據池”里面。圍繞“數據池”和我們從政府業務產生的實時數據,通過服務總線,用數據共享管理平臺進行實時地對接,對接好后進行數據的審計和運營監控,最后到數據應用層面,包括數據服務(數據開放接口、可視化,統計分析)、決策分析、公共服務等。從而建立整體的一個“數據母體”的整體架構。
3.主要創新點
“數據母體”的主要創新點是什么呢?它重塑了城市大數據的體系,有兩個創新點。
(1)數據基因——數據模型底層標準構建。它能讓數據質量提升,讓數據管理者與城市運營者增效,效率提升,比如要理清一個地方的數據資產,一般需要半年,而通過數據基因,可以縮短3個月,最快的能夠在1個月內呈現一個地方的數據地圖,這是數據基因的最重要、最有優勢的一塊。它是基于數據元池的基礎上進行模塊參考、快速構建、有效關聯應用,實現數據操作系統。我們有時候說,為什么用數據基因呢?數據基因是政府、大數據或者大數據局,希望或者說必須要用到的一個操作系統,就像Office一樣的系統,它是實現數據模型底層標準構建的一個系統。
(2)NEO(一體化平臺)——數據挖掘、分析、應用平臺。趙博士(清數科技創始人、董事長趙勇先生)說過,它重要的一點是可以一天學會大數據、構建大數據,幫助快速實現數據倉庫搭建,提供基礎數據分析平臺,為后續數據分析、挖掘、報表服務提供基礎,是實現大數據平臺快速搭建的一個系統。
4.解決關鍵問題
這兩個創新點以外,我們提出了產品能解決的幾個關鍵問題。
(1)數據管理框架缺失。主要是數據資產不清晰,數據標準不一致,數據源不唯一。這是基于底層的,就是我們數據基因在解決的問題。
(2)數據價值無法實現。很多人說,數據基因做完后,實體數據價值怎么發揮呢?我們就用了NEO這套系統,打通數據基因,建立了數據母體,實現過去無法實現的實體數據的應用與挖掘,解決過去缺乏實時共享機制、數據質量難以控制、缺乏統一管理等問題。
三、產品價值
數據母體助力城市大數據中心建設。產品的價值,我認為有一點就是“寸數寸金”,數據是黃金,數據質量是互聯網時代的根本,數據基因首當其沖解決數據元的標準化問題,提質增效。
1.快速建立數據資源體系。對比篩選出政府、企業及各個行業領域的標準規范,根據標準建立整個數據資源體系的模板,通過模板庫用戶可直接查閱相關數據元、信息資源模板,以直接沿用或是自定義修改的方式對模板進行應用,達到數據資源快速梳理、資源體系快速架構的目標。
2.推進數據標準的落地。通過對各應用系統數據元池的清洗比對,篩選出共性、關鍵的主數據,建立涉及核心數據的標準字段池,對字段的命名、格式、長度等屬性進行規范,依托標準數據元池進行信息資源信息項的編目,嚴格控制新增字段,實現共性數據元的統一標準規范,推動數據規范的落地執行,建立數據模型標準化定義映射,推進數據標準化規范的落地實施。標準數據元的建立,是國脈十二年咨詢和理論研究的沉淀,這塊工作非常重要,實施過程中,如果有國家標準,按照國家標準,地標有的按照地標,沒有標準怎么辦,國脈來協助構建這個標準。
3.實現系統與數據分離。提供相關數據庫、基礎庫、主題的模型設計功能,實現不同系統建設需求、應用場景下,通過標準數據元池、信息資源的組合構建應用模型,圍繞構建的模型可以實現快速構建應用系統數據表結構設計。根據表結構設計,基于大數據平臺架構上,實現快速數據抽取,構建數據模型的可視化分析。
4.快速抽取實體數據。根據自定義的數據模型,從多種不同數據源中導入實體資源,可以定義實體數據與元數據的映射關系。支持定時批量或者實時增量的導入方式,支持海量數據的高吞吐量導入,可以對導入模型進行方便的可視化管理。
5.靈活的數據可視化報表分析。提供高性能的實時查詢功能,能夠快速實現對實體數據的報表分析。拖拽式定義數據分析需求,報表呈現界面,提供豐富的展示形式,輕松地把靜態數據轉化成動態的圖表,將實體數據進行有效的整合,快速準確的提供報表并提出決策依據。
6.快速構建數據共享開放體系。基于全面的安全和權限體系,可以通過數據共享功能將各類實體數據及分析報表進行不同層級、不同字段的交換共享及開放,形成數據開放市場服務。
7.保障實體數據安全。安全問題是非常重要的一塊,數據母體具備完整的角色權限體系,可以定義數據表級別的權限分配。提供數據脫敏和數據保護功能,能夠針對特定實體數據字段指定數據脫敏和保護策略,在對外提供數據價值的同時保證實體數據的安全保密。
四、產品服務
我認為最重要的一點是,彈指間可以幫您搭建一站式的數據平臺來孕育安全可靠“新的場景和服務”。我們的價值點/服務點有以下幾個層面。
1.基因層。
(1)我們提供數據資源管理規劃。包括現狀評估與改進建議、數據資產梳理,以及數據資源管理的管理規劃、技術規劃、實施路線等。大家知道,國脈堅持做評估已有十二年,在政府網站、互聯網+政務、智慧城市評估上,我們擁有很多經驗,在現狀評估上,我們有一套專門的方法論和指標體系。
(2)數據標準制定。包括數據標準管理規范、標準的設計、標準推廣落地、標準審核評估。
(3)數據模型設計。分為基礎庫和主題庫,基礎庫包括人口庫、法人庫、信用庫、證照庫等模型設計,主題庫包括交通、教育、旅游等模型設計。
2.實施層。
(1)大數據架構平臺實施,包括數據采集、接口、儲存、處理。
(2)數據服務,包括數據交換共享平臺、數據開放平臺、數據可視化平臺。
(3)數據運維,包括是數據質量管理、運行監控、安全保障、運行評估。
3.應用層。包括決策分析、社會管理、民生服務等。
以上是我們基于大數據的一些服務。
五、關于我們
國脈海洋
2013年國脈在舟山投資成立了“國脈海洋信息發展有限公司”,國脈海洋是一家從事行業數據價值發掘者,企業互聯網轉型升級的咨詢規劃、數據資源挖掘和技術解決方案提供商。主要提供企業門戶、商業數據、網絡資產評估增值等咨詢服務,自主研發行業大數據軟件與服務平臺。
清數科技
成都清數科技有限公司成立于2015年,是由一批海外歸國數據科學家以及知名學者、行業精英,共同打造的專注于大數據領域研究與運用的高新技術企業。以平臺構建為目標,數據科學應用為核心,行業融合創新為驅動,傾力打造中國最具影響力的大數據產業集群。
數據母體
——美麗智慧的數據生命體,由國脈集團旗下國脈海洋信息發展有限公司與成都清數科技有限公司聯合發布。
咨詢熱線:王路燕 0580-2299699