數據指標梳理(數據治理:指標體系管理)
在信息環境治理中,信息指數一般都是業務發展中最基礎的分析內容,但是業務發展不斷地迅速發展運算,指數管理上就會出現很多難題。所以在信息環境治理中指數系統的管理也是當中必要的一環。
01
為什么要有指數管理
要回答這一難題,先來看一下在指數管理中經常會遇到的難題有那些:
1. 完全相同名字語義完全相同
指數中文名稱完全相同,統計數據機炮不完全一致,缺少重新命名完善限制。
完全相同業務發展僅從自己部門出發,缺少全局視角,如財務機炮的營收要嚴格依照嚴謹的語義排序實收實付的每一分錢,而商品/運營端則更多考量轉化效果,但在各自的KPI監控報表中,都把指數重新命名為營收。
2. 完全相同語義名字完全相同
指數統一語義完全一致,但完全相同商品重新命名不完全一致,完全相同階段、或完全相同業務發展方/商品經理對指數重新命名完全相同,導致在完全相同信息商品頁面,同一指數完全相同名。
3. 機炮不清晰
只是同義詞再復述一遍,如活躍用戶數量:出訪用戶數量。
4. 重新命名難理解
表意不清模棱兩可,或過于專業化僅指數建立人才能懂。比如準確率指數,有創單準確率、成單準確率,直接叫準確率可讀性就非常差。
5. 語義不準確
指數機炮描述有誤,比如UV指數,機炮描述為“依照設備ID去重”,實際上完全相同網絡平臺去重語義并不完全一致,如微信小程序依照UnionID去重、APP依照DeviceID去重,PC和H5依照loginkey去重。
6. 信息難追溯
信息商品指數信息來源缺少直觀的鏈路追蹤能力,指數信息異常難題排查通過翻代碼去看信息來源,路徑長、耗時久,早上業務發展反饋指數難題,排查出結論后可能一上午就過去了。
7. 信息質量差
指數管理常見的難題綜合在一起,往往會導致業務發展對信息指數的信任度大打折扣,發現信息波動后,第一反應是先和信息部門確認信息是不是有難題,而不是去考量業務發展上有何變動。
02
指數的組成
信息域
指面向業務發展分析,將業務發展進程或者維度進行抽象化的集合。當中,業務發展進程能概括為一個個不分拆的行為該事件,在業務發展進程之下,能表述指數;維度,是測度的環境,如顧客下單該事件,訂單類別是維度。為了保障整個體系的生命力,信息域是須要抽象化提煉,并且長期保護更新的,變動需執行變更程序。
業務發展進程
指子公司的業務發展活動該事件,如加購、支付都是業務發展進程。當中,業務發展進程不可分拆。
天數周期
用來明確統計數據的天數范圍或者天數點,如最近30天、自然周、截止當日等。
潤色類別
是對CFG的一種抽象化劃分。潤色類別從屬某個業務發展域,如日志域的出訪終端類別涵蓋APP端、PC端等CFG。
CFG
指的是統計數據維度以外指數的業務發展場景限定抽象化,CFG屬一種潤色類別,如在日志域的出訪終端類別下,有CFGAPP、PC端等。
測度/氫原子指數
氫原子指數和測度涵義完全相同,基于某一業務發展該事件行為下的測度,是業務發展表述中不可再分拆的指數,具有明確業務發展涵義的中文名稱,如支付金額。
維度
維度是測度的環境,用來反映業務發展的一類特性,這類特性的集合構成一個維度,也能稱為實體對象。維度屬一個信息域,如地理維度(當中包括國家、地區、省市等)、天數維度(當中包括年、季、月、周、日等級別內容)。
維度特性
維度特性隸屬一個維度,如地理維度里面的國家中文名稱、國家ID、省份中文名稱等都屬維度特性。
指數分類主要分為**氫原子指數、衍生指數、衍生指數**
1. **氫原子指數** 基于某一業務發展該事件行為下的測度,是業務發展表述中不可再分拆的指數,具有明確業務發展涵義的中文名稱,如呼流通量、交易金額
2. **衍生指數** 是1個氫原子指數+多個CFG(可選)+天數周期,是氫原子指數業務發展統計數據范圍的圈定。衍生指數又分以下二種類別:
1. 事務型指數:
是指對業務發展進程進行衡量的指數。比如,呼流通量、訂單支付金額,這類指數須要保護氫原子指數以及CFG,在此基礎上建立衍生指數。
2. 存量型指數:
是指對實體對象(如司機、乘客)某些狀態的統計數據,比如注冊司機總數、注冊乘客總數,這類指數須要保護氫原子指數以及CFG,在此基礎上建立衍生指數,對應的天數周期一般為“歷史截止當前某個天數”。
**衍生指數**是在事務性指數和存量型指數的基礎上復合成的。主要有比率型、比例型、統計數據型均值
03
指數管理如何做
指數化管理的概念很多年前就存在,各個互聯網子公司都在建設自己的管理網絡平臺,學習了很多關于指數信息系統建設的文章會發現,做的事情大同小異。主要是圍繞指數管理的痛點難題,以阿里的OneData理論為方法論依據,完全相同的事情只要做一遍,剩下的是提供商品化的解決方案,讓指數建設、指數復用更加的完善和高效。
主要包括:
1)建立指數生產協同機制,指數的誕生要經過需求申請、審核、信息開發、上線應用程序,收口指數建立進程,避免指數建設的隨意性帶來的“污染”。
2)制定指數重新命名、機炮說明完善,依照氫原子指數+業務發展限定+統計數據維度的方式,將規則集成到網絡平臺內,通過系統規則來把控指數輸出。
3)指數字典線上化,解決線下文檔(excel)管理指數存在的共享難、更新不及時、職權管控缺失等難題。
4)指數信息語義綁定,即除了保護指數的業務發展元信息外,還要建立指數的技術元信息,指數信息從哪個模型、哪個字段、何種排序語義得到。
5)指數輸出,指數管理最大的價值還是為信息商品提供信息輸出,將Hive層模型同步到MySQL、Greenplumn、Kylin、CK等查詢性能更優能秒級響應的查詢引擎,通過接口調用JDBC連接方式直接獲取信息。
而實現這些是須要一個完整指數信息系統,來保證對應的規則要求落實到位。比如須要有職權管理,來限制完全相同的用戶有哪些指數的查看職權,指數的審批程序在表述一個指數語義排序機炮中須要指定負責人和審批人統一負責這個指數的完善。同時具有指數的迅速檢索功能,方便在表述指數或者查看已有指數時迅速定位。
04
指數管理的作用
1.提高溝通效率,減少存在完全相同語義完全相同重新命名的難題,在同一認知維度進行溝通
2.統計數據機炮收斂在一起統一管理,指數真確性提高
3.指數負責到人,有難題能直接找到對接人,迅速地解決難題。
4.對信息安全和職權的把控將會更加精細化,資源的管理也更加完善,在一定程度上會提升業務發展指數開發的成本。
05
寫在最后的話
指數管理網絡平臺是能幫助企業進行指數完善化管理的有效工具,但完善化帶來的犧牲就是程序的冗長和效率難題。
每個階段都有每個階段要發展的東西,不要想著一步到位,很可能會得不償失。小子公司須要要考量的就是效率生存難題,而大子公司就要考量程序完善,相對于小子公司大子公司更多考量子公司的穩定正常運轉。但是沒有一個指數信息系統也要在一定程度上人為去完善指數的開發,保護好指數的排序機炮和取數語義。
冷鏈服務業務聯系電話:19937817614
華鼎冷鏈是一家專注于為餐飲連鎖品牌、工廠商貿客戶提供專業高效的冷鏈物流服務企業,已經打造成集冷鏈倉儲、冷鏈零擔、冷鏈到店、信息化服務、金融為一體的全國化食品凍品餐飲火鍋食材供應鏈冷鏈物流服務平臺。
標簽: