網站首頁 行業(yè)快訊 > 正文
評價方法(簡單多指標綜合評價三大方法)
文介紹了多指標評價的幾類方法:離差標準化、z-score標準化、非線性標準化。
多指標評價常用于需要對一些對象進行比較的場景,在保有明確目的的情況下,通過多個維度的表現數據,賦予不同權重進行綜合評判,最終形成排序。
首先涉及到的就是這些數據的歸一化(normalization),或者說標準化,本質上就是去量綱,把量綱理解成計量單位也OK。這一步的重要性在于,多維度的評判,收集到的多方面數據,橫向來看沒有強耦合性,性質不同,量綱&數量級則大概率不同,直接用原始數值分析,那你得在不同維度的最終權重賦予上下大功夫,而且也不是很好解釋。
縱向來看,同一維度下不同對象的值極端情況下可能差異巨大,歸一化可以減弱這類影響??傊チ烤V轉化為純數值后,會更方便得進行不同對象之間的差距評估。
以下是幾類方法簡介:
一、離差標準化名字很多,也叫線性標準化,最值歸一化,min-max法,都是一個意思,即 處理后X = (處理前X – 最小值)/(最大值 – 最小值),這里的最大最小值,指的是同一維度下不同對象的值的集合中的最值。這樣的處理可以把這個集合中的所有數值根據大小差距,映射入[0,1]區(qū)間內,也有的處理是最小值默認0,那就是看集合中的值和最大值的比例關系。
舉兩個實際例子:
①現在想給a,b,c三個商家打分,0~10分,有兩個維度的數據,各占比40%和60%,這就意味著在維度一上滿分是4分。
每個維度下最大值得分最高,其余數值按照與最大值的比例得分,最終把兩個維度的分數相加,即為總分,如下表。需要注意的是,并不是所有的維度下,最大值都是最高分,存在值越高分越低的情況,比如差評,針對這種情況在數值處理上要取其倒數。
②現在要給一個用戶推薦一些餐館,它們的Rank如果除了以往的評價,裝潢等,我還要考慮餐館和用戶的距離,或者餐館和用戶搜索的POI的距離。此時,得分y = 1-(x-min)/(max-min),x = 用戶或者POI與餐館的距離,min = 用戶或POI與該城市內餐館的最小距離,max = 用戶或POI與該城市內餐館的最大距離??账鸦蜿P鍵字搜索,不同場景。
二、z-score標準化也叫z標準化,標準差標準化,均值方差歸一化。適用于數量較多,沒有明顯邊界的數據,而且最好滿足高斯分布。公式是處理后X = (處理前X – 均值)/ 標準差。這里的均值和標準差都是指同一維度下不同對象的值的集合的均值和標準差。通過這樣,就可以把一種分布的數據變換為標準正態(tài)分布,均值為0,標準差為1,處理后的數值,符號為正就是超出平均水平,符號為負就是低于平均水平,很清楚。
處理前:
處理后:
同樣需要注意的是,如果有的值是越低越好,那么,最終正負號需要做一個相反處理。
三、非線性標準化這個方法很適合處理極值,要用到這個,就需要看你有沒有一個需求,比如,我還是要給用戶推薦一批餐館,排序要去考慮UGC,就是用戶評價的數量,但是我研究了一下我所有的餐館,發(fā)現大部分餐館的評價數都在100~300之間,有一些是1000+,就也不多,但是對于用戶來說,評論數無非是一個評價可信的佐證,一個踩坑的概率剪枝,300多條勉強足夠了,所以盡管有些餐館的評論數特別多,它在這一項上的得分也不應該是正常水平的幾倍,于是你就需要一個非線性的評價曲線,讓評論數超過了一定閾值之后,增長相同的評論數,得分增長越來越低。這里一般會取用y=a*log10(x)+b的形式,通過調整a與b來根據數據調整曲線。
標準化處理時也要考慮數據可能存在的問題,比如由于維度拆分過細,樣本量較少,數據異常,可能會導致在單項上某個對象沒有數值,針對此類情況,是否考慮在單次評價中將該項上的權重按比例轉移?還是有一個兜底分數?等等。
不同的標準化方式其實適用于不同的業(yè)務要求(數據精準,顆粒度等),在多指標評價中你最終可能還會覺得權重的設置起了更重要的作用,但是說到底還是2部分:數據+算式(處理)。清楚你要評估的對象的哪些方面,清楚地定義口徑,是評價體系的客觀性的重要體現。
其實很明顯,多指標的評價是一個描述不同對象的差距程度的,可以理解是描繪競爭關系的,是相對的,橫向的,就比如在自媒體的后臺中,平臺給的分數的絕對值并不能完全代表你的水平浮動,但是努力提高創(chuàng)作水平,爭取提高你的分數,一定是有用的,因為你改變了競爭關系~
版權說明: 本文由用戶上傳,如有侵權請聯(lián)系刪除!
猜你喜歡:
- 2022-09-20 男人惡心是什么病的前兆(惡心是什么病的前兆)
- 2022-09-20 山東財經大學東方學院考研率怎么樣(山東財經大學考研率是多少)
- 2022-09-20 廣西最早的大學叫什么大學(在桂林設立的廣西最早的大學是哪所大學)
- 2022-09-20 小兒肺炎有5個常見癥狀嗎(小兒肺炎有5個常見癥狀)
- 2022-09-20 m是哪個服裝品牌的標志(標志為M的衣服是什么牌子的)
- 2022-09-20 什么叫正比例什么叫反比例舉例說明(什么叫反比例,舉個例子說明,)
- 2022-09-20 一包煙要多少根煙絲(一包煙要多少根)
- 2022-09-20 男人吃櫻桃對身體有什么好處(男人吃櫻桃有什么好處)
最新文章:
- 2023-07-02 怎樣挑選新鮮的豬肝?(怎么挑選新鮮豬肝 挑選新鮮豬肝的小技巧)
- 2023-07-02 木地板都有哪些種類(木地板的種類有哪些)
- 2023-07-02 白蠟木家具的優(yōu)缺點(松木家具的優(yōu)缺點)
- 2023-07-02 怎么清洗窗簾布上的污垢(怎么清洗窗簾)
- 2023-07-02 世界上最可愛的小倉鼠的樣子(可愛小倉鼠的種類)
- 2023-07-02 小貓拉不出來屎怎么辦(小貓拉不出屎怎么辦)
- 2023-07-02 新飛小冰箱耗電量一天多少度(小冰箱耗電量一天多少度)
- 2023-07-02 公司注銷工業(yè)房產怎么辦手續(xù)(公司注銷工業(yè)房產怎么辦)
- 2023-07-02 鳳凰層到底好還是不好(鳳凰層是哪一層)
- 2023-07-02 馬桶寬度空間留多少(馬桶兩邊的空間大小是多少)
- 2023-07-02 如何訓練貓咪小便(如何訓練貓大小便)
- 2023-07-02 衛(wèi)生間吊頂防潮層做法圖集(衛(wèi)生間吊頂方法是什么)
- 2023-07-02 狗狗為什么總是流口水怎么辦(狗狗為什么愛流口水)
- 2023-07-02 臥室窗戶漏水由誰負責維修(臥室窗戶漏風怎么辦)
- 2023-07-02 世界名貓大全(世界名貓你知道幾種)
- 2023-07-02 applewatchseries7和6對比(apple watch series 7和6的區(qū)別)