學習教育

當前位置 /首頁/學習教育 > /列表

如何計算異常值

1、瞭解如何認出潛在異常值。2、把數據從小到大排列。3、計算中位數。4、計算下四分位數,這裏設置爲Q1,表示總數據最小的25%的數據在這個點以下。5、計算上四分位數,設置爲Q3,表示最大的25%數據都在這個點以上。6、找出數據的“內圍”。7、找出數據外圍。異常值就是和其他樣本數據有顯著差異的值。這個詞在統計學中經常用到,可以表示數據異常或測量錯誤。明白算異常值的方法,對於正確理解數據非常有用,而且會引出更精確的結論。以下介紹一個很簡單的算異常值的過程和方法。

如何計算異常值

1、瞭解如何認出潛在異常值。計算之前先辨認數據中的潛在異常值。比如一列數據,表示的是房間內12個東西的溫度。如果其中11個的溫度在70華氏度(21攝氏度左右)內,第12個卻跑到300華氏度(約150攝氏度)了,那你可以粗略判斷這是一個異常值。

如何計算異常值 第2張

2、把數據從小到大排列。以以上數據爲例,繼續考慮房間內物體溫度: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69},變更順序爲: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.

如何計算異常值 第3張

3、計算中位數。中位數是一串數據中間的一個數據點,如果數據總數是偶數,那麼中間兩位數的平均數就是中位數。上面數據中,中間兩項是70、71,則中位數是((70 + 71) / 2)或70.5

如何計算異常值 第4張

4、計算下四分位數,這裏設置爲Q1,表示總數據最小的25%的數據在這個點以下。在上面例子中,又有兩個數據要被平分,即((70 + 70) / 2) 或 70

如何計算異常值 第5張

5、計算上四分位數,設置爲Q3,表示最大的25%數據都在這個點以上。本例子中Q3 是71、72的平均數,即 71.5

如何計算異常值 第6張

6、找出數據的“內圍”。第一步是把Q1和Q3的差(四分位差)乘以1.5。上面的例子中,四分位差是(71.5 - 70)得 1.5。再乘以1.5 得 2.25 ,加上Q3 ,用Q1 減去這個和,得到內圍。本例中內圍是67.75 and 73.75.任何在這個範圍外的數字都是“平穩界外值”。本例子中,只有300華氏度是在範圍以外的,即是所謂的平穩界外值。

如何計算異常值 第7張

7、找出數據外圍。和內圍方法類似,不過這裏要將四分位差乘以3 而非1.5。乘以3即(1.5 * 3) 得到 4.5。得到外圍是65.5 、 76任何這個範圍以外的數字,都算是“極端界外值”,300度也在這個範圍外,因此也算“極端界外值”

小提示

找到異常值以後,把其排除前要解釋其出現的原因。異常值可能指向實驗中的錯誤或分佈異常狀況。

你需要準備

計算器

TAG標籤:計算 #