在CFA一級數量Statistical concepts and marketreturns這一Reading種講到了測量數據的四個維度,分別是:名義維度(nominal scale)、排序維度(ordinal scale)、區間維度(interval scale)和比率維度(ratio scale)。
這四個維度的數據類型中具有名義或排序屬性的變量有離散(discrete)變量的特性,而具有區間和比率屬性的變量則有連續(continuous)變量的特性。
離散(discrete)
離散變量的數值種類是可數(有限)的,數值之間并不是連續無限可分的。離散變量有兩種:
*種叫名義測量(nominal measures)。名義測量只對變量進行分類,變量間的數值差別只反映類別上的異同,對他們排序沒有任何意思;不同的變量只表示不同的分類,而不能表示大小關系;不同變量之間沒有相等的數值間隔;變量之間不能作加減乘除運算,只能求各類變量的數量。在分析這類數據時常用的統計分析方法有頻數分析、求眾數。常見的例子包括性別、宗教、貸款是否違約等。
第二種叫排序測量(ordinal measures)。排序測量中的變量不僅可以表示類別,還可以根據某種屬性或特征按照一定的大小關系進行排序;但是,每個變量之間的間隔并不一致,彼此之間也不能用加減法來計算間距。可以使用的統計分析方法有頻數分析、求眾數。常見的例子有職稱(初級、中級和高級)、劃分年齡層次(兒童、少年、青年、中年及老年)等。
連續(continuous)
連續變量的數值與離散變量不同。連續變量在某一指定的范圍內可以取無限多個不同的值。連續變量包括以下分類:
第一類是區間測量(interval measures)。區間測量中的變量不僅可以排序,還可以測量變量之間的差值,這種差值表示的是變量之間的標準間距。溫度是*常見的例:攝氏溫度之間的數值間距是被標準化過的,10度與20度之間的溫差和20度與30度之間的溫差是一致的。需要注意的是,這類變量沒有真正的零點(true zero ornature zero),因為這類變臉的數值本身并不表示*的意義,也就是說零這一數值并不表示什么都沒有,30度也不能說是10度的三倍,它只是一個標準化的測量指標,數值本身是可以認為規定的。比如攝氏溫度的20℃與華氏溫度的68℉表示的是一樣的意義。
第二類是比率測量(ratio measures)。比率測量具有名義測量、順序測量和間隔測量所有的屬性,可以對變量進行分類、排序、加減乘除運算,它有*的零點(true zero)。它在四種測量維度中能體現出的信息。常見的例子有購買力、年齡、降雨量等。
在數理統計、數據分析及金融量化分析等很多定量研究領域中,研究人員必須要懂得如何區分變項的屬性,因為只有區分了變量的屬性,才能依據不同類型變量的特點來選擇合適的數據處理、分析方法。