- 相關推薦
統計學基礎知識匯總
統計學是一門闡明如何去采集、整理、顯示、描述、分析數據和由數據得出結論的一系列概念、原理、原則、方法和技術的科學,是一門獨立的、實用性很強的通用方法論科學。你知道多少統計學基礎知識呢?下面是yjbys小編為大家帶來的統計學基礎知識。歡迎閱讀。
一、名詞解釋
1、統計學
統計學是一門闡明如何去采集、整理、顯示、描述、分析數據和由數據得出結論的一系列概念、原理、原則、方法和技術的科學,是一門獨立的、實用性很強的通用方法論科學。
2、指標和標志
標志是說明總體單位屬性或特征的名稱。指標是說明總體綜合數量特征和數量關系的數字資料。
3、總體、樣本和單位
統計總體是統計所要研究的對象的全體,它是由客觀存在的、具有某種共同性質的許多個體所構成的整體。簡稱總體。構成總體的個體則稱為總體單位,簡稱單位。樣本是從總體中抽取的一部分單位。
4、統計調查
統計調查是根據統計研究的目的和要求、采用科學的方法,有組織有計劃的搜集統計資料的工作過程。它是取得統計數據的重要手段。
5、統計絕對數和統計相對數
反映總體規模的絕對數量值,在社會經濟統計中稱為總量指標。統計相對數是兩個有聯系的指標數值之比,用以反映現象間的聯系和對比關系。
6、時期指標和時點指標
時期指標是反映總體在一段時期內累計總量的數字資料,是流量。時點指標是反映總體在某一時刻上具有的總量的數字資料,是存量。
7、抽樣估計和假設檢驗
抽樣估計是指根據所抽取的樣本特征來估計總體特征的統計方法。假設檢驗是先對總體的某一數據提出假設,然后抽取樣本,運用樣本數據來檢驗假設成立與否。
8、變量和變異
標志的具體表現和指標的具體數值會有差別,這種差別就稱為變異。數量標志和指標在統計中稱為變量。
9、參數和統計量
參數是反映總體特征的一些變量,包括總體平均數、總體方差、總體標準差等。統計量是反映樣本特征的一些變量,包括樣本平均數、樣本方差、樣本標準差等。
10、抽樣平均誤差
樣本平均數與總體平均數之間的平均離散程度稱之為抽樣平均誤差,簡稱為抽樣誤差。重復抽樣的抽樣平均誤差為總體標準差的1/。
11、抽樣極限誤差
抽樣極限誤差是指樣本統計量和總體參數之間抽樣誤差的可能范圍。我們用樣本統計量變動的上限或下限與總體參數的絕對值表示抽樣誤差的可能范圍,稱為極限誤差或允許誤差。
12、重復抽樣和不重復抽樣
重復抽樣也稱為回置抽樣,是從總體中隨機抽取一個樣本時,每次抽取一個樣本單位時都放回的抽樣方式。不重復抽樣也叫不回置抽樣,它是在每次抽取樣本單位時都不放回的抽樣方式。
13、點估計和區間估計
點估計也叫定值估計,就是直接用抽樣平均數代替總體平均數,用抽樣成數代替總體成數。區間估計是在一定概率保證下,用樣本統計量和抽樣平均誤差去推斷總體參數的可能范圍的估計方法。
14、統計指數
廣義上來說,它是表明社會經濟現象的數量對比關系的相對指標。狹義上來說,它是反映不能直接相加對比的復雜總體綜合變動的動態相對數。
15、綜合法總指數
凡是一個總量指標可以分解為兩個或兩個以上的因素指標時,將其中一個或一個以上的因素指標固定下來,僅觀察另一個因素指標的變動程度,這樣的總指數就叫綜合法指數。
16、平均法總指數
平均法總指數是通過對個體指數進行加權平均而求得的反映不能直接加總的多個個體所組成的復雜總體綜合變動的指數。分為兩種:加權算術平均法總指數和加權調和平均法總指數。
17、時間數列
時間數列是指同一觀察現象的觀察值按其發生的時間先后順序排列而形成的數列。時間數列也稱為時間序列和動態數列。
18、相關分析和回歸分析
相關分析是一種分析幾個變量之間是否存在關系以及它們的關系如何的統計方法。回歸分析是指對具有顯著相關關系的現象,根據其關系形態,選擇一合適的數學模式,用來近似地表達變量見的平均變動關系的統計分析的方法。
19、時間序列的最初水平、中間水平和最末水平
時間數列中第一個觀察值稱為最處水平,最后一個觀察值稱為最末水平,其余各個觀察值稱為中間水平。
20、調查對象、調查單位和填報單位
調查對象是所要研究對象的總體。調查單位是所要研究對象的個體。填報單位是提交調查資料的單位。調查單位和填報單位有時相同,有時不同。
21、環比發展速度和定基發展速度
環比發展速度是以報告期水平與其前一期水平對比,所得到的動態相對數。表明現象逐期的發展變動程度。定基發展速度是用報告期水平與某一固定基期水平(通常為最初水平)對比,所得到的動態相對數。它表明所觀察現象在一段時期內發展的總速度。
22、經常性調查與一次性調查的區別
兩者的區分是以調查單位的登記在時間上是否具有連續性為依據的。經常性調查的對象本身具有連續不斷變化的特點。商品零售額。一次性調查的對象是時點現象。如人口普查。
二、簡答題
1、指標和標志的區別與聯系
兩者的區別:(1)指標是反映總體特征的,而標志是反映總體單位特征的。
(2)標志可以用文字來反映,也可以用數字來表示。而指標都是用數量來表示的。
兩者的聯系:(1)指標是指標的匯總和綜合。
(2)根據研究目的的不同,兩者有時可以互換。
2、統計總體的特點
(1)同質性。即總體單位都必須具有某些共同的品質標志屬性或數量標志屬性。這是構成總體的前提。
(2)大量性。即構成總體的總體單位數目要足夠多。這是形成總體的充分條件。
(3)差異性。即總體單位必須具有一個或若干個可變的品質標志或數量標志。這是形成總體的必要條件。
3、重點調查、抽樣調查、典型調查的區別與聯系
聯系:都是非全面調查,調查對象都是總體中的一部分
區別:
調查目的 |
調查單位 |
|
重點調查 |
了解被研究對象的基本情況,不能推算總體相應指標 |
重點單位是指它們的某一標志在總體標志值總量中占有絕大比重 |
典型調查 |
了解被研究對象的特征及發展變化趨勢,可近似推算總體數量,無法估計誤差 |
有意識地選取有代表性的典型單位 |
抽樣調查 |
用樣本指標數值推斷總體指標數值,可以計算和控制誤差 |
排除主觀愿望按隨機原則抽取樣本單位 |
4、統計絕對數的分類
(1)按其反映總體內容的不同分:總體單位總量和總體標志總量。
(2)按其反映不同的時間狀況不同分:時期指標和時點指標。
(3)按其采用的計量單位的不同分:實物指標、價值指標和勞動指標。
5、時期指標和時點指標的區別
時期指標:(1)連續記數,其值可以相加(2)具有時間長度,與時間長短有關 (3)是流量
時點指標:(1)間斷記數,其值不可以相加,相加無實際意義(2)不具有時間長度,與時間長短無關 (3)是存量
6、抽樣技術的特點
(1)在調查單位的抽取上,遵循隨機原則。
(2)以樣本數據估計總體數據。
(3)以概率估計的方法對總體進行估計。
(4)在推斷理論上,以大數定律和中心極限定理為基礎。
(5)抽樣誤差可以計算并加以控制。
7、抽樣誤差的種類
(1)登記性誤差。又稱調查誤差或工作性誤差,是完全可以避免的。
(2)代表性誤差。它又可以分為系統性誤差和隨機性誤差。系統性誤差是破壞隨機原則造成的偏差,也是可以避免的。隨機性誤差包括抽樣個體誤差和抽樣平均誤差。抽樣個體誤差不確定,難以計算。抽樣平均誤差無法避免,但可以計算和控制。
8、影響抽樣誤差的因素
(1)總體總變量值X間的差異大小。差異越大,誤差越大。
(2)樣本容量。樣本容量越大,抽樣誤差越小。
(3)抽樣方法。重復抽樣誤差一般大于不重復抽樣誤差。
(4)抽樣調查的組織形式。不同的組織形式,誤差不同。
9、統計相對數的種類
(1)計劃完成相對數。是實際完成數與計劃數的比值。
(2)結構相對數。是總體各組成部分數值與總體總數值的比值。
(3)比例相對數。總體中某一組的指標數值與總體中另一組的指標數值的比值。
(4)動態相對數。某現象報告期數值與同一現象基期數值的比值。
(5)比較相對數。某類現象的數值與不同空間同類現象的數值的比值。
(6)強度相對數。某一現象數值與另一有聯系但性質不同的現象數值的比值。
10、強度相對數與平均數的區別
(1)概念含義不同。平均數=總體標志總量/總體單位總量。強度相對數是某一現象數值與另一有聯系但性質不同的現象數值的比值。
(2)作用不同。強度相對數是反映某現象在另一現象中的強度、密度或普遍程度,反映現象間依存性的比例關系。而平均數是反映總體各單位的某一變量的各個變量值一般水平的代表值。
(3)表現形式不同。強度相對數的單位多是復合單位,由分子、分母的指標單位復合而成。平均數則是和標志總量單位的一致。
(4)強度相對數分子、分母可以互換,平均數的分子、分母不可以互換,互換無意義。
11、統計指數的種類
(1)按反映對象的范圍不同分:個體指數、類指數和總指數。
(2)按反映統計指標的不同內容分:質量指標指數和數量指標指數。
(3)按所采用的基期不同分:定基指數和環比指數。
(4)按表現形式不同分:綜合法總指數和平均法總指數。
12、相關關系的種類
(1)從涉及的因素多少來分,可分為單相關和復相關。只研究兩個因素之間的相關關系叫單相關。兩個以上的為復相關。
(2)從相關關系所呈現形態來分,可分為直線相關和曲線相關。
(3)直線單相關按呈現相關關系的方向劃分,又可分為正相關和負相關。正相關表明兩個因素的變動方向是相同的,負相關表明兩個因素的變動方向是不同的。
三、計算題
1、組距、組限和組中值的計算
例:
某地區工人勞動生產率分布情況見表1
按工人勞動生產率分組(元/人·月) |
企業個數(頻數) |
組距 |
組中值(元) |
頻率(%) |
3000以下 |
1 |
|||
3000~4200 |
3 |
|||
4200~5400 |
4 |
|||
5400~6600 |
4 |
|||
6600~7800 |
3 |
|||
7800~9000 |
2 |
|||
9000以上 |
3 |
|||
合計 |
20 |
要求:根據上述資料計算各組的組距、組中值和頻率(填在表中即可)
2、平均數、方差、標準差、離散系數的計算
例:
甲乙兩人都是某一零件廠的工人,兩人一個星期每天日產量資料如表2
時間 |
甲工人(個) |
乙工人(個) |
周一 |
5 |
6 |
周二 |
6 |
3 |
周三 |
4 |
6 |
周四 |
7 |
4 |
周五 |
2 |
4 |
(1)比較甲乙兩工人平均日產量的高低
(2)計算甲乙工人日產量的標準差和離散系數,說明哪個工人的平均日產量更具有代表性
3、抽樣平均誤差、抽樣極限誤差和區間估計
例:
某地區采用簡單隨機抽樣方法,對職工文化程度進行調查,抽查100名職工,每個職工文化程度的分布數列如表3
文化程度(年) |
組中值 |
人數(人) |
3~5 |
4 |
15 |
6~8 |
7 |
55 |
9~11 |
10 |
24 |
12~15 |
13.5 |
6 |
合計 |
100 |
求:(1)抽樣平均誤差
(2)在概率度t=2的條件下的平均文化程度的變化范圍
4、綜合法統計指數的編制
例:
商品名稱 |
計量單位 |
銷售量 |
價格 |
||
基期q0 |
報告期q1 |
基期p0 |
報告期p1 |
||
甲 |
米 |
200 |
240 |
15 |
18 |
乙 |
件 |
300 |
320 |
26 |
30 |
丙 |
斤 |
150 |
130 |
12 |
10 |
合計 |
求:(1)商品銷售額總指數、商品銷售量總指數和價格總指數
(2)分析由于銷售量的變動所引起的商品銷售額的變動狀況
(3)分析由于商品價格的變動所引起的商品銷售額的變動狀況
5、平均發展水平、環比速度、定基速度的計算
例:
某縣財政收入資料如表:
年份 |
1997 |
1998 |
1999 |
2000 |
2001 |
2002 |
財政收入(萬元) |
2000 |
|||||
逐期增長量(萬元) |
300 |
300 |
400 |
|||
環比增長速度(%) |
20 |
11 |
求:
(1)計算表中空缺數值
(2)計算1997~2002年平均發展水平、平均增長量、平均增長速度
6、相關系數、回歸方程
例:
生產費用與產品產量有一定關系,現從某一行業中隨機抽取8個企業,所得產量與生產費用的數據如下表:
企業編號 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
產量 |
40 |
42 |
50 |
55 |
65 |
78 |
84 |
100 |
生產費用 |
130 |
150 |
155 |
140 |
150 |
154 |
165 |
170 |
求:(1)計算產量和生產費用的相關系數
(2)求解以產量為自變量,生產費用為因變量的直線回歸方程
【統計學基礎知識】相關文章:
Keepalived的基礎知識03-21
壁畫的基礎知識04-20
Java的基礎知識07-27
油畫基礎知識05-22
國畫基礎知識05-31
油畫的基礎知識05-24
簡譜的基礎知識04-13
初學網球基礎知識07-17
美術基礎知識總結12-23