书签分享收藏举报版权申诉 / 23

立即下载加入VIP,免费下载

当前位置：首页 > 经管营销 > 经济市场 > 第一章数据从何而来.docx

第一章数据从何而来.docx

文档编号：29699525
上传时间：2023-07-26
格式：DOCX
页数：23
大小：33.86KB

第一章数据从何而来.docx

《第一章数据从何而来.docx》由会员分享，可在线阅读，更多相关《第一章数据从何而来.docx（23页珍藏版）》请在冰豆网上搜索。

第一章数据从何而来.docx

第一章数据从何而来

教育統計的應用

「統計學的世界」心得報告

指導教授：

謝季宏教授

系級：

學校行政碩一

學生：

M10151723黃文玲

第一章數據從何而來？

一、簡介

統計是數據的科學，好的統計，要有好的判斷，甚至好的品味，當然還要好的數學。

統計是處裡數字的，但是並非所有變數的值都是數值；要確定研究中的變數，度量的就是我們想要的資訊。

對於任何一項統計，我們最需要知道的，就是數據如何產生的。

包括觀測研究、抽樣調查、普查及實驗。

二、我學得

1.每當有人提出統計數據給我們時，我們第一個該問的問題就是：

「這個數字

是從哪裡來的？

」

2.任何一項統計研究都是紀錄關於個體（individual）的特質，變數（variable）就是

該物體一個或多個特質。

3.觀測研究（observationalstudy）是觀察一些個體，並度量我們感興趣的變數，

但是並不會試圖影響回應。

4.抽樣調查（samplesurvey）只研究調查對象中的一部分個體，而被選中的個體

是因為具有代表性。

被選中的個體稱為樣本（sample），是母群體（population）

的一部分，我們從樣本蒐集資料，以便對整個母群體做結論。

5.普查（census）是試圖把整個母群體納入樣本的抽樣調查，但是從時間和金錢

的角度來看，抽樣比普查還更可能會得到較精確的結果。

6.實驗（experiment）是會刻意對某些個體加上某項處裡，以期能夠觀察個體的

反應，所以實驗的目的就是要研究，是否因為特別處裡而使個體產生反應。

原則上來說，實驗可以爲因果關係（causeandeffect）提供良好的證據。

三、我覺得

1.我們常會依賴政府的統計學家來提供正確的數據，例如我們信任失業率的

數字，但是我們在面對統計數字時，應該思考三個基本問題：

是誰製造了

統計數字？

製造的目的為何？

製造的過程為何？

2.值得信任的、好的統計數據，又該如何得到呢？

除了必須要有清楚合理的

定義、清楚合理的測量，還要有好的、具代表性的樣本；唯有如此我們才

能不是只有看到一個統計數字，還看到獲得數字的完整過程，以及統計所

要呈現出來的結果。

第二章好樣本和壞樣本

一、簡介

我們選取好的樣本，是希望得到關於整個母群體的資訊，但是怎樣取得較能代表母群體的樣本呢？

如果統計問題的設計使得變數結果某個方向偏，我們就稱這個設計是有偏的。

方便樣本與自發性回應樣本常是有偏的。

對於任何樣本，要問的第一個問題是：

樣本是否是隨機抽取的？

隨機樣本利用機遇來挑選樣本，可以避免人為選擇的誤差。

二、我學得

1.抽樣調查時，方便樣本（conveniencesample）是由訪談者決定的，自發性回應

樣本（voluntaryresponsesample）是由受訪者自行決定要不要回應，這兩種情

形常常因人為因素而造成偏差。

2.不牽涉人為選擇的，使用機遇來選出樣本，以消除偏差。

大小為n的簡單

隨機樣本（SRS，samplerandomsample）是有n個個體的樣本，選取的方法，

是使母群體中的任一組n個個體，都有相同的中選機會。

3.選取簡單隨機樣本（SRS）的步驟：

（1）編代碼：

對個體中每一個個體，指定一個數字代碼。

（2）利用隨機數字表：

利用隨機數字來隨機選取代碼。

三、我覺得

1.簡單隨機樣本不僅讓每個個體都有相同的中選機會，消除選擇偏差，也讓

每個可能的樣本，有同樣的中選機會，就像由帽子裡抽籤一樣。

當然如果

母群體很大，可以藉由電腦產生的隨機數字來選取樣本。

2.「簡單隨機抽樣」雖然說是較不致有「偏誤」的抽樣方式，但是此一名詞

也常遭到誤用。

例如，常會見到論文研究以高雄市學校為研究對象，但是

不同行政區的背景是否有差別？

文教區跟商業區的學校，家長的社經背景

是否也有差異？

雖說是「簡單隨機抽樣」，但是在過程中若思慮不周，「隨

機」往往就變成不是「隨機」了！

3.母群體和樣本，在統計中是很重要的基本觀念，但是抽樣調查並不是隨意

判斷任意抽樣來完成的，應該要設定好適合的母群體，然後從中抽取一些

能代表母群體的樣本。

第三章樣本告訴我們什麼？

一、簡介

抽樣的目的，是要在推論出樣本後，就可以用歸納和統計推論來估計關於母體的訊息。

我們通常用樣本統計量，來估計母體參數的值。

運用隨機樣本，且用夠大的隨機樣本，使幾乎所有樣本較能得出精確的統計結果。

要表達我們對母體所做結論的精確程度，可以使用信賴敘述（confidence

statement），包含誤差界限（marginoferror）及信賴水準（levelofconfidence）。

但是重要的是樣本的大小，而不是母體的大小。

二、我學得

1.用樣本的事實，推論母體真實訊息，想要估計未知的參數，要從母體選擇

一個樣本，再用樣本的統計量當作估計值就知道了。

（1）參數（parameter）：

參數是一個固定數字，是描述母體的數字，但是我們

實際上無法知道參數的值。

（2）統計量（statistic）：

是描述樣本的數字，換個不同的樣本，統計量的值就

可能會改變，我們常用統計量來估計未知的參數。

2.變異性（variability）的重要程度不亞於偏差（bias），變異性描述的是，當我們

取很多樣本時，統計量的值會分散到什麼程度；變異性大就代表不同樣本

的結果可能差別很大。

從一個隨機樣本所得到的統計量的變異量，並不受

母體大小影響，只要母體至少比樣本大100倍即可。

3.解讀信賴敘述：

（1）信賴敘述的結論永遠是針對母群體，而不是針對樣本。

（2）我們對母群體所做的言論永遠不會是完全確定的。

（3）抽樣調查可以選擇95%以外的信賴水準。

（4）報告誤差界限時，用95%的信賴水準是很普通的。

（5）想在同樣的信賴水準下，要求較小的誤差界限，要取較大的樣本即可。

4.「誤差界限是正負x個百分點」是指：

如果我們使用和抽這個樣本一樣的

方法，去抽取很多樣本，則這些樣本中有95%的比例，所得到的結果會在

母體真正值的正負x個百分點之內。

5.誤差界限速算法：

假設我們是在用大小為n的簡單隨機樣本的樣本比例p，來估計未知的母

體比例p，對應95%信心的誤差界限，大致等於1/√n。

三、我覺得

1.一個好的抽樣應該要有小偏差以及小變異性。

利用隨機抽樣可減低偏差，

例如先將整個母體列出來，再從中抽取簡單隨機樣本；而用大一點的樣本

數，可以減低簡單隨機樣本的變異性。

2.通常一個隨機樣本的結果，不會剛好估計出母體的真正值，所以使用誤差

界限來表達，我們有95%的信心，相信真正值會在誤差界限內。

3.樣本數量愈大，並不能代表它就是有效的樣本，研究者一定要從母群體中

蒐集真正具代表性的樣本。

很多統計都是由小樣本推論到大規模母群體，

所以提供統計數字時，應該解釋清楚選擇樣本的正確方法，好的樣本才能

夠代表整個母群體，才不會扭曲最後的統計結果。

4.正如教授上課所言:

「凡是測量，必有誤差」，也所以「母數」≠「統計量」。

但是爲了力求統計結果的推論合理，務必讓「母數」≠「統計量」之間的

誤差和變異量盡量縮小，否則誤差大的也是統計量，誤差小的也是統計量，

但推論出來的結果卻可能相差十分大，就研究結果而言，有可能提供錯誤

的資訊致使決策錯誤。

當然現實中，牽涉到成本及時間的關係，但在合理

範圍內，總是必須盡量讓兩者接近。

第四章真實世界中的抽樣調查

一、簡介

隨機抽樣在選擇樣本時可以消除偏差，但是也沒辦法對母群體提供完全正確的資訊，抽樣誤差（samplingerror）使得樣本結果與普查結果不同。

抽樣誤差包括常見的隨機抽樣誤差與涵蓋不全兩種。

非抽樣誤差（nonsamplingerror）是常見的包括處裡誤差與回應誤差，這些誤差和抽取樣本沒有關係，但是設計抽樣調查的人會應用統計技巧來設法減低非抽樣誤差。

嚴謹的抽樣調查會告訴我們真相：

好的抽樣設計是利用機遇從母群體抽取個體，而問題的措辭對抽樣調查的結果也是有影響的。

二、我學得

1.抽樣之前必須先要有一個涵蓋全部母群體的抽樣底冊（samplingframe）。

但

是整個母群體的清單通常很難取得，所以大部分的樣本多少會有涵蓋不全

的問題。

2.一項抽樣調查中所宣布的誤差界限，只包括隨機抽樣誤差。

涵蓋不全、無

回應以及其他困難也會造成大偏差，但是誤差界限並沒有包括這些項目。

3.分層隨機樣本（stratifiedrandomsample）有以下步驟：

（1）將抽樣底冊中的個體纖分成若干群，稱為層，分層的標準是，對於這些

層有特別的興趣，或同一層中有接近的性質。

（2）每層各取一個SRS，全部合起來就是我們要的樣本。

4.機率樣本（probabilitysample）是利用機遇抽取的樣本。

要先知道哪些樣本是

可能的，以及每個可能的樣本被抽中的機率是多少。

三、我覺得

1.調查者使用好的技巧，而且認真準備抽樣底冊，注意問題的措辭，並減少

無回應，意見調查及其他抽樣調查，是可以提供精確而有用的資訊。

2.很多調查都是設計好要影響公眾意見的調查，並不能提供精確而且有用的

資訊，所以我們在留意一些調查結果時，應該注意更多問題，例如：

是誰

做的調查？

母群體是誰？

樣本如何選取的？

樣本有多少？

調查是什麼時候

做的？

等等。

第五章實驗面面觀

一、簡介

觀測研究是被動的數據蒐集方式，實驗是能主動產生數據的方式。

在實驗當中，我們可以自行設定「解釋變數（explanatoryvariable）」，以研究受對象另一個因此改變的「反應變數（responsevariable）」。

觀測研究和單軌實驗都常會因為和潛在變數（lurkingvariable）的交絡（con-

founded），而產生沒有用的數據；所以設計實驗，是要確定可以顯示解釋變數對於反應變數的影響。

利用隨機化比較實驗，同時比較兩個或多個處理，使得機遇產生的影響變小。

因果關係問題，我們能得到的最好數據，是從觀測研究得來的。

但是如果能比較相似的組，並且盡量多度量潛在變數來做統計調整的話，結果會是比較可信的。

二、我學得

1.反應變數是指用來度量研究結果的變數，解釋變數是指我們認為可以解釋

或造成反應變數變化的變數。

潛在變數是對研究中其他變數間的關係有重

要影響，卻並未被列為解釋變數的變數。

2.當兩個變數對反應變數的影響混在一起而無法區分時，我們稱這兩個變數

是交絡的，交絡的變數可以是解釋變數，也可以是潛在變數。

3.隨機化比較實驗是統計學裡最重要的概念之一，其實驗邏輯為：

（1）用隨機化的方法將受試對象分組，分出的各組在實施處理前，各方面都

要類似。

（2）用「比較」的設計以確保：

除了實驗上的處理外，其他所有因素都會同

樣作用在所有組別上。

（3）所以反應變數的差異，必是處理的效果所導致。

4.統計實驗設計的基本原則：

（1）要控制潛在變數對反應變數的影響，最簡單的方法是同時比較至少兩個

處理。

（2）隨機化：

用非人為的隨機方法來指派受試對象到不同的處理組。

（3）每一組的受試對象要夠多，以減低結果中的機遇變異。

三、我覺得

1.隨機化比較實驗和隨機樣本一樣，都受到機遇的影響，所以用足夠多的受

試對象、同時比較數個處理，以及隨機化，才能使得差異不會只因機遇變

異就發生。

2.好的研究不管是不是實驗，都一定要做比較，雖然比較並不能消除交絡，

但是我們如果可以同時運用比較與適配，盡量度量並調整交絡變數，就可

以用統計做出較可信的結果。

3.在科學實驗中容易在研究室獲得相同的條件，但是社會科學實驗因為受試

者本身的差異，及潛在變項的存在，「反應變項」未必能完全反應「解釋變

項」的影響。

尤其當不同變項間的「交絡」作用產生時，就必須透過更嚴

謹的實驗，所以「隨機化比較實驗」是很重要的。

4.統計的資料通常是一堆龐大的資料，而資料經過蒐集、處理、分析、解釋，

獲得資料所代表的意義。

統計是用專業的術，蒐集、整理、分析資料，以

獲得最接近事實真相的資訊，來了解或解釋現象。

第八章度量（Measure）

一、簡介

度量人或物的某一性質，是用數字來代表那個性質，不論我們量的是什麼，只要我們測量的人事物在該項有差別，這個變數的值就會不一樣，所以量度的結果是一個數值變數（numericalvariable）。

統計的觀點來看，是不是有效量度，對於物理性質的量度是很容易判斷的；但是若要度量人的性格或其他模糊性質時，量度是否有預測有效性是最好的方法。

通常來說，事情發生的比率（rate）是比計數（count）更為有效的量度。

度量時的誤差包括每次度量時都發生的系統誤差，以及根本無法預測的隨機誤差，但如果隨機誤差很小，我們稱這個量度很可靠。

二、我學得

1.量度是將概念轉換成明確意義的變數的過程，但是在度量性質或概念時，一定要了解其變數的各項細節。

如果量度出的變數和某一性質有關，該項變數才能成為這個性質的有效量度。

2.並不是所有的性質都可以被量出來，所以要如何設計有效的量度方法，如何呈現有意義的變數，是否能正確反映統計的結果，是要經過多方思考、討論與設計的。

3.雖然量度會有偏差，但是度量同樣的東西結果如果會重複，那此量度就是一可靠的量度；而多設計幾個量度或是多度量幾次來取平均，可以得到變異更小更可靠的結果。

4.數字看起來似乎很可靠，但是數據畢竟是人類創造出來的，因此若我們必須度量人類性格的時候，應該怎麼量可是非常複雜的。

三、我覺得

1.好的統計來自產生可靠數據的好設計，考慮實驗設計的統計層面，做出最好的判斷，實在很不容易。

盡量消除樣本產生的偏差，做出最可靠的量度結果，才能做出最好的預測或結論，這樣的統計結果才能幫助我們了解議題或相關現象。

2.「度量」的變數如何選擇，如何界定，如何測量，皆有很強的邏輯性。

為何選此一變數，忽略另一變數？

皆必須有其原因，因此做研究者皆須進行文獻探討，一方面也是在幫自己的研究立論、假設及所欲度量的變數尋求支持。

若有現成的研究，當然說服力較強，但是總會有缺乏現成相關論述的時候，這時變數的選擇、界定，便需很強的邏輯判斷，而邏輯判斷需要哲學思辨的能力，所以統計學也需訓練邏輯思辨的能力。

3.有些時候，事情發生的百分比是比計數更為有效的量度，但是教授上課時也曾經提醒，並不是所有的情況都可以使用百分比，尤其是數量很少時，使用百分比會將數據誇大。

第九章數字合不合理？

一、簡介

商業數據、廣告主張、對公共議題的說明，我們每天都被許多不同的數字圍繞著，但是這些數據是怎麼產生的？

這些數據的量度是可靠的嗎？

爛數據或是錯誤使用的好數據，都讓呈現出來的結果不如數字的實際意義。

數字是否可信，數據過分精確或太有規律，考慮系統誤差加上隨機誤差，該數據很可能是編造出來的；錯誤的結論或令人無法理解的結論，常常是粗心大意所造成的結果。

二、我學得

1.量度的數字是有相關內容的，但是如果不知道相關內容，單獨的赤裸裸的數字是無法給我們太多訊息的。

2.養成仔細檢查數字的習慣，檢驗數字是否合理，判斷其是否是有效量度，才不會被數字欺騙。

三、我覺得

1.第二週上課時教授曾經提及，有一則新聞報導指出：

國民「平均收入」達到每人每個月約四萬八千多元。

這項數據實在令人匪夷所思，因為利用這樣的「平均」來報導這項議題，實在沒有什麼意義。

2.對統計研究來說，第一個問題及最重要的問題，就是「數據是從哪裡來的？

」

好的統計是來自產生有效數據的好設計。

所以實驗設計的層面、隨機樣本的偏差、有效數據的處理，都是非常重要的統計學概念。

3.我們需要統計來概述與澄清複雜社會的一些事實，但是使用統計的人也可能無意或故意利用數據來扭曲事實、操縱人心，所以我們每次看到統計數據的時候，一定要審慎的判斷是非。

4.處理資料，需思考到原始數據的來源；不論是處理或接受資料，都必須對數據抱

著合理的懷疑：

原始資料的來源、取樣的正確性和代表性、統計計算是否為最佳

方式、統計推論是否合理…等等。

所以運用資料的人，必須時時對資料抱著合理

的懷疑，才能對所做的決策更加謹慎。

第十章好的圖及壞的圖

一、簡介

統計是處理數據的，而我們通常用表和圖來呈現數據，經由隨機抽樣、隨機化比較實驗和有效量度，可以產生好的數據，我們得再從數據中，看看數據說了什麼。

類別變數（categoricalvariable）把個體歸類到數個組或數個類別其中之一；數量變數（quantitativevariable）的值是數值的，因此拿來做算數例如平均時，是有意義的。

要表示類別變數的分布，可以用圓瓣圖（piechart）或長條圖（bargraph）。

圓瓣圖可以顯示一個整體怎樣分為幾個部份，所有的部份合起來就是全體。

長條圖卻可以用來比較並不屬於同一個整體的數量。

許多數量變數是隔一段時間量一次的，這些變數是如何隨時間而變化，要表示出這些變化，應該使用線圖（linegraph），把變數的值為橫軸對應著時間為縱軸畫圖。

二、我學得

1.圓瓣圖：

圓瓣圖永遠是顯示整體的各個部分。

2.長條圖：

長條圖是可以用來比較任何同樣單位度量出來的數，有時候不能用圓瓣圖來取代長條圖，所以長條圖的用途還是比較廣。

有時把長條圖的順序調整之後，可以讓圖的資訊更明確。

3.象形圖：

長條圖是經由比較代表各數量的長條高，在統計學上要避免使用象形圖，因為這種圖把長條圖中的長寬都改變了。

4.線圖：

一定要把時間刻度畫在圖的橫軸上，把正在度量的變數放在縱軸上，

用直線連接根據數據畫出的點，以便呈現出隨時間變化的狀況。

但是一定要注意線圖的刻度，藉由線圖不同刻度的選擇，同樣正確的圖形可以給人不同的印象。

5.怎樣把圖畫好：

（1）一定要在標示和說明裡表示清楚，圖裡面畫的變數是什麼，單位是什麼，

以及資料來源。

（2）要讓數據很醒目。

抓住看圖者注意力的是數據本身。

（3）要注意實際上眼睛會捕捉到什麼。

避免用象形圖，而且要小心選擇刻度。

三、我覺得

1.數據表把資料做了摘要，但是有時候比率（或是百分比）會比計數清楚，我們可以用計數來說明變數可能有什麼值，再用比率來顯示這個值所傳達的資訊。

2.「長條圖」、「直方圖」、「線圖」，或是「圓瓣圖」，都有其適合的使用時機；

但該使用何種圖，須看其內部資料特性，不同特性的資料，適合不同的呈現方式；而不同的目的，也須利用不同的圖。

3.因為圖給人的印象較深刻，所以不小心的人很容易被誤導，例如線圖中的刻度，有沒有刻意被拉大或壓縮來製造特定效果；也不要在圖中加入不必要的東西，以免數據看不清楚。

例如教授上課曾經講過，折線圖的y軸與x軸的比例大約為3：

4，較符合美觀與結果一致。

第十一章用圖形呈現分布

一、簡介

要呈現數量變數的分布可以用直方圖（histogram）或莖葉圖（stemplot），在觀測值的個數不多時，通常使用莖葉圖；而資料數量較多時，才會使用到直方圖。

要描述直方圖或莖葉圖的整體型態，可以用形狀（shape）、中心（center）或離度（spread）。

分布的整體形狀，提供了關於變數的重要資訊，有些分布不太規則；有些分布有簡單的形狀，若直方圖的左半和右半大致上可看成互為鏡中影像，則稱該分布為對稱（symmetric）。

二、我學得

1.要描述一個分布的時候，注意力要放對重點，要尋找主要的尖峰，而不是直方圖中的小起伏。

2.如何畫直方圖：

（1）將資料的數值範圍分成相同寬度的組（class）。

（2）數一下每組中每個個體的個數。

（3）把要展示分布的變數在橫軸上標示出刻度，然後畫直方圖。

3.如何畫莖葉圖：

（1）把每個觀測值分成莖與葉兩個部份，莖包括除了最後一位數字之外的所有數字，葉就是最後那一位數字。

（2）把莖由小到大，由上而下寫成一直行，並在這一直行右邊劃一條直線。

（3）把每個葉寫在他所屬的莖的右邊，由小到大排成一列。

4.解釋直方圖和解釋莖葉圖，一樣要尋找整體型態，以及有無離群值（outlier）。

三、我覺得

1.畫統計圖本身並不是最終目的，畫統計圖的目的是要幫助我們了解數據資

料。

例如直方圖每個組的寬度一樣，長條的高度就代表該組的計數。

2.教授之前上課講解與看完本章後，更加了解到直方圖與長條圖並不相等，前一章的長條圖數據資料是不連續的，是用來比較任何同樣單位度量出來的數；而這一章的直方圖是將同一資料依數字加以分組，觀察數據的分布情況。

3.莖葉圖可以呈現最實際的觀測值，但是因為莖葉圖的組距是固定的，所以有可能畫出來的圖反而不能有效描述分布。

4.當要解釋資料時，研究者常會將資料和內心的假設作印證。

當兩者有出入時，研究者便必須去求證原因。

而當研究者對研究變項的背景資料不夠瞭解時，有時是無法做出合理推論的。

例如，教授上課曾經舉例，美國某州相對於其他各州，痲瘋病患者比例非常高，若研究者對該州背景不了解，可能解釋該州痲瘋病傳染嚴重；但相對的，若對該州了解，知道是因為該州有痲瘋病的專門療養院，解釋的方向便會不同。

所以為了更正確的解釋資料，研究者須對資料的背景作更深入的了解才行。

第十二章用數字描述分布

一、簡介

要描述一組數據，一定要先畫圖，然後再用一些數字來描述該分布。

描述圖形分布的中心及離度，描述中心及離度有兩種常用的方式，包括「五數綜合」及「平均數與標準差」。

五數綜合（five-numbersummary）由小到大，包括：

最小數、第一四分位數、中位數、第三四分位數及最大數。

五數綜合並不是描述分布最常用的數值，最常用的是以平均數（mean）來度量中心，加以用標準差（standarddeviation）來度量離度。

二、我學得

1中位數M（medianM）：

是一個分布的中間點，亦即一半的觀測值比它小，另一半的觀測值比它大。

2.四分位數Q（quartile）：

（1）將觀測值由小到大排列，在排好順序的序列中找出中位數。

（2）第一四分位數Q1，是中位數左邊比中位數小的所有數字的中位數。

（3）第三四分位數Q3，是中位數右邊比中位數大的所有數字的中位數。

3.平均數（meanX）即為該組觀測值的平均。

4.標準差（standarddeviationS）度量的是觀測值與平均數間的平均距離，計算的

方法是先算出各距離平方後的平均值，再取平方根。

步驟如下：

（1）先找出每個觀測值距平均數的距離，把這個距離平方。

（2）把所有距離的平方加起來，並除以n-1。

這個距離平方的平均，稱為變異數（variance）。

（3）再把這個變異數取平方根，即為標準差S。

5.標準差S度量的是以平均數X為中心的離度，只有在沒有離度時，S才會等於零。

平均數會因少數離群值而受很大的影響，中位數則不會。

三、我覺得

1.用中位數（中間點）或平均數（算術平均）來描述一組數據的中心都很合理，但是兩者的概念不同，平均數會因少數離群值而受很大的影響，中位數則不會，所以平均數和標準差只能適合用在大致對稱的分布。

2.在此終於了解之前章節，為什麼拿到數據資料應該都要先畫圖，因為這樣我們才能知道這組數據是不是大致對稱的分布，才能決定是否選擇平均數與標準差來解釋，還是只能適合用五數綜合來描述。

3.平均數是最常爲人使用的統計方法之一，但是少部分的離群值的確常會造成影響，

造成閱讀人的誤解，尤其是在無法直接接觸到原始資料時；五數綜合是較好的表現方式，可避免極端的離群值影響，

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 第一章数据

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：第一章数据从何而来.docx
链接地址：https://www.bdocx.com/doc/29699525.html

第一章数据从何而来.docx

热门标签