第一章数据从何而来.docx
- 文档编号:29699525
- 上传时间:2023-07-26
- 格式:DOCX
- 页数:23
- 大小:33.86KB
第一章数据从何而来.docx
《第一章数据从何而来.docx》由会员分享,可在线阅读,更多相关《第一章数据从何而来.docx(23页珍藏版)》请在冰豆网上搜索。
第一章数据从何而来
教育統計的應用
「統計學的世界」心得報告
指導教授:
謝季宏教授
系級:
學校行政碩一
學生:
M10151723黃文玲
第一章數據從何而來?
一、簡介
統計是數據的科學,好的統計,要有好的判斷,甚至好的品味,當然還要好的數學。
統計是處裡數字的,但是並非所有變數的值都是數值;要確定研究中的變數,度量的就是我們想要的資訊。
對於任何一項統計,我們最需要知道的,就是數據如何產生的。
包括觀測研究、抽樣調查、普查及實驗。
二、我學得
1.每當有人提出統計數據給我們時,我們第一個該問的問題就是:
「這個數字
是從哪裡來的?
」
2.任何一項統計研究都是紀錄關於個體(individual)的特質,變數(variable)就是
該物體一個或多個特質。
3.觀測研究(observationalstudy)是觀察一些個體,並度量我們感興趣的變數,
但是並不會試圖影響回應。
4.抽樣調查(samplesurvey)只研究調查對象中的一部分個體,而被選中的個體
是因為具有代表性。
被選中的個體稱為樣本(sample),是母群體(population)
的一部分,我們從樣本蒐集資料,以便對整個母群體做結論。
5.普查(census)是試圖把整個母群體納入樣本的抽樣調查,但是從時間和金錢
的角度來看,抽樣比普查還更可能會得到較精確的結果。
6.實驗(experiment)是會刻意對某些個體加上某項處裡,以期能夠觀察個體的
反應,所以實驗的目的就是要研究,是否因為特別處裡而使個體產生反應。
原則上來說,實驗可以爲因果關係(causeandeffect)提供良好的證據。
三、我覺得
1.我們常會依賴政府的統計學家來提供正確的數據,例如我們信任失業率的
數字,但是我們在面對統計數字時,應該思考三個基本問題:
是誰製造了
統計數字?
製造的目的為何?
製造的過程為何?
2.值得信任的、好的統計數據,又該如何得到呢?
除了必須要有清楚合理的
定義、清楚合理的測量,還要有好的、具代表性的樣本;唯有如此我們才
能不是只有看到一個統計數字,還看到獲得數字的完整過程,以及統計所
要呈現出來的結果。
第二章好樣本和壞樣本
一、簡介
我們選取好的樣本,是希望得到關於整個母群體的資訊,但是怎樣取得較能代表母群體的樣本呢?
如果統計問題的設計使得變數結果某個方向偏,我們就稱這個設計是有偏的。
方便樣本與自發性回應樣本常是有偏的。
對於任何樣本,要問的第一個問題是:
樣本是否是隨機抽取的?
隨機樣本利用機遇來挑選樣本,可以避免人為選擇的誤差。
二、我學得
1.抽樣調查時,方便樣本(conveniencesample)是由訪談者決定的,自發性回應
樣本(voluntaryresponsesample)是由受訪者自行決定要不要回應,這兩種情
形常常因人為因素而造成偏差。
2.不牽涉人為選擇的,使用機遇來選出樣本,以消除偏差。
大小為n的簡單
隨機樣本(SRS,samplerandomsample)是有n個個體的樣本,選取的方法,
是使母群體中的任一組n個個體,都有相同的中選機會。
3.選取簡單隨機樣本(SRS)的步驟:
(1)編代碼:
對個體中每一個個體,指定一個數字代碼。
(2)利用隨機數字表:
利用隨機數字來隨機選取代碼。
三、我覺得
1.簡單隨機樣本不僅讓每個個體都有相同的中選機會,消除選擇偏差,也讓
每個可能的樣本,有同樣的中選機會,就像由帽子裡抽籤一樣。
當然如果
母群體很大,可以藉由電腦產生的隨機數字來選取樣本。
2.「簡單隨機抽樣」雖然說是較不致有「偏誤」的抽樣方式,但是此一名詞
也常遭到誤用。
例如,常會見到論文研究以高雄市學校為研究對象,但是
不同行政區的背景是否有差別?
文教區跟商業區的學校,家長的社經背景
是否也有差異?
雖說是「簡單隨機抽樣」,但是在過程中若思慮不周,「隨
機」往往就變成不是「隨機」了!
3.母群體和樣本,在統計中是很重要的基本觀念,但是抽樣調查並不是隨意
判斷任意抽樣來完成的,應該要設定好適合的母群體,然後從中抽取一些
能代表母群體的樣本。
第三章樣本告訴我們什麼?
一、簡介
抽樣的目的,是要在推論出樣本後,就可以用歸納和統計推論來估計關於母體的訊息。
我們通常用樣本統計量,來估計母體參數的值。
運用隨機樣本,且用夠大的隨機樣本,使幾乎所有樣本較能得出精確的統計結果。
要表達我們對母體所做結論的精確程度,可以使用信賴敘述(confidence
statement),包含誤差界限(marginoferror)及信賴水準(levelofconfidence)。
但是重要的是樣本的大小,而不是母體的大小。
二、我學得
1.用樣本的事實,推論母體真實訊息,想要估計未知的參數,要從母體選擇
一個樣本,再用樣本的統計量當作估計值就知道了。
(1)參數(parameter):
參數是一個固定數字,是描述母體的數字,但是我們
實際上無法知道參數的值。
(2)統計量(statistic):
是描述樣本的數字,換個不同的樣本,統計量的值就
可能會改變,我們常用統計量來估計未知的參數。
2.變異性(variability)的重要程度不亞於偏差(bias),變異性描述的是,當我們
取很多樣本時,統計量的值會分散到什麼程度;變異性大就代表不同樣本
的結果可能差別很大。
從一個隨機樣本所得到的統計量的變異量,並不受
母體大小影響,只要母體至少比樣本大100倍即可。
3.解讀信賴敘述:
(1)信賴敘述的結論永遠是針對母群體,而不是針對樣本。
(2)我們對母群體所做的言論永遠不會是完全確定的。
(3)抽樣調查可以選擇95%以外的信賴水準。
(4)報告誤差界限時,用95%的信賴水準是很普通的。
(5)想在同樣的信賴水準下,要求較小的誤差界限,要取較大的樣本即可。
4.「誤差界限是正負x個百分點」是指:
如果我們使用和抽這個樣本一樣的
方法,去抽取很多樣本,則這些樣本中有95%的比例,所得到的結果會在
母體真正值的正負x個百分點之內。
5.誤差界限速算法:
假設我們是在用大小為n的簡單隨機樣本的樣本比例p,來估計未知的母
體比例p,對應95%信心的誤差界限,大致等於1/√n。
三、我覺得
1.一個好的抽樣應該要有小偏差以及小變異性。
利用隨機抽樣可減低偏差,
例如先將整個母體列出來,再從中抽取簡單隨機樣本;而用大一點的樣本
數,可以減低簡單隨機樣本的變異性。
2.通常一個隨機樣本的結果,不會剛好估計出母體的真正值,所以使用誤差
界限來表達,我們有95%的信心,相信真正值會在誤差界限內。
3.樣本數量愈大,並不能代表它就是有效的樣本,研究者一定要從母群體中
蒐集真正具代表性的樣本。
很多統計都是由小樣本推論到大規模母群體,
所以提供統計數字時,應該解釋清楚選擇樣本的正確方法,好的樣本才能
夠代表整個母群體,才不會扭曲最後的統計結果。
4.正如教授上課所言:
「凡是測量,必有誤差」,也所以「母數」≠「統計量」。
但是爲了力求統計結果的推論合理,務必讓「母數」≠「統計量」之間的
誤差和變異量盡量縮小,否則誤差大的也是統計量,誤差小的也是統計量,
但推論出來的結果卻可能相差十分大,就研究結果而言,有可能提供錯誤
的資訊致使決策錯誤。
當然現實中,牽涉到成本及時間的關係,但在合理
範圍內,總是必須盡量讓兩者接近。
第四章真實世界中的抽樣調查
一、簡介
隨機抽樣在選擇樣本時可以消除偏差,但是也沒辦法對母群體提供完全正確的資訊,抽樣誤差(samplingerror)使得樣本結果與普查結果不同。
抽樣誤差包括常見的隨機抽樣誤差與涵蓋不全兩種。
非抽樣誤差(nonsamplingerror)是常見的包括處裡誤差與回應誤差,這些誤差和抽取樣本沒有關係,但是設計抽樣調查的人會應用統計技巧來設法減低非抽樣誤差。
嚴謹的抽樣調查會告訴我們真相:
好的抽樣設計是利用機遇從母群體抽取個體,而問題的措辭對抽樣調查的結果也是有影響的。
二、我學得
1.抽樣之前必須先要有一個涵蓋全部母群體的抽樣底冊(samplingframe)。
但
是整個母群體的清單通常很難取得,所以大部分的樣本多少會有涵蓋不全
的問題。
2.一項抽樣調查中所宣布的誤差界限,只包括隨機抽樣誤差。
涵蓋不全、無
回應以及其他困難也會造成大偏差,但是誤差界限並沒有包括這些項目。
3.分層隨機樣本(stratifiedrandomsample)有以下步驟:
(1)將抽樣底冊中的個體纖分成若干群,稱為層,分層的標準是,對於這些
層有特別的興趣,或同一層中有接近的性質。
(2)每層各取一個SRS,全部合起來就是我們要的樣本。
4.機率樣本(probabilitysample)是利用機遇抽取的樣本。
要先知道哪些樣本是
可能的,以及每個可能的樣本被抽中的機率是多少。
三、我覺得
1.調查者使用好的技巧,而且認真準備抽樣底冊,注意問題的措辭,並減少
無回應,意見調查及其他抽樣調查,是可以提供精確而有用的資訊。
2.很多調查都是設計好要影響公眾意見的調查,並不能提供精確而且有用的
資訊,所以我們在留意一些調查結果時,應該注意更多問題,例如:
是誰
做的調查?
母群體是誰?
樣本如何選取的?
樣本有多少?
調查是什麼時候
做的?
等等。
第五章實驗面面觀
一、簡介
觀測研究是被動的數據蒐集方式,實驗是能主動產生數據的方式。
在實驗當中,我們可以自行設定「解釋變數(explanatoryvariable)」,以研究受對象另一個因此改變的「反應變數(responsevariable)」。
觀測研究和單軌實驗都常會因為和潛在變數(lurkingvariable)的交絡(con-
founded),而產生沒有用的數據;所以設計實驗,是要確定可以顯示解釋變數對於反應變數的影響。
利用隨機化比較實驗,同時比較兩個或多個處理,使得機遇產生的影響變小。
因果關係問題,我們能得到的最好數據,是從觀測研究得來的。
但是如果能比較相似的組,並且盡量多度量潛在變數來做統計調整的話,結果會是比較可信的。
二、我學得
1.反應變數是指用來度量研究結果的變數,解釋變數是指我們認為可以解釋
或造成反應變數變化的變數。
潛在變數是對研究中其他變數間的關係有重
要影響,卻並未被列為解釋變數的變數。
2.當兩個變數對反應變數的影響混在一起而無法區分時,我們稱這兩個變數
是交絡的,交絡的變數可以是解釋變數,也可以是潛在變數。
3.隨機化比較實驗是統計學裡最重要的概念之一,其實驗邏輯為:
(1)用隨機化的方法將受試對象分組,分出的各組在實施處理前,各方面都
要類似。
(2)用「比較」的設計以確保:
除了實驗上的處理外,其他所有因素都會同
樣作用在所有組別上。
(3)所以反應變數的差異,必是處理的效果所導致。
4.統計實驗設計的基本原則:
(1)要控制潛在變數對反應變數的影響,最簡單的方法是同時比較至少兩個
處理。
(2)隨機化:
用非人為的隨機方法來指派受試對象到不同的處理組。
(3)每一組的受試對象要夠多,以減低結果中的機遇變異。
三、我覺得
1.隨機化比較實驗和隨機樣本一樣,都受到機遇的影響,所以用足夠多的受
試對象、同時比較數個處理,以及隨機化,才能使得差異不會只因機遇變
異就發生。
2.好的研究不管是不是實驗,都一定要做比較,雖然比較並不能消除交絡,
但是我們如果可以同時運用比較與適配,盡量度量並調整交絡變數,就可
以用統計做出較可信的結果。
3.在科學實驗中容易在研究室獲得相同的條件,但是社會科學實驗因為受試
者本身的差異,及潛在變項的存在,「反應變項」未必能完全反應「解釋變
項」的影響。
尤其當不同變項間的「交絡」作用產生時,就必須透過更嚴
謹的實驗,所以「隨機化比較實驗」是很重要的。
4.統計的資料通常是一堆龐大的資料,而資料經過蒐集、處理、分析、解釋,
獲得資料所代表的意義。
統計是用專業的術,蒐集、整理、分析資料,以
獲得最接近事實真相的資訊,來了解或解釋現象。
第八章度量(Measure)
一、簡介
度量人或物的某一性質,是用數字來代表那個性質,不論我們量的是什麼,只要我們測量的人事物在該項有差別,這個變數的值就會不一樣,所以量度的結果是一個數值變數(numericalvariable)。
統計的觀點來看,是不是有效量度,對於物理性質的量度是很容易判斷的;但是若要度量人的性格或其他模糊性質時,量度是否有預測有效性是最好的方法。
通常來說,事情發生的比率(rate)是比計數(count)更為有效的量度。
度量時的誤差包括每次度量時都發生的系統誤差,以及根本無法預測的隨機誤差,但如果隨機誤差很小,我們稱這個量度很可靠。
二、我學得
1.量度是將概念轉換成明確意義的變數的過程,但是在度量性質或概念時,一定要了解其變數的各項細節。
如果量度出的變數和某一性質有關,該項變數才能成為這個性質的有效量度。
2.並不是所有的性質都可以被量出來,所以要如何設計有效的量度方法,如何呈現有意義的變數,是否能正確反映統計的結果,是要經過多方思考、討論與設計的。
3.雖然量度會有偏差,但是度量同樣的東西結果如果會重複,那此量度就是一可靠的量度;而多設計幾個量度或是多度量幾次來取平均,可以得到變異更小更可靠的結果。
4.數字看起來似乎很可靠,但是數據畢竟是人類創造出來的,因此若我們必須度量人類性格的時候,應該怎麼量可是非常複雜的。
三、我覺得
1.好的統計來自產生可靠數據的好設計,考慮實驗設計的統計層面,做出最好的判斷,實在很不容易。
盡量消除樣本產生的偏差,做出最可靠的量度結果,才能做出最好的預測或結論,這樣的統計結果才能幫助我們了解議題或相關現象。
2.「度量」的變數如何選擇,如何界定,如何測量,皆有很強的邏輯性。
為何選此一變數,忽略另一變數?
皆必須有其原因,因此做研究者皆須進行文獻探討,一方面也是在幫自己的研究立論、假設及所欲度量的變數尋求支持。
若有現成的研究,當然說服力較強,但是總會有缺乏現成相關論述的時候,這時變數的選擇、界定,便需很強的邏輯判斷,而邏輯判斷需要哲學思辨的能力,所以統計學也需訓練邏輯思辨的能力。
3.有些時候,事情發生的百分比是比計數更為有效的量度,但是教授上課時也曾經提醒,並不是所有的情況都可以使用百分比,尤其是數量很少時,使用百分比會將數據誇大。
第九章數字合不合理?
一、簡介
商業數據、廣告主張、對公共議題的說明,我們每天都被許多不同的數字圍繞著,但是這些數據是怎麼產生的?
這些數據的量度是可靠的嗎?
爛數據或是錯誤使用的好數據,都讓呈現出來的結果不如數字的實際意義。
數字是否可信,數據過分精確或太有規律,考慮系統誤差加上隨機誤差,該數據很可能是編造出來的;錯誤的結論或令人無法理解的結論,常常是粗心大意所造成的結果。
二、我學得
1.量度的數字是有相關內容的,但是如果不知道相關內容,單獨的赤裸裸的數字是無法給我們太多訊息的。
2.養成仔細檢查數字的習慣,檢驗數字是否合理,判斷其是否是有效量度,才不會被數字欺騙。
三、我覺得
1.第二週上課時教授曾經提及,有一則新聞報導指出:
國民「平均收入」達到每人每個月約四萬八千多元。
這項數據實在令人匪夷所思,因為利用這樣的「平均」來報導這項議題,實在沒有什麼意義。
2.對統計研究來說,第一個問題及最重要的問題,就是「數據是從哪裡來的?
」
好的統計是來自產生有效數據的好設計。
所以實驗設計的層面、隨機樣本的偏差、有效數據的處理,都是非常重要的統計學概念。
3.我們需要統計來概述與澄清複雜社會的一些事實,但是使用統計的人也可能無意或故意利用數據來扭曲事實、操縱人心,所以我們每次看到統計數據的時候,一定要審慎的判斷是非。
4.處理資料,需思考到原始數據的來源;不論是處理或接受資料,都必須對數據抱
著合理的懷疑:
原始資料的來源、取樣的正確性和代表性、統計計算是否為最佳
方式、統計推論是否合理…等等。
所以運用資料的人,必須時時對資料抱著合理
的懷疑,才能對所做的決策更加謹慎。
第十章好的圖及壞的圖
一、簡介
統計是處理數據的,而我們通常用表和圖來呈現數據,經由隨機抽樣、隨機化比較實驗和有效量度,可以產生好的數據,我們得再從數據中,看看數據說了什麼。
類別變數(categoricalvariable)把個體歸類到數個組或數個類別其中之一;數量變數(quantitativevariable)的值是數值的,因此拿來做算數例如平均時,是有意義的。
要表示類別變數的分布,可以用圓瓣圖(piechart)或長條圖(bargraph)。
圓瓣圖可以顯示一個整體怎樣分為幾個部份,所有的部份合起來就是全體。
長條圖卻可以用來比較並不屬於同一個整體的數量。
許多數量變數是隔一段時間量一次的,這些變數是如何隨時間而變化,要表示出這些變化,應該使用線圖(linegraph),把變數的值為橫軸對應著時間為縱軸畫圖。
二、我學得
1.圓瓣圖:
圓瓣圖永遠是顯示整體的各個部分。
2.長條圖:
長條圖是可以用來比較任何同樣單位度量出來的數,有時候不能用圓瓣圖來取代長條圖,所以長條圖的用途還是比較廣。
有時把長條圖的順序調整之後,可以讓圖的資訊更明確。
3.象形圖:
長條圖是經由比較代表各數量的長條高,在統計學上要避免使用象形圖,因為這種圖把長條圖中的長寬都改變了。
4.線圖:
一定要把時間刻度畫在圖的橫軸上,把正在度量的變數放在縱軸上,
用直線連接根據數據畫出的點,以便呈現出隨時間變化的狀況。
但是一定要注意線圖的刻度,藉由線圖不同刻度的選擇,同樣正確的圖形可以給人不同的印象。
5.怎樣把圖畫好:
(1)一定要在標示和說明裡表示清楚,圖裡面畫的變數是什麼,單位是什麼,
以及資料來源。
(2)要讓數據很醒目。
抓住看圖者注意力的是數據本身。
(3)要注意實際上眼睛會捕捉到什麼。
避免用象形圖,而且要小心選擇刻度。
三、我覺得
1.數據表把資料做了摘要,但是有時候比率(或是百分比)會比計數清楚,我們可以用計數來說明變數可能有什麼值,再用比率來顯示這個值所傳達的資訊。
2.「長條圖」、「直方圖」、「線圖」,或是「圓瓣圖」,都有其適合的使用時機;
但該使用何種圖,須看其內部資料特性,不同特性的資料,適合不同的呈現方式;而不同的目的,也須利用不同的圖。
3.因為圖給人的印象較深刻,所以不小心的人很容易被誤導,例如線圖中的刻度,有沒有刻意被拉大或壓縮來製造特定效果;也不要在圖中加入不必要的東西,以免數據看不清楚。
例如教授上課曾經講過,折線圖的y軸與x軸的比例大約為3:
4,較符合美觀與結果一致。
第十一章用圖形呈現分布
一、簡介
要呈現數量變數的分布可以用直方圖(histogram)或莖葉圖(stemplot),在觀測值的個數不多時,通常使用莖葉圖;而資料數量較多時,才會使用到直方圖。
要描述直方圖或莖葉圖的整體型態,可以用形狀(shape)、中心(center)或離度(spread)。
分布的整體形狀,提供了關於變數的重要資訊,有些分布不太規則;有些分布有簡單的形狀,若直方圖的左半和右半大致上可看成互為鏡中影像,則稱該分布為對稱(symmetric)。
二、我學得
1.要描述一個分布的時候,注意力要放對重點,要尋找主要的尖峰,而不是直方圖中的小起伏。
2.如何畫直方圖:
(1)將資料的數值範圍分成相同寬度的組(class)。
(2)數一下每組中每個個體的個數。
(3)把要展示分布的變數在橫軸上標示出刻度,然後畫直方圖。
3.如何畫莖葉圖:
(1)把每個觀測值分成莖與葉兩個部份,莖包括除了最後一位數字之外的所有數字,葉就是最後那一位數字。
(2)把莖由小到大,由上而下寫成一直行,並在這一直行右邊劃一條直線。
(3)把每個葉寫在他所屬的莖的右邊,由小到大排成一列。
4.解釋直方圖和解釋莖葉圖,一樣要尋找整體型態,以及有無離群值(outlier)。
三、我覺得
1.畫統計圖本身並不是最終目的,畫統計圖的目的是要幫助我們了解數據資
料。
例如直方圖每個組的寬度一樣,長條的高度就代表該組的計數。
2.教授之前上課講解與看完本章後,更加了解到直方圖與長條圖並不相等,前一章的長條圖數據資料是不連續的,是用來比較任何同樣單位度量出來的數;而這一章的直方圖是將同一資料依數字加以分組,觀察數據的分布情況。
3.莖葉圖可以呈現最實際的觀測值,但是因為莖葉圖的組距是固定的,所以有可能畫出來的圖反而不能有效描述分布。
4.當要解釋資料時,研究者常會將資料和內心的假設作印證。
當兩者有出入時,研究者便必須去求證原因。
而當研究者對研究變項的背景資料不夠瞭解時,有時是無法做出合理推論的。
例如,教授上課曾經舉例,美國某州相對於其他各州,痲瘋病患者比例非常高,若研究者對該州背景不了解,可能解釋該州痲瘋病傳染嚴重;但相對的,若對該州了解,知道是因為該州有痲瘋病的專門療養院,解釋的方向便會不同。
所以為了更正確的解釋資料,研究者須對資料的背景作更深入的了解才行。
第十二章用數字描述分布
一、簡介
要描述一組數據,一定要先畫圖,然後再用一些數字來描述該分布。
描述圖形分布的中心及離度,描述中心及離度有兩種常用的方式,包括「五數綜合」及「平均數與標準差」。
五數綜合(five-numbersummary)由小到大,包括:
最小數、第一四分位數、中位數、第三四分位數及最大數。
五數綜合並不是描述分布最常用的數值,最常用的是以平均數(mean)來度量中心,加以用標準差(standarddeviation)來度量離度。
二、我學得
1中位數M(medianM):
是一個分布的中間點,亦即一半的觀測值比它小,另一半的觀測值比它大。
2.四分位數Q(quartile):
(1)將觀測值由小到大排列,在排好順序的序列中找出中位數。
(2)第一四分位數Q1,是中位數左邊比中位數小的所有數字的中位數。
(3)第三四分位數Q3,是中位數右邊比中位數大的所有數字的中位數。
3.平均數(meanX)即為該組觀測值的平均。
4.標準差(standarddeviationS)度量的是觀測值與平均數間的平均距離,計算的
方法是先算出各距離平方後的平均值,再取平方根。
步驟如下:
(1)先找出每個觀測值距平均數的距離,把這個距離平方。
(2)把所有距離的平方加起來,並除以n-1。
這個距離平方的平均,稱為變異數(variance)。
(3)再把這個變異數取平方根,即為標準差S。
5.標準差S度量的是以平均數X為中心的離度,只有在沒有離度時,S才會等於零。
平均數會因少數離群值而受很大的影響,中位數則不會。
三、我覺得
1.用中位數(中間點)或平均數(算術平均)來描述一組數據的中心都很合理,但是兩者的概念不同,平均數會因少數離群值而受很大的影響,中位數則不會,所以平均數和標準差只能適合用在大致對稱的分布。
2.在此終於了解之前章節,為什麼拿到數據資料應該都要先畫圖,因為這樣我們才能知道這組數據是不是大致對稱的分布,才能決定是否選擇平均數與標準差來解釋,還是只能適合用五數綜合來描述。
3.平均數是最常爲人使用的統計方法之一,但是少部分的離群值的確常會造成影響,
造成閱讀人的誤解,尤其是在無法直接接觸到原始資料時;五數綜合是較好的表現方式,可避免極端的離群值影響,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一章 数据
![提示](https://static.bdocx.com/images/bang_tan.gif)