統(tǒng)計(jì)學(xué)專業(yè)畢業(yè)論文
統(tǒng)計(jì)學(xué)是一個(gè)前景非常明朗的產(chǎn)業(yè),各行各業(yè)都在應(yīng)用統(tǒng)計(jì)學(xué)的技術(shù)。下面是學(xué)習(xí)啦小編為大家整理的統(tǒng)計(jì)學(xué)專業(yè)畢業(yè)論文,供大家參考。
統(tǒng)計(jì)學(xué)專業(yè)畢業(yè)論文篇一
《 醫(yī)學(xué)科技論文統(tǒng)計(jì)學(xué)誤用分析 》
1統(tǒng)計(jì)學(xué)應(yīng)用中存在的常見問題
1.1單因素方差分析(ANOVA)兩兩比較誤用獨(dú)立樣本t檢驗(yàn)單因素方差分析設(shè)計(jì)3組以上的均數(shù)比較,如果總體比較有差異,需進(jìn)行兩兩比較,一般用SNK法或LSD法。但部分研究者卻將資料進(jìn)行拆分,應(yīng)用獨(dú)立樣本t檢驗(yàn)進(jìn)行兩兩比較,導(dǎo)致第Ⅰ類統(tǒng)計(jì)學(xué)錯(cuò)誤發(fā)生率(假陽性率)增加,從而掉進(jìn)了一個(gè)常見的“統(tǒng)計(jì)陷阱”,使所得結(jié)論可信度大大降低甚至得出錯(cuò)誤結(jié)論。SNK法與LSD法雖然并非等價(jià),實(shí)質(zhì)是一致的。SNK法一般用于經(jīng)方差分析結(jié)果具有統(tǒng)計(jì)學(xué)意義時(shí)才決定進(jìn)行的兩兩事后比較,而LSD法可用于方差分析不足以具有統(tǒng)計(jì)學(xué)意義時(shí)也能進(jìn)行兩兩比較[1]。比較兩種方法在SPSS的輸出結(jié)果形式,SNK是“分堆”比較,一目了然,對于組別數(shù)較多的研究更為好用,但沒有具體P值,而LSD是在進(jìn)行“兩兩”比較時(shí),能給出具體的P值。
1.2兩兩比較時(shí)檢驗(yàn)水準(zhǔn)的重新調(diào)定χ2檢驗(yàn)或秩和檢驗(yàn)3組以上整體比較有差異時(shí),需應(yīng)用分割法進(jìn)行兩兩比較,這時(shí)檢驗(yàn)水準(zhǔn)應(yīng)由原0.05調(diào)定為0.0167,否則會增加第Ⅰ類統(tǒng)計(jì)學(xué)錯(cuò)誤的發(fā)生率。特別當(dāng)P值處于0.0167~0.05時(shí),按照P<0.0167的標(biāo)準(zhǔn),差異無統(tǒng)計(jì)學(xué)意義,而按照P<0.05的標(biāo)準(zhǔn),卻有意義,與事實(shí)相悖,出現(xiàn)假陽性,很容易得出錯(cuò)誤結(jié)論。這種分割法有時(shí)很保守,當(dāng)行列表資料分組多且為有序時(shí)可用Mantel-Haenszel卡方檢驗(yàn),也稱線性趨勢檢驗(yàn)(testforlineartrend)或定序檢驗(yàn)(Linear-by-Lineartest)[2]。統(tǒng)計(jì)路徑:用SPSS進(jìn)行計(jì)數(shù)資料的趨勢檢驗(yàn),在輸出結(jié)果中讀取線性關(guān)聯(lián)檢驗(yàn)統(tǒng)計(jì)量(Linear-by-LinearAssociation,LLA),如P<0.05可得出隨著病種級別的升高,檢測指標(biāo)逐漸升高的趨勢。
1.3臨床診斷試驗(yàn)中的統(tǒng)計(jì)學(xué)方法應(yīng)用在臨床診斷試驗(yàn)研究中,經(jīng)常選取單項(xiàng)計(jì)量指標(biāo)或者聯(lián)合計(jì)量指標(biāo)以診斷某種疾病,若僅用初級統(tǒng)計(jì)學(xué)方法如t檢驗(yàn)、單因素方差分析等往往不能有效挖掘信息,此時(shí)應(yīng)采用受試者工作特征曲線(ROC)對檢測結(jié)果進(jìn)行分析評價(jià)。ROC曲線分析基本原理是通過診斷界點(diǎn)的移動[3],獲得多對靈敏度和誤診率(1-特異度),以靈敏度為縱軸、誤診率為橫軸,連接各點(diǎn)繪制曲線,然后計(jì)算曲線下的面積,面積越大診斷價(jià)值越高。ROC曲線很直觀,能根據(jù)敏感性與特異性之和最大化原則自動產(chǎn)生最有效的診斷臨界點(diǎn)。具體路徑可以參考相關(guān)統(tǒng)計(jì)專著[3]。統(tǒng)計(jì)學(xué)處理一般描述為:采用SPSS(版次)統(tǒng)計(jì)軟件分析數(shù)據(jù),對單項(xiàng)及聯(lián)合檢測結(jié)果作圖繪成ROC曲線,計(jì)算曲線下面積(AUC)和標(biāo)準(zhǔn)誤,其中聯(lián)合檢測結(jié)果變量即預(yù)測概率由Logistic回歸產(chǎn)生(也可以用判別分析得出)。計(jì)量資料應(yīng)用-x±s表示,運(yùn)用獨(dú)立樣本t檢驗(yàn)及單因素方差分析,兩兩比較采用SNK及LSD法,計(jì)數(shù)資料采用χ2檢驗(yàn)。檢驗(yàn)水準(zhǔn)為0.05。具體內(nèi)容可據(jù)情而定。
1.4重復(fù)測量資料的方差分析誤用拆分文件的t檢驗(yàn)或方差分析如研究共設(shè)3組,每位患者在3個(gè)時(shí)間點(diǎn)均查某項(xiàng)血指標(biāo),部分作者在處理此類數(shù)據(jù)時(shí),常誤將縱向(同一時(shí)間點(diǎn)3組的比較)與橫向(同組3個(gè)時(shí)間點(diǎn)的比較)數(shù)據(jù)均應(yīng)用拆分文件的t檢驗(yàn)或單因素方差分析來處理,結(jié)果導(dǎo)致統(tǒng)計(jì)學(xué)第Ⅰ類錯(cuò)誤發(fā)生。此組數(shù)據(jù)實(shí)質(zhì)是重復(fù)測量資料,應(yīng)采用重復(fù)測量資料的方差分析。SPSS中的統(tǒng)計(jì)路徑:數(shù)據(jù)-分析-一般線性模型-重復(fù)度量。研究者可以參考相關(guān)書籍進(jìn)行處理[3]。
1.52×2析因設(shè)計(jì)及析因方差分析實(shí)驗(yàn)是2×2析因設(shè)計(jì)時(shí),分組有兩個(gè)因素,A與B,故分組為A、B、O、A+B,這個(gè)設(shè)計(jì)在析因設(shè)計(jì)研究中很常用,但常會出現(xiàn)分組設(shè)計(jì)正確,卻沒有用析因設(shè)計(jì)方差分析。析因設(shè)計(jì)與單因素方差分析不同[4],它不但能分析治療效果中處理因素的單獨(dú)效應(yīng)和主效應(yīng),還能分析因素間的交互效應(yīng),并能提高檢驗(yàn)效能。非統(tǒng)計(jì)專業(yè)的研究者進(jìn)行析因分析可能稍有難度,可參考相關(guān)統(tǒng)計(jì)學(xué)書籍提供的統(tǒng)計(jì)步驟進(jìn)行此類分析[3]。
1.6Meta分析Meta分析是循證醫(yī)學(xué)系統(tǒng)評價(jià)常用的方法[5],應(yīng)用時(shí)需注意統(tǒng)計(jì)學(xué)處理中計(jì)數(shù)資料采用比值比(OR)作為效應(yīng)變量。具體路徑:先進(jìn)行異質(zhì)性檢驗(yàn),當(dāng)P>0.05時(shí),認(rèn)為同質(zhì),選擇固定模型;P≤0.05時(shí),不同質(zhì),此時(shí)可采用敏感性分析或分層分析等異質(zhì)性處理,使之達(dá)到同質(zhì)后再選擇固定模型;若采用異質(zhì)性處理仍未達(dá)到同質(zhì),則采用隨機(jī)模型,以上統(tǒng)計(jì)路徑均需交代清楚。Meta分析的結(jié)果是以“森林樹”體現(xiàn)的,審校中我們經(jīng)常遇到作者繪制的“森林樹”左上角“文獻(xiàn)、對比、結(jié)果名稱”等內(nèi)容顯示為“?”,這是由于部分版本的RevMan軟件不能輸入中文,此時(shí)可以考慮省去,或用Photo-shop軟件添加相應(yīng)中文。Meta分析作為一種高級統(tǒng)計(jì)方法,專業(yè)性要求較高,作者可參考循證醫(yī)學(xué)類權(quán)威雜志上的文章格式,如《中國循證醫(yī)學(xué)雜志》中“論著•二次研究”欄目的循證文章。
2科技論文中統(tǒng)計(jì)學(xué)處理的相關(guān)表述
2.1資料與方法中具體統(tǒng)計(jì)路徑的描述“統(tǒng)計(jì)學(xué)處理”的內(nèi)容常位于論文資料與方法的最后一段,一般來說包括統(tǒng)計(jì)軟件名稱及版次、統(tǒng)計(jì)描述、統(tǒng)計(jì)方法、檢驗(yàn)標(biāo)準(zhǔn)等內(nèi)容,亦可細(xì)致交待每個(gè)表格的具體統(tǒng)計(jì)方法。經(jīng)典例子如下,“統(tǒng)計(jì)學(xué)處理:采用SPSS(版次)統(tǒng)計(jì)軟件分析數(shù)據(jù)。計(jì)量資料用均數(shù)±標(biāo)準(zhǔn)差表示,采用單因素方差分析,兩兩比較采用SNK法及LSD法。檢驗(yàn)水準(zhǔn)為0.05”。上述內(nèi)容包括了大致的統(tǒng)計(jì)方法,即具體的統(tǒng)計(jì)路徑。此部分內(nèi)容,沒有絕對統(tǒng)一的規(guī)定[6]。常見的問題有:統(tǒng)計(jì)學(xué)方法描述不全、內(nèi)容過于簡單、存在粘貼抄寫痕跡等。如部分論文的統(tǒng)計(jì)學(xué)處理中提及“以α=0.05為檢驗(yàn)水準(zhǔn),P<0.05為差異有統(tǒng)計(jì)學(xué)意義”這句話,這在統(tǒng)計(jì)學(xué)上實(shí)質(zhì)是一個(gè)重復(fù)句,保留其一即可。
2.2結(jié)果中具體P值的標(biāo)注現(xiàn)在的統(tǒng)計(jì)學(xué)處理手工計(jì)算的較少,一般均應(yīng)用統(tǒng)計(jì)軟件,最常用的軟件如SPSS、SAS均能給出具體P值。但部分論文的結(jié)果表述中卻未標(biāo)明具體P值,作為科技論文是不夠嚴(yán)謹(jǐn)?shù)?建議作者在表述研究結(jié)果時(shí)注明具體P值,增加論文可信度的同時(shí),可用于再次分析。
2.3表格制作統(tǒng)計(jì)表設(shè)計(jì)需規(guī)范,應(yīng)體現(xiàn)統(tǒng)計(jì)設(shè)計(jì)內(nèi)容。部分表格存在內(nèi)容割裂、組別名稱違反表格簡潔化原則、表下注釋繁瑣、橫標(biāo)目與縱標(biāo)目顛倒等情況。建議作者寫作論文時(shí)參閱相關(guān)統(tǒng)計(jì)學(xué)教程及雜志稿約。醫(yī)學(xué)統(tǒng)計(jì)學(xué)教學(xué)在中國的醫(yī)學(xué)教育特別是高層次教育中舉足輕重。一項(xiàng)課題從一個(gè)好的創(chuàng)意開始到實(shí)施、結(jié)題,統(tǒng)計(jì)學(xué)方法始終貫徹其中。不管是臨床試驗(yàn)研究、實(shí)驗(yàn)性研究、觀察性研究,還是臨床測量誤差與診斷試驗(yàn),如果沒有規(guī)范性的統(tǒng)計(jì)設(shè)計(jì)、精確的統(tǒng)計(jì)分析、科學(xué)的統(tǒng)計(jì)學(xué)解釋與表述,很難獲得學(xué)術(shù)上的認(rèn)可[1]。目前在統(tǒng)計(jì)學(xué)的具體應(yīng)用中,研究課題開始設(shè)計(jì)時(shí)就有統(tǒng)計(jì)學(xué)專家參與已成為較流行的趨勢。許多專業(yè)統(tǒng)計(jì)學(xué)專家或研究者在不停的進(jìn)行“統(tǒng)計(jì)基礎(chǔ)”的研究,以創(chuàng)造更多的數(shù)理統(tǒng)計(jì)方法。對于非統(tǒng)計(jì)專業(yè)的研究者來說,統(tǒng)計(jì)學(xué)的學(xué)習(xí)主要側(cè)重于應(yīng)用。在應(yīng)用統(tǒng)計(jì)學(xué)教學(xué)中,一般分為4個(gè)檔次或階段來進(jìn)行,首先通過學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)課本獲取統(tǒng)計(jì)學(xué)思想、原理和方法,其次學(xué)習(xí)統(tǒng)計(jì)軟件相關(guān)書籍掌握數(shù)據(jù)到統(tǒng)計(jì)結(jié)果的轉(zhuǎn)化,再學(xué)習(xí)統(tǒng)計(jì)表達(dá)與描述書籍達(dá)到書寫統(tǒng)計(jì)學(xué)報(bào)告能力,最后可以學(xué)習(xí)如何出具統(tǒng)計(jì)審閱報(bào)告。醫(yī)學(xué)科技工作者亦可按照這個(gè)順序?qū)W習(xí)以提高統(tǒng)計(jì)能力。
統(tǒng)計(jì)學(xué)專業(yè)畢業(yè)論文篇二
《 醫(yī)學(xué)期刊統(tǒng)計(jì)學(xué)錯(cuò)誤研究 》
1統(tǒng)計(jì)設(shè)計(jì)存在的常見問題
統(tǒng)計(jì)設(shè)計(jì)是整個(gè)研究中最重要的一環(huán),是研究工作應(yīng)遵循的依據(jù)。常見的統(tǒng)計(jì)設(shè)計(jì)問題有:忽視組間均衡性,樣本缺乏代表性,樣本例數(shù)不足,未設(shè)置對照組,未隨機(jī)分組,未提出統(tǒng)計(jì)分析方法等。針對以上問題,在科研設(shè)計(jì)中一定要遵循實(shí)驗(yàn)設(shè)計(jì)的四大原則即“隨機(jī)、對照、均衡、重復(fù)”的原則[6]。
1.1不遵循或不重視隨機(jī)化原則
隨機(jī)化是科研設(shè)計(jì)的重要原則,直接影響研究結(jié)果的可信度。隨機(jī)化既要隨機(jī)抽樣,還要隨機(jī)分組,并有足夠的樣本量作前提。然而,在醫(yī)學(xué)論文中許多作者對此不夠重視,主要表現(xiàn)在論文中統(tǒng)計(jì)處理隨機(jī)化不突出,隨機(jī)化缺失情況比較常見,有的論文甚至將隨機(jī)誤解為隨意、隨便,不采用隨機(jī)化處理方法,導(dǎo)致結(jié)果缺乏可靠性。還有些文章中沒有提出“隨機(jī)”抽樣的設(shè)計(jì)與方法,沒有排除標(biāo)準(zhǔn),給人隨意選擇病例之感,且病例數(shù)少,因此沒有代表性,所得出的結(jié)論不可靠。部分文章雖然注明了“隨機(jī)”,但未提及采取什么方法進(jìn)行隨機(jī)化研究或兩組間的例數(shù)相差甚遠(yuǎn),不符合隨機(jī)化的一般規(guī)律,沒有臨床參考價(jià)值[7]。
1.2缺少對照研究或?qū)φ战M設(shè)計(jì)不合理
正確設(shè)立對照是臨床或?qū)嶒?yàn)研究的一個(gè)核心問題,設(shè)立對照的意義在于說明臨床試驗(yàn)或?qū)嶒?yàn)研究中干預(yù)措施的效應(yīng),減少或防止偏倚和機(jī)遇產(chǎn)生的誤差對試驗(yàn)結(jié)果的影響。目前,國內(nèi)許多期刊發(fā)表的論文對照組設(shè)計(jì)不合理現(xiàn)象比較普遍,尤其有些作者對某種新藥或新技術(shù)在臨床的應(yīng)用觀察研究中,不設(shè)對照組,缺乏對照觀察,得出的結(jié)論缺乏科學(xué)性,令人懷疑。有的文章雖然設(shè)立了對照組,但在分析結(jié)果時(shí),卻沒有將試驗(yàn)組與對照組的結(jié)果進(jìn)行比較,而僅將各組間的自身前后進(jìn)行比較,從而使該研究失去對照意義。對照組選擇不當(dāng),還表現(xiàn)在兩組間重要的臨床特征和基線情況相差太大,無可比性,如性別、年齡、病情、經(jīng)濟(jì)情況和文化程度等不一致,如有些論文將健康人或志愿者作為對照組,使結(jié)果受到非處理因素的影響,產(chǎn)生偏倚或系統(tǒng)誤差,使結(jié)論不可信[7]。
1.3均衡性原則掌握不夠
均衡性原則要求實(shí)驗(yàn)中的各組之間除處理因素不同外,其他可控制的非處理因素要盡可能保持一致。特別對疾病預(yù)后有重要影響的臨床特性一定要在組間分布均衡。各組間越均衡,可比性越強(qiáng)。有些作者在對病例進(jìn)行分組時(shí),忽視了均衡性原則,兩組之間沒有可比性,結(jié)論自然是錯(cuò)誤的。具體表現(xiàn)在:有的文章對治療組與對照組的相應(yīng)統(tǒng)一指標(biāo)沒有設(shè)在均衡的水平上。對治療組情況交代的比較詳細(xì),而對對照組的年齡、性別、病情等不予交代,或所選對照組的年齡與治療組不在一個(gè)年齡段,影響了作者對指標(biāo)的觀察[7]。
1.4重復(fù)的原則掌握不好
所謂重復(fù),一是指重復(fù)試驗(yàn)或平行試驗(yàn),二是指各樣本組的例數(shù)要有一定的數(shù)量,即樣本的例數(shù)要足夠大。雖然隨機(jī)化是增強(qiáng)非處理因素均衡性的重要方法,但當(dāng)各組內(nèi)例數(shù)過少時(shí),盡管采用了隨機(jī)化分組的方法,也難以保證非處理因素的均衡一致。在隨機(jī)化分組的基礎(chǔ)上,只有樣本例數(shù)足夠大,才能使非處理因素均衡一致,同時(shí)也才能使抽樣誤差減小,增強(qiáng)樣本對總體的代表性。一般來說,在隨機(jī)分組的前提下,樣本例數(shù)越大,各組之間非處理因素的均衡性越好;但當(dāng)樣本量太大時(shí),往往又會給整個(gè)實(shí)驗(yàn)和質(zhì)量控制工作帶來更多的困難,同時(shí)也會造成浪費(fèi)。為此,在實(shí)驗(yàn)設(shè)計(jì)時(shí),還應(yīng)保證在實(shí)驗(yàn)結(jié)果具有一定可靠性的前提下,確定最少的樣本例數(shù)。一般說來,計(jì)數(shù)指標(biāo)每組樣本不得少于20~30例,計(jì)量指標(biāo)每組樣本不得少于5~10例。在多因素分析時(shí),一般認(rèn)為樣本例數(shù)至少為觀察指標(biāo)的5~10倍[8]。
1.5樣本的含量
樣本的含量的大小直接影響到結(jié)論的可靠性。樣本量過少,則抽樣誤差大,結(jié)果可靠性差,且經(jīng)不起重復(fù)驗(yàn)證;反之,盲目加大樣本量也會造成人、財(cái)、物的浪費(fèi),同時(shí)也造成非抽樣誤差增大。故應(yīng)在保證研究結(jié)果精確可靠的前提下,確定最小的樣本量。如某篇論文報(bào)道某藥治療的臨床療效,實(shí)際總例數(shù)為10例,其中6例有效,于是作者得出有效率為60%。顯然,有限的病例數(shù)不能充分說明該藥是否有效,作者貿(mào)然得出結(jié)論,容易給他人造成假象甚至誤導(dǎo)[9]。
2統(tǒng)計(jì)方法選擇與使用不當(dāng)
在選擇統(tǒng)計(jì)方法之前,首先應(yīng)確定研究資料是計(jì)數(shù)資料還是計(jì)量資料。只劃分其類別而得到的資料為計(jì)數(shù)資料,也叫定性資料,如根據(jù)治療結(jié)果計(jì)算出的治愈率、陰性率、陽性率等。測定某個(gè)具體數(shù)值而得到的資料為計(jì)量資料,如血壓值、血細(xì)胞計(jì)數(shù)、血氧分壓測定等許多物理診斷和化驗(yàn)檢查的結(jié)果。目前,醫(yī)學(xué)論文中計(jì)數(shù)資料最常用的統(tǒng)計(jì)方法為χ2檢驗(yàn),計(jì)量資料最常用的統(tǒng)計(jì)方法為t檢驗(yàn)。值得注意的是,各種假設(shè)檢驗(yàn)方法均有其適用條件,應(yīng)根據(jù)資料特點(diǎn)來選用最適當(dāng)?shù)姆椒?。均?shù)與標(biāo)準(zhǔn)差分別是描述正態(tài)分布資料集中和離散趨勢的指標(biāo)。能否選用“均數(shù)±標(biāo)準(zhǔn)差”來描述某一資料的分布特征,關(guān)鍵看該資料是否符合正態(tài)分布。當(dāng)資料不符合正態(tài)分布或方差不齊時(shí),應(yīng)將資料轉(zhuǎn)換使之符合正態(tài)分布,方差齊性后再用t檢驗(yàn)或方差分析,否則用秩和檢驗(yàn)。有些作者在使用t檢驗(yàn)時(shí),未考慮到上述適用條件而盲目使用,造成統(tǒng)計(jì)學(xué)處理不當(dāng)或統(tǒng)計(jì)學(xué)計(jì)算錯(cuò)誤[10]。
2.1統(tǒng)計(jì)指標(biāo)應(yīng)用不當(dāng)
2.1.1描述計(jì)量資料的統(tǒng)計(jì)指標(biāo)描
述計(jì)量資料的統(tǒng)計(jì)指標(biāo)主要有平均數(shù)指標(biāo)(算術(shù)均數(shù)、中位數(shù)M等)和變異指標(biāo)(標(biāo)準(zhǔn)差s和四分位數(shù)間距Q等),在應(yīng)用時(shí)一定要注意它們各自的適用范圍。對于非對稱分布資料,算術(shù)均數(shù)不能反映數(shù)據(jù)的平均水平,應(yīng)采用中位數(shù)描述。一般地,正態(tài)資料或?qū)ΨQ資料用描述,偏態(tài)資料用M和Q來描述。在不能確定數(shù)據(jù)的分布類型時(shí),應(yīng)選用M和Q進(jìn)行統(tǒng)計(jì)描述。四分位數(shù)間距Q是75%分位數(shù)P75和25%分位數(shù)P25之差,即Q=P75-P25,所謂百分位數(shù)Px是將全部觀察值分為兩部分,理論上x%的觀察值比它小,(100-x)%的觀察值比它大,中位數(shù)M是50%分位數(shù)P50。、s、M、Px與Q可通過統(tǒng)計(jì)軟件直接輸出[9]。
2.1.2描述計(jì)數(shù)資料的統(tǒng)計(jì)指標(biāo)描
述計(jì)數(shù)資料的統(tǒng)計(jì)指標(biāo)有絕對數(shù)和相對數(shù)。絕對數(shù)是原始資料經(jīng)匯總得到的小計(jì)或總計(jì)數(shù)。相對數(shù)是兩個(gè)有關(guān)的絕對數(shù)之比,主要包括率和構(gòu)成比(百分比)。醫(yī)學(xué)論文中相對數(shù)應(yīng)用的主要問題之一是分母較小。分母較小時(shí),相對數(shù)的可靠性不能保證,在這種情況下,宜直接用絕對數(shù)進(jìn)行描述而不宜計(jì)算相對數(shù)。醫(yī)學(xué)論文中相對數(shù)應(yīng)用的主要問題之二是將構(gòu)成比誤用來說明事物發(fā)生的強(qiáng)度。構(gòu)成比只能反映事物的內(nèi)部構(gòu)成,不能說明事物的發(fā)生強(qiáng)度。醫(yī)學(xué)的研究對象主要是人以及與人體有關(guān)的各種因素。由于生物現(xiàn)象的變異較大,各種影響因素又錯(cuò)綜復(fù)雜,研究常是抽樣觀察,使事物本質(zhì)差異與抽樣誤差混雜,故需用統(tǒng)計(jì)方法透過偶然現(xiàn)象來探測其規(guī)律性。如果不能正確運(yùn)用統(tǒng)計(jì)學(xué)方法,造成統(tǒng)計(jì)學(xué)上的偏差或失誤,就很容易把本來成功的結(jié)果當(dāng)成失敗而放棄,或把失敗的教訓(xùn)誤認(rèn)為成功的結(jié)論而加以宣傳。在進(jìn)行科研設(shè)計(jì)時(shí)要嚴(yán)格遵循科學(xué)的統(tǒng)計(jì)學(xué)分析方法,不能留下隱患,否則,再高明的統(tǒng)計(jì)學(xué)專家和統(tǒng)計(jì)學(xué)軟件也無法彌補(bǔ)科研設(shè)計(jì)缺陷造成的損失??傊?統(tǒng)計(jì)學(xué)分析在醫(yī)學(xué)研究和論文寫作中意義重大。作者在撰寫論文時(shí),應(yīng)注意識別、總結(jié)有代表性的、有借鑒意義的統(tǒng)計(jì)學(xué)領(lǐng)域的缺陷、失誤或錯(cuò)誤的多發(fā)點(diǎn),特別留心易出現(xiàn)統(tǒng)計(jì)錯(cuò)誤的險(xiǎn)區(qū),從而使論文中的統(tǒng)計(jì)學(xué)問題減到最低限度。認(rèn)真檢查、仔細(xì)核驗(yàn),盡量避免上述錯(cuò)誤,必要時(shí)還可以請統(tǒng)計(jì)學(xué)專家?guī)椭殃P(guān)[12]。
2.2統(tǒng)計(jì)方法描述或選擇不當(dāng)
統(tǒng)計(jì)方法選擇非常重要,它直接影響結(jié)論的可靠性[12]。臨床資料的結(jié)果變量可分為計(jì)數(shù)資料、計(jì)量資料和等級資料。計(jì)數(shù)資料指將觀察對象按兩種屬性分類,如生存、死亡,治愈、未治愈,有效、無效等,通常轉(zhuǎn)化為率。如果是兩組間的比較,則采用四格表χ2檢驗(yàn)或其校正公式,如果是多組間率的比較,則采用行×列表資料χ2檢驗(yàn)。計(jì)量資料指對某一個(gè)研究對象用定量的方法測定某項(xiàng)指標(biāo)得到的資料,一般均有計(jì)量單位。通常資料呈正態(tài)分布時(shí),兩組間均數(shù)比較用t檢驗(yàn),多組間均數(shù)比較用方差分析和q檢驗(yàn)。當(dāng)資料不呈正態(tài)分布或方差不齊時(shí),也可用秩和檢驗(yàn)等非參數(shù)檢驗(yàn)法。
2.2.1統(tǒng)計(jì)方法描述不清
醫(yī)學(xué)論文中常可發(fā)現(xiàn)作者未交代所用的統(tǒng)計(jì)方法,如是配對設(shè)計(jì)的t檢驗(yàn)還是成組設(shè)計(jì)的t檢驗(yàn),是Ridit分析還是χ2檢驗(yàn),是作相關(guān)分析還是作回歸推斷。統(tǒng)計(jì)方法交代不清或根本不予交代,使讀者對論文結(jié)論的正確與否無法判斷。有的作者只提一句“經(jīng)統(tǒng)計(jì)學(xué)處理”后,就寫出結(jié)論。有的甚至直接用P值說明問題,籠統(tǒng)地以P<0.05或0.01、P>0.05便稱結(jié)果差異有無顯著性,P值的大小不說明差值的大小,它還與抽樣誤差大小有關(guān)[13]。因此,還應(yīng)寫明具體的統(tǒng)計(jì)方法,如有特殊情況,還應(yīng)說明是否采用了校正,應(yīng)寫出描述性統(tǒng)計(jì)量的可信區(qū)間,注明精確的統(tǒng)計(jì)量值和P值,然后根據(jù)P值大小作出統(tǒng)計(jì)學(xué)推斷,并作出相應(yīng)的醫(yī)學(xué)專業(yè)結(jié)論。
2.2.2假設(shè)檢驗(yàn)方法交代不清不交
代假設(shè)檢驗(yàn)方法或假設(shè)檢驗(yàn)方法交代的不具體、不清楚是醫(yī)學(xué)科研論文中常見的錯(cuò)誤。如果不交代假設(shè)檢驗(yàn)方法或假設(shè)檢驗(yàn)方法交代的不具體,讀者就無法考察論文的統(tǒng)計(jì)學(xué)方法選擇的是否正確,無法核對計(jì)算結(jié)果是否準(zhǔn)確。每一種假設(shè)檢驗(yàn)方法都有其特定的適應(yīng)條件和嚴(yán)格的適用范圍。對于同一組資料,采用不同的假設(shè)檢驗(yàn)方法可能得出截然相反的結(jié)論。如將配對設(shè)計(jì)的資料按成組設(shè)計(jì)資料的方法處理,將會損失樣本提供的信息、降低檢驗(yàn)效率,可能使原本有統(tǒng)計(jì)學(xué)意義的結(jié)果無統(tǒng)計(jì)學(xué)意義[14]。在論文寫作時(shí),不但要交代選用的是什么統(tǒng)計(jì)學(xué)方法,而且統(tǒng)計(jì)學(xué)方法要盡可能具體。如選擇t檢驗(yàn),要說明是配對t檢驗(yàn),還是成組t檢驗(yàn);選擇方差分析時(shí),要說明是完全隨機(jī)設(shè)計(jì)的方差分析,還是配伍組設(shè)計(jì)的方差分析。對于四格表資料,應(yīng)說明是一般四格表χ2檢驗(yàn)、配對四格表χ2檢驗(yàn)及四格表資料的精確概率法等。
2.2.3統(tǒng)計(jì)方法選擇常見錯(cuò)誤
①誤用χ2檢驗(yàn)。χ2檢驗(yàn)有一定的適用條件,n>40且理論數(shù)(T)>5時(shí),可用一般χ2檢驗(yàn);n>40,但至少有1個(gè)T>1且T<5時(shí),可用校正χ2檢驗(yàn);n<40或T<1時(shí)用χ2檢驗(yàn)的確切概率法[15]。②t檢驗(yàn)誤用于多組資料的比較。在醫(yī)學(xué)期刊中常會出現(xiàn)將t檢驗(yàn)誤用于多組資料的比較。多組資料的比較應(yīng)該采用方差分析(F檢驗(yàn)),當(dāng)差異具有統(tǒng)計(jì)學(xué)意義時(shí),再進(jìn)一步作兩兩比較。當(dāng)各組均與一個(gè)對照組比較時(shí)采用Dunnettt檢驗(yàn);當(dāng)各組相互循環(huán)比較時(shí),則常采用Student-Newman-keuls(SNK)檢驗(yàn),又稱q檢驗(yàn)[16]。③配對t檢驗(yàn)與成組t檢驗(yàn)誤用。大部分論文只注明采用t檢驗(yàn),而未注明是配對t檢驗(yàn)還是成組t檢驗(yàn)。配對t檢驗(yàn)常用于處理前后的自身對照,即差值均數(shù)與總體均數(shù)“0”的比較;成組t檢驗(yàn)適用于成正態(tài)分布的兩個(gè)小樣本均數(shù)間的比較。④資料不呈正態(tài)分布時(shí)未用非參數(shù)檢驗(yàn)。t檢驗(yàn)F檢驗(yàn)等適用于呈正態(tài)分布、方差齊且有確切的測量數(shù)值的資料,而非參數(shù)檢驗(yàn)(如符號檢驗(yàn)、秩和檢驗(yàn)Wilcoxon法、秩檢驗(yàn)-KruskalWallis法、Friedman法、Ridit分析、Seperman相關(guān)等)對資料無特殊要求,對按大小順序、評分、等級、反應(yīng)程度甚至色調(diào)深淺等資料都可進(jìn)行分析比較[17-18]。因此,對于多組計(jì)量資料的比較,呈正態(tài)分布且方差齊時(shí)用F檢驗(yàn),方差不齊時(shí)可用變量變換,或采用秩和檢驗(yàn);對于兩個(gè)小樣本均數(shù)的比較或處理前后的比較,方差齊時(shí)用成組t檢驗(yàn)或配對t檢驗(yàn),方差不齊時(shí)用t′檢驗(yàn)[19]。
3結(jié)果解釋時(shí)存在的問題
統(tǒng)計(jì)分析的結(jié)果是推翻無效假設(shè)或是不能推翻無效假設(shè)。無效假設(shè)在一般的統(tǒng)計(jì)檢驗(yàn)為兩組總體參數(shù)相等。推翻無效假設(shè)只能說兩組總體參數(shù)不相等而并不能說兩組相差很大。兩組相差如何要對可信區(qū)間進(jìn)行研究觀察后得出。由于統(tǒng)計(jì)檢驗(yàn)不能得出差別的大小,因而結(jié)論不能說“有明顯差異”或“有顯著差異”,也不能說“差異非常顯著”,更不能說“差異明顯”。在國外的統(tǒng)計(jì)書籍上的英語表達(dá)為“significant”,它的正確意義應(yīng)當(dāng)是“有意義的、有重要性的”。俄語為“Значмый”和日語中的“有意”也是這個(gè)意思。國內(nèi)只有極個(gè)別的英漢詞典把“significant”誤譯為“顯著的”。正確的說法應(yīng)當(dāng)是“差異有統(tǒng)計(jì)學(xué)意義”或“差異有高度統(tǒng)計(jì)學(xué)意義”等[20]。在解釋差別有統(tǒng)計(jì)學(xué)意義的結(jié)果時(shí),有些人常常根據(jù)P值的大小作出對實(shí)驗(yàn)效應(yīng)差別程度不同的專業(yè)結(jié)論[21]。例如某實(shí)驗(yàn)研究,比較甲、乙兩種治療方法對某病的治療效果(假定甲法的療效優(yōu)于乙法),若得到“P<0.001”,則認(rèn)為甲法極顯著優(yōu)于乙法;若得到“P<0.01”,則認(rèn)為甲法非常顯著優(yōu)于乙法;若得到“P<0.05”,則認(rèn)為甲法顯著優(yōu)于乙法。犯這種錯(cuò)誤的原因是錯(cuò)誤的理解了統(tǒng)計(jì)學(xué)中P值的概念[7]。統(tǒng)計(jì)學(xué)上根據(jù)假設(shè)檢驗(yàn)原理推算出來的P值表示拒絕特定的無效假設(shè)可能犯假陽性錯(cuò)誤的概率。P值的大小并非指差異的太小,只能反映兩者相同或不相同。P值越小,說明越有理由認(rèn)為兩種處理方法效果不同,而不能反映對比的兩組或多組之間差異的大小。差異的大小只能根據(jù)專業(yè)知識來確定。此外,甚至在部分投稿文章中未交代所采用的統(tǒng)計(jì)分析方法,也未見應(yīng)用統(tǒng)計(jì)學(xué)的跡象,僅從各組數(shù)據(jù)的均數(shù)大小做出了統(tǒng)計(jì)推斷。醫(yī)學(xué)期刊論文中暴露出來的統(tǒng)計(jì)學(xué)錯(cuò)誤,從表面上看是編輯部和審稿者把關(guān)不嚴(yán)所致。事實(shí)上,即使審稿時(shí)發(fā)現(xiàn)了上述錯(cuò)誤,也無法改正。因?yàn)閷?shí)驗(yàn)設(shè)計(jì)的錯(cuò)誤只有在科研工作開始之前才有可能得到糾正。即使編輯工作者能夠阻止有嚴(yán)重統(tǒng)計(jì)學(xué)問題的論文發(fā)表,也僅僅是治標(biāo)而已。如何使廣大醫(yī)學(xué)論文作者在醫(yī)學(xué)研究中正確應(yīng)用統(tǒng)計(jì)學(xué),提高科研質(zhì)量才是治本[7]。
4對策與建議
眾所周知,統(tǒng)計(jì)學(xué)是從事科學(xué)研究不可缺少的工具。從試驗(yàn)設(shè)計(jì)、資料收集與表達(dá)、數(shù)據(jù)處理和結(jié)果分析,每一個(gè)環(huán)節(jié)都需要正確地運(yùn)用統(tǒng)計(jì)知識,才能真正發(fā)揮統(tǒng)計(jì)學(xué)在科學(xué)研究中應(yīng)起的作用。然而,在已出版和發(fā)表的一些學(xué)術(shù)專著和論文中、通過評審的科研成果和答辯的學(xué)位論文中,經(jīng)常可以看到忽視、輕視和誤用統(tǒng)計(jì)學(xué)的現(xiàn)象[22]。
4.1提高編輯人員的統(tǒng)計(jì)學(xué)知識
應(yīng)完善編輯人員的知識結(jié)構(gòu),保證統(tǒng)計(jì)學(xué)應(yīng)用的準(zhǔn)確性。為此,可定期聘請統(tǒng)計(jì)學(xué)專家對審稿人員進(jìn)行統(tǒng)計(jì)學(xué)知識培訓(xùn)??萍计诳娜后w效應(yīng)理論[23]認(rèn)為,期刊編輯的專業(yè)結(jié)構(gòu)應(yīng)多元化,以利于編輯互相學(xué)習(xí),實(shí)現(xiàn)知識互補(bǔ)。醫(yī)學(xué)期刊編輯部可考慮聘用統(tǒng)計(jì)學(xué)專業(yè)的研究生作為編輯。編輯應(yīng)將醫(yī)學(xué)統(tǒng)計(jì)學(xué)作為自己的必修課,通過多種方式,如自學(xué)自修,參加講座或培訓(xùn)班學(xué)習(xí)統(tǒng)計(jì)學(xué)知識,有條件的編輯部,如醫(yī)學(xué)院校學(xué)報(bào)編輯部,可以有計(jì)劃地組織編輯參加本科生或研究生醫(yī)學(xué)統(tǒng)計(jì)學(xué)課程的學(xué)習(xí),也可鼓勵(lì)編輯人員在職攻讀統(tǒng)計(jì)學(xué)專業(yè)研究生學(xué)位。這樣,可以提高全體編輯人員的統(tǒng)計(jì)學(xué)水平,最終使編輯和審稿人都能夠發(fā)現(xiàn)論文中存在的統(tǒng)計(jì)學(xué)錯(cuò)誤,并指導(dǎo)作者修改,正確進(jìn)行醫(yī)學(xué)論文中有關(guān)統(tǒng)計(jì)學(xué)分析的描述[24]。另外,有關(guān)職能部門或?qū)W會可組織與醫(yī)學(xué)統(tǒng)計(jì)學(xué)相關(guān)的培訓(xùn)班,聘請統(tǒng)計(jì)學(xué)專家講課,對編輯人員進(jìn)行定期統(tǒng)計(jì)學(xué)知識培訓(xùn),加強(qiáng)科研設(shè)計(jì)、統(tǒng)計(jì)學(xué)知識的學(xué)習(xí)[19]。
4.2加強(qiáng)醫(yī)學(xué)統(tǒng)計(jì)學(xué)專家審稿
醫(yī)學(xué)研究論文專業(yè)性強(qiáng),經(jīng)常涉及統(tǒng)計(jì)學(xué)處理問題,有時(shí)會遇到統(tǒng)計(jì)方法復(fù)雜的稿件,這不僅需要本學(xué)科專家審稿,而且需要醫(yī)學(xué)統(tǒng)計(jì)專家把關(guān),只有這樣,才能保證論文所報(bào)道的研究成果的真實(shí)性和可靠性。醫(yī)學(xué)期刊編委會中應(yīng)有統(tǒng)計(jì)學(xué)專家,專門負(fù)責(zé)稿件統(tǒng)計(jì)學(xué)方面的審查工作。
4.3強(qiáng)化作者的統(tǒng)計(jì)學(xué)意識
目前,我國醫(yī)學(xué)科研工作者對統(tǒng)計(jì)學(xué)的重視不夠,沒有認(rèn)識到統(tǒng)計(jì)學(xué)的重要性。因此,要加強(qiáng)宣傳,提高醫(yī)學(xué)科研人員對統(tǒng)計(jì)學(xué)重要性的認(rèn)識,強(qiáng)化他們的統(tǒng)計(jì)學(xué)意識,務(wù)必在科研工作中和撰寫論文時(shí)做到正確應(yīng)用統(tǒng)計(jì)學(xué)。另外,還可以對作者開辦有關(guān)科研論文撰寫知識的培訓(xùn)班,面向臨床醫(yī)生,特別是年輕醫(yī)生定期培訓(xùn)。請有研究經(jīng)驗(yàn)的專家講授科研課題的設(shè)計(jì)方法、如何正確運(yùn)用統(tǒng)計(jì)學(xué)方法等。這些措施有利于強(qiáng)化作者的統(tǒng)計(jì)學(xué)意識,并樹立其精品意識,有利于增加優(yōu)質(zhì)稿源,從而提高期刊學(xué)術(shù)質(zhì)量[19]。
總之,提高醫(yī)學(xué)期刊中統(tǒng)計(jì)學(xué)應(yīng)用的質(zhì)量是一項(xiàng)長期而又艱巨的工作,它涉及到作者、編者、審者及讀者等多個(gè)方面,需要大家共同努力,才能逐步減少以至消除統(tǒng)計(jì)學(xué)誤用現(xiàn)象,從而提高醫(yī)學(xué)論文的科學(xué)性[14]。
有關(guān)統(tǒng)計(jì)學(xué)專業(yè)畢業(yè)論文推薦:
1.淺談統(tǒng)計(jì)學(xué)專業(yè)相關(guān)論文
2.統(tǒng)計(jì)學(xué)本科畢業(yè)論文