【戏说统计】奶茶和统计学

2014-05-11 10:13:19 来源:中国循环杂志 阅读:144次


循证医学时代的的开启使得医学统计学的地位显得史无前例的重要。良好的医学统计学基础已经成为一名优秀的的心血管医生的必要条件。但为什么医学统计学,让人枯燥到心生抵触?我们究竟错在哪里?


能分清加茶和加奶顺序的女士和小胡子


上个世纪20年代,在一个夏日的午后,一群统计学精英和他们的夫人聚在一起悠闲地享用午茶。期间有个女士坚称:把奶加入茶里和茶加入奶里,不同的顺序,奶茶的味道是不一样的。在场大多数人对这位女士的说法付之一笑,同样原料仅仅是加入顺序改变,味道怎么可能不同呢?


然而,当中有一位留着小胡子的先生却表示出极大的兴趣,他兴奋的说道:“让我们一起来验证这个命题吧!”在场的许多人在这位小胡子先生鼓动下开始产生兴趣,大家热烈的讨论和策划这个试验。



很快,一杯杯奶茶就从这位女士看不见的地方调配出来,它们只是奶和茶加入顺序不同。最后,女士品尝了第一杯:“这一杯是先加奶后加茶。”小胡子先生面无表情的记录下来,然后端上第二杯……。


这小胡子先生不是别人,他正是现代统计学的奠基人,统计史上的超级天才罗纳德·费歇尔。


若干年后,在他的《实验设计》第二章提到了这个故事。这位女士的断言就是假设命题,他在他的书中设想了众多统计学方案来验证这个假设,包括至少要配置多少杯奶茶、这些奶茶要按什么样顺序奉上、这位女士可能会有多少种判别的结果。


但那天下午究竟费歇尔使用了哪种统计学方案?最后结果如何?书中并没有交代。费歇尔的著作历来以艰深晦涩的数理理论而著称,这个统计学怪才毫不顾忌读者的感受,只是在列举完上述统计方法后文章戛然而止,因为他觉得结果并不重要,重要的是提出问题和解决问题的过程。


不过据在场另一位学者休·史密斯教授回忆,那位女士竟然正确地分辨出每一杯奶茶!


冰冷的数学公式和枯燥的推导演,痛苦还是荣耀?


相信第一次读到这个故事的读者跟我当年的心情一样,我饶有兴趣的读完这个故事丝毫没有对统计学的的抵触。然而我们学习中为何如此抵触医学统计学?为何我们对医学统计学误会如此之深?


胡良平老师曾在《医学统计学基础与典型错误辨析》一书中指出,我国医学统计学令人堪忧的现状,而造成这种现状的原因是多方面的,其中有教学体制的问题,有评价体制的问题,有教材的问题,有教学方式的问题等。


我十分认同胡老师的观点。最大的问题可能有两个:没有正确的兴趣引导,没有正确的教学方式。


临床医生从学生时代接触统计学的核心目的,就在于它是一门分值很高的必修课。从开始到结束统计学始终,都是由冰冷的数学公式和枯燥的推导演算组成。


当我们还来不及体会统计学的思想精髓、还来不及探究Student t检验,poisson分布、fisher判别,Cox回归这一个个耀眼的公式后面的生动典故,一纸试卷就将我们的统计学生涯光荣地划上句号。


从此《医学统计学》尘封在书架的某一个角落,不是万不得已绝不打开。


我们的医学统计学之路大致如此,我们错在哪里?


统计与象棋:知道象走田,何必要知道为什么象走田?


在中国象棋里,有许多规则如马走日,象走田,老帅不出宫,卒子不回头……。说起来,来医学统计学和中国象棋十分相似。象棋的这些规则,就好比是统计学的公式。



我们学习统计的目的不是想成为统计学家,因此,我们的学习重点不在于如何探究和推导“马走日”的合理性和必然性,我们的重点在于统计学方法和思想。正如下棋时考虑什么时候用马,什么时候动炮,统计时则在思考用某个统计学公式。


当对方棋子挡住马脚或象心时我们不能走,好比是统计学公式的前提和注意点。比如,当数计量据不符合正态等方差前提时我们不能用t检验。


再下一步,我们就运用我们的所学对弈,在实践中体验下棋的乐趣。如果我们象棋老师一开始就不厌其烦的用复杂公式论证为什么马要这样走,相信象棋也会变得枯燥无味。可能有的读者会说我们的教材就是这么枯燥。


余光中先生把朋友分成四型:第一型,高级而有趣;第二型,高级而无趣;第三型,低级而有趣;第四型,低级而无趣。这个和书籍分类很像,在开始写书的时候我总是想把书写的低级而有趣,我认为形式并不重要,只要读者易读、易懂、有收获就好。


随着出版平台的提高,我发现最好要写得高级一些,太低级就难登大雅,编辑会对我有意见,这个时候我写的东西就逐渐变得无趣,也就是在这个时候我能体会到大多数教材的难处。


教材要写的高级而又有趣何其困难!它首先要经得起专业的评审和挑剔,如果不能写的高级而又有趣,只能退而求其次,写的高级而无趣。那么天马行空的任务交给谁呢?当然是我们的统计学老师。


一个好的老师会善于把握统计学的精髓,化繁为简,把一个高级而无趣的教材演绎得高级而又有趣,引导我们的兴趣。


一个差的统计学老师往往把高级而无趣的统计学教材演绎得高级而又恐怖,使我们望而却步。在我初次接触到方积乾老师视频教学的时候,我忽然发现原来统计学可以这么生动!


最廉价的进步:三个月或半年就会小成


学好统计学我们会收获什么?想要当好一个心血管医生,我认为有四个基本要素:过硬的专业知识和技能,扎实的外语功底,完善的科研平台,良好的医学统计学基础。


医学是一门厚积而薄发的学科,想要掌握过硬的专业知识和技能非十年以上不为功,而扎实的专业外语功底至少也要三年五载。完善的科研平台对很多人来说可望而不可及。只有统计学知识,以我们目前的基础如果潜心研究三个月或半年相信大家都会小有所成。



这个时候,你往往会在周围朋友用过的数据中找到新的亮点,能够指出他们统计学上的一些小错误,能够帮他们用新的统计学方法证明论点,于此同时你也帮到了自己、提高了自己。这算不算得上是最廉价的进步呢?


好朋友不嫌多


我们究竟得掌握多少医学统计学方法?这个问题好比说我们想要多少好朋友?朋友越多,路就会走得越宽,就能为你的事业开枝散叶,广结硕果。有人会嫌朋友多吗?



如果你只会t检验、卡方检验,能帮你的朋友就少,你的思维就会越来越窄,可能很多有价值的数据就会被你浪费,很多潜在的机会就会从你身边消失。


另外,当我们开始做一样事情的时候我们是希望有很多好朋友先帮我们出谋划策,胸有成竹之后再做呢,还是希望事情到了眼前,火烧眉毛的时候才急急忙忙找有限的一两个朋友救急?


我们当然希望是前者,可是事实上,我们很多课题和文章走的都是后者的路。


如果我们把眼光放得再远一些,在浩如烟海的统计学知识体系中,医学统计学只是我们能看到有限的几块绿洲,也就是最常用、最成熟的一些统计学方法。


即便这样,稍微复杂一些的临床设计在书中都不一定找得到答案,所以我觉得读透《医学统计学》八百多页中的所有章节,掌握一些重点章节这个要求应该不算苛刻。


在此基础上我们可以参阅一些优秀的国内外期刊,看看上面有没有一些书本中没有提及的、好的、新颖的统计学方法可以借鉴学习。


在此基础上,如果我们有兴趣可以参看针对某一种统计方法(如logistic回归、判别分析)的专著,加深理解。当然论坛、专业交流群对我们统计水平提高的作用也不可小觑。


同时,由于经常要面对遗忘的问题(尤其是操作软件),我喜欢把一个阶段学习体会用屏幕录像的方式快速记录。日后,我自己就可以当我的老师,还有谁比你更熟悉你自己呢?


到底需要多少的数学基础


我一直认为如果把我们的《医学统计学》改为《医学统计应用学》似乎更为恰当。我不敢妄言学习医学统计学不需要深厚的数学功底,而医学统计应用学以我们大多数人数学知识背景应该可以胜任的,因为我们的落点在于应用。



在开始统计学学习之前,复习一下高中代数的基本知识,比如对数、指数的运算法则,三角函数、累加、累乘的表达方式这些都是必须的。


而医学统计学中那些比较晦涩方程如最小二乘法、似然函数公式的建立和推导我们并不一定要完全清楚,但是要明白方程的道理,至少要有感性的认识。


到了SPSS上机实践阶段,我们甚至会惊诧地发现,根本不需要理会统计学当中繁琐的步骤,直接按格式输入数据电脑就会给你答案,甚至比你期望的还要多。


这样的看法又会导致另一个极端,公式的推导虽然不需要掌握和记忆,但是明白了它的来龙去脉会有助于与理解公式的应用条件和计算结果的解读。


比如单因素方差分析的计算过程理解,有助于我们参悟和理解多因素方差分析,前后测量方差分析,协方差分析。但到了spss上也就是输入格式的不同,然后多打上一两个勾,电脑会自动给出中间结果,如果直接从统计软件学起我们就无法解读和理解这些结果和后面的统计学思想。


千里之行始于足下,我对医学统计学这些浅薄的理解并不一定能帮得到大家,路要靠大家自己来走。


想要学好统计学不付出艰辛的劳动是不现实的,但是千万不要自己一个人钻到书本里闷头学习。多请教、多借鉴、多交流、多实践、找到一位好的老师这些都是捷径。


来源:丁香园