当前位置:首页 > 芯闻号 > 充电吧
[导读]由于统计学在现实生活和“高端”科学研究中有着很高的地位,时常思考统计相关的问题,加深对它的基础理论的理解应该对我们理解和研究现实世界有帮助。1、样本空间与总体的关系样本空间,在茆诗松等编著的《概率论与

由于统计学在现实生活和“高端”科学研究中有着很高的地位,时常思考统计相关的问题,加深对它的基础理论的理解应该对我们理解和研究现实世界有帮助。

1、样本空间与总体的关系

样本空间,在茆诗松等编著的《概率论与数理统计教程》一书中,是这样定义的:随机现象的一切可能的基本结果组成的集合称为样本空间,每个基本结果被称为样本点。首先理解一下,什么是随机现象?随机现象就是在一定条件下,并不总是出现相同结果的现象,称为随机现象。这里我们不去深究什么是现象,因为他的解释本身是抽象的,抽象的东西相对具体的东西理解稍微困难一点,我们可以在不断的学习过程中慢慢理解、意会这些概念。这里我们固定了某个关心的结果后,就可以产生样本空间了。比如,我们研究“某个环境中,固定条件下,投掷骰子出现的点数”,这里我们考虑的是出现的点数这种结果形式,为什么不是说结果,而是说结果形式,只是微妙的一点点差别而已,结果是确定的,而结果形式是概述这些可能的结果,我这样理解,但是由于这样会带来理解上的负担,干脆用“结果”这个词来代替了,在大多数情况下,大家都可以意会。这个例子中,我们考虑的是投掷骰子这种随机现象的出现点数这种结果,所以样本点有“出现1点”,“出现2点”,...,"出现6点",这些样本点组成样本空间。样本空间还强调了“一切可能”,表征全面性。样本空间的本质属性是集合,这个定义不想我们大家在代数中学到的空间一样,代数中,空间是定义了运算以及某些限定条件的集合,他跟分析中的空间也不一样,总之概率中的样本空间仅仅是一个集合而已,如果你愿意,你可以叫他样本集合。

总体,我们继续把茆诗松等人的定义作为理解的出发点,所谓总体就是指研究对象的全体。与样本空间不同,样本空间是随机现象的我们所关心的结果的集合,而总体是指对象的全体,它本质也是集合的概念,每个研究对象是可以区分开来的,每一个对象我们称之为个体,总体只说明是对象的集合,没有说明是结果的集合,但是很多情况下,或者研究统计的科学家实际上是想把总体定义成结果的集合的,实际中他们也是这样用的。他们隶属的学科也不同,样本空间属于概率论的范畴,总体属于统计的范畴。概率是给出某些假设本质,研究本质后的现象问题,就是说概率是已知概率分布,然后研究随机变量的关系啊,性质啊,给一些新的变量定义啊,比如数学期望,方差,标准差啊之类的,统计是为了发现总体某种原始本质性质,而做出的数学上的分析和理解。当然这只是我个人的理解,也许事实不是这样的,不管事实怎样,这样理解并不会对我们理解统计学的基本原理和方法造成障碍。

既然学科不同,即使他们有联系,我们在考虑不同学科的时候,根据上下文区分即可,不要过于纠结,纠结多了,会阻止我们前进的。


2、理解总体之后的概念和需要研究的问题

知道了什么是总体,什么是个体了么? 如果我们要研究某个区域中学生的身高,那么这个区域中所有学生的身高构成了我们研究问题的总体,每个学生的身高就是一个个体。这样一来,我们如果继续思考下,写书的作者也做过讨论,就是做数学理论研究,很容易想到去除实际背景,研究去除背景后的数学模型的性质理论。这里呢,我们就去除身高这个实际名词,我们研究的是代表身高的那一堆数,这堆数有的出现的次数多一点,有的出现的次数少一点,也就是说在这堆数中任意取一个数,每个数都有可能被抽到。那么我们可以把这个数看成随机变量去研究它,是可以的,这堆数有用一个分布函数来描述它,每个数用随机变量描述它。再插一点,什么是随机变量呢?随机变量是定义在样本空间上的一个实值函数。又提到样本空间了,另一种理解,样本空间就是这个区域中所有学生,样本点就是每个学生,那么不管你研究身高,还是体重,这两个都可以给出数量指标,这个指标完全可以用实数来表示,这就是随机变量了,如果考虑的是身高和体重,用一个二维随机变量来表示就行了。现在我们研究的是统计学问题,随机变量就是定义在总体之上的实值函数,但是前面我们说的总体是全体学生的身高啊,怎么不是全体学生呢?哈哈,可以根据上下文区分下,总体到底是什么,一般我们研究的是可以量化的指标,如果只考虑某一个指标的时候,我们研究的每个同学只有一个这样的指标,所以这个指标可以认为就是这个同学了,但是我们在研究多个指标的情况下,我们只能把总体看成是全体学生了,你不把它看成全体学生也可以,可以认为每个个体只是变成了一个多维描述的指标了而已。

在纠正道正路上来,我们研究总体的性质有很多限制,比如我们没有那么多人力去认真统计某个大区域中的所有学生身高。我们又想知道总体到底是一个什么样子的。其实我们说研究性质,不是十分准确,概率统计中,只要分布已知了,本质就知道了。所以准确的说,我们是为了研究总体的分布,想知道总体到底满足什么分布,然后某些分布具有什么性质,就是概率论研究的内容了。

不能每个个体都研究,我们就想一个办法来近似的研究整体,就是找一个我们认为能很好的代替总体的一个小集合来研究下,为了更好的在数学上研究呢,我们就引进了样本的概念。关于样本的定义大家有一点差别,但是不会影响我们后面的学习,我倾向于于寅写的高等工程数学里的理解,当然他也许不是这个定义的创造者,但是我读了他的书,学知识而已,就认为是他写的也不会影响我们最终的收获。样本就是按照一定规则从总体抽取的若干个体,抽取的个体数目称为样本容量,有的人也就他样本量。如果我们抽取的规则是随机的,也就是说每个个体被抽到的机会是均等的;每一次抽取的个体跟其它次抽取行为没有关系。这样的到的样本叫简单随机样本。我们大多数情况下研究这样的样本。因为这样的样本才能很好的反应总体的本质。至于为什么这样的样本能反应总体分布,我没有去证明,也许有前辈已经证明了,我们就可以站在前辈的肩膀上了。

想想,既然从总体中是随机拿到的一个值,那么代表这个值得变量就是随机变量了,它应该跟总体满足相同的分布,而且他们相互独立,所谓独立同分布啊。所以一个样本可以认为是一个多维随机变量,每一维都是独立的。试验做毕,你会得到一组值,这组值就是样本观测值。试验就是抽取个体的过程。样本中的每个个体呢,也有个新名字,叫样品。有的时候也不区分这个,所以有些书里面也就不介绍了。




本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭