用计算机语言理解随机变量和样本的区别

原創

乾坤瞬间

2018-09-04 07:47

在统计学领域有两个核心的基本概念,其中一个是随机变量,而第二个是样本

如果不做深入思考的话,大可以百度看看这两者之间到底是什么联系.我想大家可能会知道个大概.

但是理解这个两者的区别至关重要,对这两者的区别,决定了你看论文以及后续学习统计学概念的一大

非常非常重要,而且是直接影响后续深入的一大门槛,而在自己工作的这些年,我对这两者之间的联系再做

一个区分度更大的直观解释.

很多人开始接触学习统计学的第一步都会设计到这两个概念.但是这些概念在统计学或者数学的角度来说

至少对自己来说太过于抽象,我习惯性地想用现实中的客体来映射这两种根本区别.

对与"随机变量"来讲:统计学这么解释,如果一个变量,其值由一个随机试验所决定的,那么这个就是就是变量..

如果是对刚刚入门的人来讲,这个讲解太过于抽象,一般这样的解释跟没解释差不多(虽然这样解释可以说是学术上为了避免概念之间打架做的规范,但是说真的,在中国大陆这样的教育方式司空见惯..跑偏了).

打个比方,假设我要做人口普查,我现在要做的试验对象

就是我们要调查的人,当然还需要调查人的一些属性,比如身高,年龄作为我们的需要的数据录入数据库系统.请问这个过程中

什么才是随机变量?

那么试问当你学了什么是随机变量以后,对与上面的这个问题,说者的无济于事....

因为,一个试验所决定的东西还是比较多的,比如,普查对象的"人",我们在做调查的时候这个"人"是不是随机的?那么"人"

是不是随机变量?还有,我们要取的值比如,我调查了一个"人",比"张三",他的身高:2m,体重,180公斤,年龄200岁,我说这个2m就是"随机"变量,你说这个是不是?其实以上都不是随机变量的概念.其实这个随机变量就像计算机系统中存储的变量是很像的.比如我们创造一个类如下(python)

class Person(Object):

def __init__(self):

self.name = "张三"

self.age = 200

这里我们要做调查的是"人"这个对象,但是他们的取值是变化的,比如这个人名字可以取"张三","李四","隔壁老王"...

那么这个可以真正变动的就是 name 和 age这两个值,也就是说,随机变量就是 name 和age.因为这两个值是随机变动的,而调查的对象"人",是由这一种属性所代表的.因此,结合统计学意义来看,这里person是由两个随机变量所决定,一个是名字(name),另一个是年龄(age).同样的在人口调查中所描述的试验中,其随机变量就是 "年龄","身高","....",这些我们调查的"属性"或者"特征",就是我们所代表的"随机变量".

那么"样本"又是什么?估计大家通过以上的了解,你是否还会再想去百度或这统计书上看看,"样本"的概念是啥吧.不过教课书上对样本的描述在我认为还是有点点抽象,以至于我以前初学的时候经常会与"随机变量"搞混,其实样本,就是我们做试验的时候所要得到的课题的整体描述,比如上面的人口普查,我去取了个"张山"这个人作为我调查的对象,而"张山"这个人就是"样本",那么通过这样的解释.

这个是我的随想,以防止忘记了,有不足之处还望指点!

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

用计算机语言理解随机变量和样本的区别

Linux shell 整理之基本概念篇（二）

spark pom文件胖廋包結合

Linux shell 整理之語法結構篇（五）

spark streaming2.4.0 任務啓動源碼剖析

spark sql 高階函數介紹

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結