族谱网 头条 人物百科

相关

2017-10-16
出处:族谱网
作者:阿族小谱
浏览:570
转发:0
评论:0
各种相关系数对于不同测量尺度的变数,有不同的相关系数可用:Pearson相关系数(Pearson"sr):衡量两个等距尺度或等比尺度变数之相关性。是最常见的,也是学习统计学时第一个接触的相关

各种相关系数

对于不同测量尺度的变数,有不同的相关系数可用:

Pearson相关系数(Pearson"s r ):衡量两个等距尺度或等比尺度变数之相关性。是最常见的,也是学习统计学时第一个接触的相关系数。

净相关( 英语: partial correlation ):在模型中有多个自变数(或解释变数)时,去除掉其他自变数的影响,只衡量特定一个自变数与因变数之间的相关性。自变数和因变数皆为连续变数。

相关比( 英语: correlation ratio ):衡量两个连续变数之相关性。

Gamma相关系数:衡量两个次序尺度变数之相关性。

Spearman等级相关系数:衡量两个次序尺度变数之相关性。

Kendall等级相关系数( 英语: Kendall tau rank correlation coefficient ):衡量两个人为次序尺度变数(原始资料为等距尺度)之相关性。

Kendall和谐系数:衡量两个次序尺度变数之相关性。

Phi相关系数( 英语: Phi coefficient ):衡量两个真正名目尺度的二分变数之相关性。

列联相关系数( 英语: contingency coefficient ):衡量两个真正名目尺度变数之相关性。

四分相关( 英语: tetrachoric correlation ):衡量两个人为名目尺度(原始资料为等距尺度)的二分变数之相关性。

Kappa一致性系数( 英语: K coefficient of agreement ):衡量两个名目尺度变数之相关性。

点二系列相关系数( 英语: point-biserial correlation ):X变数是真正名目尺度二分变数。Y变数是连续变数。

二系列相关系数( 英语: biserial correlation ):X变数是人为名目尺度二分变数。Y变数是连续变数。

皮尔逊积差系数(Pearson"s product moment coefficient)

数学特征

其中, E 是数学期望,cov表示协方差, σ σ --> X {\displaystyle \sigma _{X}} 和 σ σ --> Y {\displaystyle \sigma _{标准差 是标准差。

因为 μ μ --> X = E ( X ) {\displaystyle \mu _{X}=E(X)} , σ σ --> X 2 = E ( X 2 ) − − --> E 2 ( X ) {\displaystyle \sigma _{X}^{2}=E(X^{2})-E^{2}(X)} ,同样地,对于 Y {\displaystyle Y} ,可以写成

当两个变量的标准差都不为零,相关系数才有定义。从柯西-施瓦茨不等式可知,相关系数的绝对值不超过1。当两个变量的线性关系增强时,相关系数趋于1或-1。当一个变量增加而另一变量也增加时,相关系数大于0。当一个变量的增加而另一变量减少时,相关系数小于0。当两个变量独立时,相关系数为0,但反之并不成立。这是因为相关系数仅仅反映了两个变量之间是否线性相关。比如说, X 是区间[-1,1]上的一个均匀分布的随机变量。 Y = X .那么 Y 是完全由 X 确定。因此 Y 和 X 是不独立的。但是相关系数为0。或者说他们是不相关的。当 Y 和 X 服从联合正态分布时,其相互独立和不相关是等价的。

当一个或两个变量带有测量误差时,他们的相关性就受到削弱,这时,“反衰减”性(disattenuation)是一个更准确的系数。

几何特征

对于居中的数据来说(何谓居中?也就是每个数据减去样本均值,居中后它们的平均值就为0),相关系数可以看作是两个随机变量中得到的样本集向量之间夹角的cosine函数。一些实际工作者更喜欢用非居中的相关系数(与Pearson系数不相兼容)。看下面的例子中有一个比较。例如,假设五个国家的国民生产总值分别是1、2、3、5、8(单位10亿美元),又假设这五个国家的贫困比例分别是11%、12%、13%、15%、18%。则我们现在有两个有序的包含5个元素的向量x、y:x =(1, 2, 3, 5, 8)、 y =(0.11, 0.12, 0.13, 0.15, 0.18) 使用一般的方法来计算向量间夹角(参考数量积),未居中的相关性系数如下:

上面的数据实际上是故意选择了一个完美的线性关系:y = 0.10 + 0.01 x。因此皮尔逊相关系数应该就是1。把数据居中(x中数据减去E (x) = 3.8,y中数据减去E (y) = 0.138)后得到:x =(−2.8, −1.8, −0.8, 1.2, 4.2)、y =(−0.028, −0.018, −0.008, 0.012, 0.042),由此得到了预期结果:

统计学上的相关

相关系数的计算过程可表示为:将每个变量都转化为标准单位,乘积的平均数即为相关系数 。

两个变量的关系可以直观地用散点图表示,当其紧密地群聚于一条直线的周围时,变量间存在强相关 。

一个散点图可以用五个统计量来概括。所有x值得平均数,所有x值的SD,所有y值得平均数,所有y值的SD,相关系数r.

将第一个变量记为x ,第二个变量记为y ,相关系数为r,则可以通过以下公式:

r = [(以标准单位表示的x)X(以标准单位表示的y)]的平均数

参见

相关不蕴涵因果

 


免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

文章来源:内容词条
——— 没有了 ———
编辑:阿族小谱

更多文章

更多精彩文章
评论 {{commentTotal}} 文明上网理性发言,请遵守《新闻评论服务协议》
游客
发表评论
  • {{item.userName}} 举报

    {{item.content}}

    {{item.time}} {{item.replyListShow ? '收起' : '展开'}}评论 {{curReplyId == item.id ? '取消回复' : '回复'}}

    回复评论
加载更多评论
打赏作者
“感谢您的打赏,我会更努力的创作”
— 请选择您要打赏的金额 —
{{item.label}}
{{item.label}}
打赏成功!
“感谢您的打赏,我会更努力的创作”
返回
打赏
私信

推荐阅读

· 西施相关作品
简要介绍:西施是中国美女的代表,有关她的诗词、绘画和歌曲作品较多。诗词1.西施咏王维艳色天下重,西施宁久微?朝为越溪女,暮作吴宫妃。贱日岂殊众,贵来方悟稀。邀人傅脂粉,不自着罗衣。君宠益娇态,君怜无是非。当时浣纱伴,莫得同车归。持谢邻家子,效颦安可希?【韵译】:艳丽的姿色向来为天下器重,美丽的西施怎么能久处低微?原先她是越溪的一个浣纱女,后来却成了吴王宫里的爱妃。平贱时难道有什么与众不同?显贵了才惊悟她丽质天下稀。曾有多少宫女为她搽脂敷粉,她从来也不用自己穿着罗衣。君王宠幸她的姿态更加娇媚,君王怜爱从不计较她的是非。昔日一起在越溪浣纱的女伴,再不能与她同车去来同车归。奉告那盲目效颦的邻人东施,光学皱眉而想取宠并非容易!【简析】这是一首借咏西施,以喻为人的诗。“朝为越溪女,暮作吴宫妃”写出了人生浮沉,全凭际遇的炎凉世态。诗开首四句,写西施有艳丽的姿色,终不能久微。次六句写西施一旦得到君王宠爱...
· 宗族相关
1.隋姓是一个比较典型的北方姓氏。2.隋姓历史名人鲜少。3.当今隋姓名人以体育界为多。如铅球运动员隋新梅,辽宁足球队员、大连人隋明云、隋波以及八一足球队员隋东亮等。4.隋姓人群总的血型分布是:O型占30.9%,A型占28.1%,B型占31.2%,AB型占9.8%。[1]5.目前山东荣城县县志办收藏隋姓族谱1部。[1
· 郅氏相关成语
成语:钟鸣鼎食释义:钟:古代乐器;鼎:古代炊器。击钟列鼎而食。形容贵族的豪华排场。出处:《史记·货殖列传》:“洒削,薄技也,而郅氏鼎食。胃脯,简微耳,浊氏连骑。马医,浅方,张里击锺。”意思是说:“磨刀本是小手艺,而郅氏靠它富到列鼎而食。卖羊肚儿本是微不足道的事,而浊氏靠它富至车马成行。给马治病是浅薄的小术,而张里靠它富到击钟佐食。”
· 曹冲相关争议
去世时间学者普遍遵从《三国志》本传记载,认为曹冲卒于建安十三年,即208年。然据清人丁晏《曹集铨评》增辑的《仓舒诔》序文:“建安十二年五月甲戌,童子曹仓舒卒,乃作诔曰”,“建安十二年”为207年,“五月甲戌”为汉历五月十四日,即儒略历6月23日。诔文言“十三而卒”,以此回推生年,当在东汉兴平二年,即195年。称象质疑何焯认为孙权在建安十五年(210年)才派步骘出任交州刺史,士燮兄弟等人奉承东吴,只有在此之后才能获得亚洲象,但曹冲早已在建安十三年(208年)之前死去,所以曹冲秤象之事不真,而置船刻水的称量方法可能早已有之。邵晋涵则指出《符子》中就记载了燕昭王命令水官用类似的方法称量大猪。陈寅恪认为曹冲称象的故事出于印度佛典,他指出地处中原的曹魏境内无象,所以不得不与孙权进献之事混为一谈,这是比较民俗文学的通例;而称象的故事多见于汉译佛典,如北魏吉迦夜共昙所译佛经《杂宝藏经・卷一・弃老国缘》中...
· 阎氏相关寓言
阎氏《疏证》的“科学方法”绝不科学。毛奇龄“旁搜曲引,吹毛索瘢,锻炼成狱”是对阎氏方法的准确描述。胡适“宁可疑而错,不可信而错”则是阎氏方法的“升华”,是A人学术“有罪推定”原则的进一步发展。具有绝大讽刺意味的是,在《古文尚书》“二十五篇”中已经出现倾向于“无罪推定”的思想。在《大禹谟》中,皋陶对帝舜的一段话完整表述了这种倾向:“帝德罔愆,临下以简,御众以宽;罚弗及嗣,赏延于世;宥过无大,刑故无小;罪疑惟轻,功疑惟重。与其杀不辜,宁失不经。好生之德,洽于民心。兹用不犯于有司。”这是一个伟大文明开创时期充满道德和智慧的治政方略。两种思路之间,一则博大仁爱,一则刻薄猥琐。有多少中国学者可以区分?我们是一个什么样文明的传人!本文副标题是“清代考据学存在多大问题的一次检验”。实际上,《古文尚书》问题贯穿中国经学史的全过程。怎么认识孔子之前《书》的性质、用途和影响?孔子是否编定过《书》?其中是否包含...

关于我们

关注族谱网 微信公众号,每日及时查看相关推荐,订阅互动等。

APP下载

下载族谱APP 微信公众号,每日及时查看
扫一扫添加客服微信