美国中文网首页博客首页美食专栏

ImYoona //www.sinovision.net/?70618 [收藏] [复制] [分享] [RSS] txgz999@yahoo.com

分享到微信朋友圈 ×

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

博文

柴静视频中图示的解读

(/11)

浏览次数:20278

上一篇:万紫千红
下一篇:我喜欢这样的美中网编辑

刚表态过的朋友 (3 人)

收藏站内分享举报

分享《柴静视频中图示的解读》

全部作者的其他最新博文

发表评论评论 (183 个评论)

回复黄河魂的博客 2022-11-15 06:30: 柴静是我老乡，离开CCTV有点可惜！

回复张泗洋 2015-8-4 04:01: 哈哈哈哈哈，方在操蛋

回复方枪枪 2015-3-27 15:07: 在美一方: never too late to learn

冒个泡就跑。。。。
http://blog.sinovision.net/home/space/do/blog/uid/70618/id/250762.html

下次来这找我。：）

回复在美一方 2015-3-27 15:01: 方枪枪: 都把天香害了，人家现在看统计学视频。现学。
never too late to learn

冒个泡就跑。。。。

回复方枪枪 2015-3-26 20:57: 在美一方: 你文科了你
都把天香害了，人家现在看统计学视频。现学。

回复在美一方 2015-3-23 23:57: 随笔: 可我脑袋里就是这么反应滴。
你文科了你

回复岳东晓 2015-3-23 23:53: 随笔: 其实，我们再继续深究也没什么意义了，常常，主观不是可以被客观改变的。
目前我们的议题已经转移到论文的可信度问题。雾霾ＰＭ值是观测数据，它是什么就是什么，这个数据是客观存在。

图6上面的黑柱是PM2.5的平均值。我与另一位人士的分析表明，这些黑柱的PM2.5值仅仅是各年雾霾的参考数字，可有可无，图６曲线的数据与这个平均值没有关系，黑柱对该图的雾霾毒性与PM2.5的关系的分析没有影响。

回复随笔 2015-3-23 23:39: 在美一方: 我没这么说吧？
可我脑袋里就是这么反应滴。

回复随笔 2015-3-23 23:37: 岳东晓: 标准差的定义与统计分布无关。正态分布只是我举的一个例子，说明在这种分布下标准差与平均值之间可以没有关系，而是独立的。我可以构造一种统计分布，其标准差小 ...
其实，我们再继续深究也没什么意义了，常常，主观不是可以被客观改变的。

回复在美一方 2015-3-23 23:32: 随笔: 谢谢科普，现在基本可以把雾霾和毒气对等了.
我没这么说吧？

回复在美一方 2015-3-23 23:31: 随笔: 不知有多少人会相信pm达到200，某种疾病的死亡率会上升26%，而且是当天，立竿见影。按两倍的关系计算，pm500时，医院就变殡仪馆了。
我对pm以前不是很清楚，现在 ...
好像还是有人相信的，我看

回复随笔 2015-3-23 23:23: 在美一方: 至于“从医学的角度看，雾霾会不会对心血管系统的疾病产生影响？”

应该会，但是影响多大，我不知道，也许可能挺严重。可是，严重不严重的，有横向比较也有纵向 ...
谢谢科普，现在基本可以把雾霾和毒气对等了.

回复随笔 2015-3-23 23:21: 在美一方: 昨天这条是吃寿司时候用手机回的，非常简短，也许没能说明问题。现在重新说一遍。

表一里面数据很有意思。PM2.5 是【2 435】，但是明显不是平均分布，其P75 就 ...
不知有多少人会相信pm达到200，某种疾病的死亡率会上升26%，而且是当天，立竿见影。按两倍的关系计算，pm500时，医院就变殡仪馆了。
我对pm以前不是很清楚，现在在我脑袋瓜里雾霾比SAS病毒还可怕。

回复岳东晓 2015-3-23 22:48: 随笔: 标准差不仅用来计算正态分布，也可以直接描绘原始数据的离散程度，说明平均数的代表性。平均数表明的是数据的集中程度，标准差表明了数据的离散程度。

“-1， 5 ...
标准差的定义与统计分布无关。正态分布只是我举的一个例子，说明在这种分布下标准差与平均值之间可以没有关系，而是独立的。我可以构造一种统计分布，其标准差小于平均值，我也可以构造一种分布，标准差大于平均值。因此，单从标准差大于平均值不能说明分布没有统计规律。

就雾霾的ＰＭ值来说，其变化可能完全没有规律（包括统计规律）。但即使ＰＭ值变化无规律，不能说明ＰＭ值与死亡数没有关联。我举个例子（仅仅是例子），假设ＰＭ值变化毫无规律，一天是0,一天是500，但somehow 死亡数增加总是等于PM值的2倍，这两者之间就是一个线性的关联。

我想，你的意思可能是，当standard deviation大于平均值，那么平均值缺乏代表意义。

回复在美一方 2015-3-23 22:18: 随笔: 我对论文的看法更多基于对其统计方法的分析，从不同的角度看这篇论文会得出不同的结论。
有件事想请教你，从医学的角度看，雾霾会不会对心血管系统的疾病产生影 ...
至于“从医学的角度看，雾霾会不会对心血管系统的疾病产生影响？”

应该会，但是影响多大，我不知道，也许可能挺严重。可是，严重不严重的，有横向比较也有纵向比较。横向比较就是和其它 risk factors 相比，纵向就是有没有剂量效应，如果有，是怎样的。

回复在美一方 2015-3-23 22:12: 随笔: 我对论文的看法更多基于对其统计方法的分析，从不同的角度看这篇论文会得出不同的结论。
有件事想请教你，从医学的角度看，雾霾会不会对心血管系统的疾病产生影 ...
昨天这条是吃寿司时候用手机回的，非常简短，也许没能说明问题。现在重新说一遍。

表一里面数据很有意思。PM2.5 是【2 435】，但是明显不是平均分布，其P75 就已经是105了，可见200以上的数据相当少，这个从图一也可以看出来，估计200以上的数据可以用罕见来形容。

图3是剂量-效应曲线。既然原始数据里面200以上罕见，只要是用实际数据而非理论根据建模，无论建什么样sophisticated的模型，其估值的定义域都不应该超出建模所用的定义域。所以，我的意思是，图3的剂量效应曲线，200以上的都是臆想，更枉说用 PM2.5=10 时候的 CM% increase 为1.38% 来推算PM2.5 =200 时候的26%了。

就在这两天，我看到英国的一项研究表明，乳腺癌预后估算模型，由于建模时候40岁以下患者的数据相对缺乏（并非完全没有），而导致对40岁以下患者的预后估算的某些项目非常不准确。这样的巨大误差，不仅对选择医疗手段有影响，对各种教育预防措施的指导投入也有不小的副作用。

类似的，这篇论文里面的模型，由于建模数据中 PM2.5 接近200 的先天不足，完全不能用于估算 PM2.5 达到200时候的情形。

回复随笔 2015-3-23 18:41: 岳东晓: 我对这句话不理解：“标准差超过了平均数，这样的数据毫无规律可言”。

对于正态分布来说，

p ~ exp [- (x-a)^2/2s^2 ] ，a 为平均，s 为标准差，

平均值与标 ...
标准差不仅用来计算正态分布，也可以直接描绘原始数据的离散程度，说明平均数的代表性。平均数表明的是数据的集中程度，标准差表明了数据的离散程度。

“-1， 50， 101” 的平均数为50；“49， 50， 51”的平均数也是50，这是两组完全不同意义的平均值。

前一组的平均数为50，如此分散的数据的标准差还不到“正负59”，可想而知，那组pm2.5－10的数据（平均数50，标准差正负59）长的什么鬼样子了。

统计的结果是否科学，数据是关键，模型其次。平均数，标准差代表的是客观事实。周末我也看了看大家的讨论，其中一个重点讨论是，在报告中应该选用什么模型更合适数据分析。我说的可能重了，用模型去修正数据就等于用主观去修正客观，一群毫无关联的数据，总能找出模型把它描绘成完美的曲线。

我们不是在讨论pm是否和死亡率有关，而是它们之间的关联程度. 注意概念，我们讨论的是同天雾霾和同天死亡率的关系。对于眼睛和逻辑就能分出来的没有明显趋势，没有高度相关的数据去找趋势，找相关系数，结果100%的match我也不会相信。

我的看法也仅对此论文和柴静的报告而言。没有一篇论文是完美的，特别是统计论文，不能说有瑕疵就不去研究分析，但在用这些结果时应该慎重，柴静报告里的这张图用的太草率了。

回复岳东晓 2015-3-23 00:37: 随笔: 模型是一方面，数据可能也有问题，不是随便一堆数据都可以进行趋势和相关分析的，我觉得这是论文的致命弱点。

我们看不到原始数据，但通过table1的数据能略知一 ...
我对这句话不理解：“标准差超过了平均数，这样的数据毫无规律可言”。

对于正态分布来说，

p ~ exp [- (x-a)^2/2s^2 ] ，a 为平均，s 为标准差，

平均值与标准差是独立的。

另外，雾霾PM值没有规律也不能说明PM值与死亡数不相关。

回复随笔 2015-3-22 22:34: 在美一方: 比较一下图1和后来那个exposure-response图，我不认为以图1报告的数据分布做出那个dose-response 曲线是 valid and justified. 这是我说的文章很有问题之一，也 ...
我对论文的看法更多基于对其统计方法的分析，从不同的角度看这篇论文会得出不同的结论。
有件事想请教你，从医学的角度看，雾霾会不会对心血管系统的疾病产生影响？

回复随笔 2015-3-22 22:26: 岳东晓: 论文作为起点的数学模型可能存在问题，导致只能在线性近似下成立。不过，类似的文献也是用类似的模型。雾霾的影响实际是以指数形式出现，其余的因素用 non-param ...
模型是一方面，数据可能也有问题，不是随便一堆数据都可以进行趋势和相关分析的，我觉得这是论文的致命弱点。

我们看不到原始数据，但通过table1的数据能略知一二。下面是table1中第三排的数据：

根据pm2.5-10计算出的平均数是50，标准差高达－59到+59，也就是说平均数是根据一群从－9到109（大约）的数值计算出来的。

标准差超过了平均数，这样的数据毫无规律可言，再好的模型也得不出科学的结果。这一点论文的结论已经自证，pm2.5-10这组数据和其它三个指标找不到相互的关系，这个结论是必然的。

另外，用同日的雾霾指数和死亡率进行对比就是把不相干的两件事配对，违反基本常识。如果不考虑死亡滞后因素，即使算出高相关系数，也是瞎猫撞上死耗子，没什么实际意义。

这些问题可以从论文里看到，基于资料的局限性论文本身是无法解决的。

12 3 4 5 6 7 8 9 10 / 10 页下一页

关于我们| 节目信息| 反馈意见 | 联系我们| 招聘信息| 返回手机版| 美国中文网

©2024 美国中文网 Sinovision,Inc. All Rights Reserved. TOP

回顶部