(2014)什么科学理念应该准备退休 -- 标准差 by Nassim Nicholas Taleb

标准差(Standard Deviation)在科学领域引起了广泛的困惑,现在是将其从常用的统计方法中替换为平均偏差(one of mean deviation, 比如 MAD )的时候了。

原文链接:2014 : WHAT SCIENTIFIC IDEA IS READY FOR RETIREMENT?

标准差(STD)应该留给数学家、物理学家和数学统计学家推导极限定理。在计算机时代,使用标准差进行统计分析并没有科学依据,其缺点在社会科学等领域更为明显,因为人们往往不加选择地机械地应用它来解决问题。

假设有人刚刚要求您测量过去五天内您所在城镇的气温(或公司的股票价格,或您叔叔的血压)的“平均每日变化”。这五个变化是:(-23, 7, -3, 20, -1)。你会怎么做呢?

我们有两种方法:均方根偏差和 MAD。均方根偏差的计算结果为15.7,而MAD的结果为10.8,后者更接近实际情况(reality)。事实上,每当人们在获得标准差数后做出决定时,他们都会表现得这个值是平均偏差的期望(the expected mean deviation)。

这一切都源于一次历史偶然:1893 年,伟大的卡尔·皮尔逊 (Karl Pearson) 为所谓的“均方根误差” "root mean square error" 引入了“标准差” "standard deviation" 一词。混乱从那时开始:人们认为这意味着平均偏差。这个想法一直存在:每次报纸试图澄清市场“波动性”"volatility" 的概念时,虽然口头上定义为平均偏差,但给出的数值测量却是更高的标准差。

不仅是记者,我也注意到商务部和美联储的官方文件、甚至是市场波动性声明中的监管机构也存在这种混淆。更糟糕的是,我们发现许多数据科学家(包括许多拥有博士学位的)在实际中也会混淆两者。

这种混淆源于对非直观事物的错误术语。由于心理偏差,一些人会将 MAD 误认为 STD,因为前者更容易被想到。

MAD在样本测量中更准确、波动性更小,因为它自然加权,而标准差将观测值本身作为权重,对大的观测值赋予大的权重,从而过分强调尾部事件。

我们常在方程中使用 STD,但实际上经常在过程中将其转换为 MAD(例如在金融领域的期权定价)。在高斯世界中,STD约为MAD的1.25倍,即。但在随机波动性中,STD 常常高达 MAD 的1.6倍。

许多统计现象和过程有“无限方差”(如著名的帕累托80/20规则),但具有有限且非常规范的平均绝对偏差。只要存在平均值,就存在 MAD。反之(无限MAD 和有限 STD)则不成立。

许多经济学家因混淆而忽视了“无限方差”模型,以为这意味着“无限平均偏差”。五十年前,当伟大的本诺特·曼德尔布罗特提出他的无限方差模型时,经济学家因混淆而恐慌。

这样一个小问题导致了大量混淆:我们的科学工具远远领先于我们的日常直觉,这对科学而言开始成为一个问题。因此,我以罗纳德·A·费舍尔爵士的话作结:“统计学家不能逃避理解他所应用或推荐的流程的责任。”

社会和生物科学的概率问题不止这些:研究者使用罐头式的统计概念而不理解它们,滥用 "n of 1"、"n large", or "this is anecdotal" (for a large Black Swan style deviation),将 anecdotes 误为信息、信息误为 anecdotes 。事实上,大多数人在“声望很高”的期刊上使用回归分析,却不真正明白其含义及其所能(和不能)作出的声明。由于缺乏现实检验和风险投入,加之伪复杂性的外衣,社会科学家可能会在概率问题上犯下基本错误,却仍能在职业上蓬勃发展。

指北君续个狗尾

塔勒布写的很好,指北君尝试狗尾续貂补充一下。

塔勒布说的 one of mean deviation,一般是指 MAD。MAD 在实际中一般指平均绝对偏差(the mean absolute deviation),但在有时候有人也会用它来指代中值绝对偏差(the median absolute deviation)。这两个指标其实都是平均绝对偏差Average absolute deviation 中的一种,在下式中,只不过是选取了不同的

在机器学习中,和 STD 以及 MAD 相关的概念就是 RMSE (Root Mean Squared Error) 和 MAE (Mean Absolute Error) 了。逻辑和上面也是一样。比如对于有 Outliers 的数据来说,选取不同的优化目标,会得到不同的拟合。

alt

塔勒布说的这个原因也是各种量化模型中选取 MAE 为预测指标的一个原因。

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2779439.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

幻兽帕鲁服务器价格大PK,阿里云、腾讯云和华为云?

2024年幻兽帕鲁服务器价格表更新,阿里云、腾讯云和华为云Palworld服务器报价大全,4核16G幻兽帕鲁专用服务器阿里云26元、腾讯云32元、华为云26元,幻兽帕鲁专用服务器4核16G、8核32G、16核32G等配置,公网带宽10M、12M、15M、22M及3…

【UE 游戏编程基础知识】

目录 0 引言1 基础知识1.1 拓展:3D数学和计算机图形学的关系 🙋‍♂️ 作者:海码007📜 专栏:UE虚幻引擎专栏💥 标题:【UE 游戏编程基础知识】❣️ 寄语:书到用时方恨少,事…

Blazor SSR/WASM IDS/OIDC 单点登录授权实例4 - 部署服务端/独立WASM端授权

目录: OpenID 与 OAuth2 基础知识Blazor wasm Google 登录Blazor wasm Gitee 码云登录Blazor SSR/WASM IDS/OIDC 单点登录授权实例1-建立和配置IDS身份验证服务Blazor SSR/WASM IDS/OIDC 单点登录授权实例2-登录信息组件wasmBlazor SSR/WASM IDS/OIDC 单点登录授权实例3-服务端…

探索现代Web前端开发框架:选择最适合你的工具

在当今快速发展的Web开发领域,前端开发框架的选择显得尤为关键。这些框架可以帮助我们更高效地构建出交互性强、性能卓越的用户界面。本文将带你了解几个当前最受欢迎的Web前端开发框架,并帮助你根据自己的需求选择最合适的工具。 1. React React由Fac…

Linux操作系统基础(七):Linux常见命令(二)

文章目录 Linux常见命令(二) 一、kill命令 二、ifconfig命令 三、clear命令 四、重启与关机命令 五、which命令 六、hostname命令 七、grep命令 八、|管道 九、useradd命令 十、userdel命令 十一、tar命令 十二、su命令 十三、ps命令 Linu…

【JavaEE】传输层网络协议

传输层网络协议 1. UDP协议 1.1 特点 面向数据报(DatagramSocket)数据报大小限制为64k全双工不可靠传输有接收缓冲区,无发送缓冲区 UDP的特点,我理解起来就是工人组成的**“人工传送带”**: 面向数据报(…

第6章 智能租房——前期准备

学习目标 了解智能租房项目,能够说出项目中各模块包含的功能 熟悉智能租房项目的开发模式与运行机制,能够复述项目的开发模式与运行机制 掌握智能租房项目的创建,能够独立创建智能租房项目 掌握智能租房项目的配置,能够为智能租…

Deepin基本环境查看(九)【被封印的创世神】

文章目录 - 相关文章目录1、概述2、Deepin中的创世神和管理员1)创世神root2)root被封印原因3)其他的神灵【管理员】 3、神殿管理【su与sudo】1)su(Switch User)2)sudo(Superuser Do&…

2024-2-11-复习作业

1> 要求&#xff1a; 源代码&#xff1a; #include <stdio.h> int fun(int n) {if(n0) return 1;return n*fun(n-1); } int main(int argc, char const *argv[]) {/* code */int n;printf("enter n :");scanf("%d",&n);int sfun(n);printf(…

(已解决)将overleaf上的文章paper上传到arxiv上遇到的问题。

文章目录 前言初级问题后续问题 前言 首先说一点&#xff0c;将paper的pdf文件直接上传arxiv是不行的&#xff0c;arxiv要求我们要上传源文件&#xff0c;所以才这么麻烦。 初级问题 首先上传文件之后有可能会在下面这个界面出现问题&#xff0c;这里一般都比较常见的问题&a…

OpenCV入门:图像处理的基石

在数字图像处理领域&#xff0c;OpenCV&#xff08;开源计算机视觉库&#xff09;是一个不可或缺的工具。它包含了一系列强大的算法和函数&#xff0c;使得开发者可以轻松地处理图像和视频数据。本文将带你走进OpenCV的世界&#xff0c;了解其基本概念和常见应用。 1. OpenCV简…

了解数据治理体系化建模

目录 一、走近数据体系化建模 &#xff08;一&#xff09;软件体系化建模 &#xff08;二&#xff09;数据体系化建模 二、数据体系化建模实践 三、数据管理考量思考 &#xff08;一&#xff09;数据质量方面的考量 &#xff08;二&#xff09;数据安全、合规方面的考量…

机器学习:特征工程笔记

在实践中&#xff0c;收集到的数据往往是不完整、含有噪声和不一致的&#xff0c;这对模型的性能构成挑战&#xff0c;因为其很大程度上依赖于输入数据的质量&#xff0c;因此&#xff0c;特征工程应运而生。特征工程是数据预处理和机器学习的重要环节&#xff0c;包括从原始数…

sheng的学习笔记-docker部署数据库oracle,mysql

部署目录&#xff1a;sheng的学习笔记-部署-目录-CSDN博客 docker基础知识可参考 sheng的学习笔记-docker部署&#xff0c;原理图&#xff0c;命令&#xff0c;用idea设置docker docker安装数据库 mac版本 安装oracle 下载oracle镜像 打开终端&#xff0c;输入 docker s…

服务器被黑,安装Linux RootKit木马

前言 疫情还没有结束&#xff0c;放假只能猫家里继续分析和研究最新的攻击技术和样本了&#xff0c;正好前段时间群里有人说服务器被黑&#xff0c;然后扔了个样本在群里&#xff0c;今天咱就拿这个样本开刀&#xff0c;给大家研究一下这个样本究竟是个啥&#xff0c;顺便也给…

gem5学习(17):ARM功耗建模——ARM Power Modelling

目录 一、Dynamic Power States 二、Power Usage Types 三、MathExprPowerModels 四、Extending an existing simulation 五、Stat dump frequency 六、Common Problems 官网教程&#xff1a;gem5: ARM Power Modelling 通过使用gem5中已记录的各种统计数据&#xff0c;…

Java:字符集、IO流 --黑马笔记

一、字符集 1.1 字符集的来历 我们知道计算机是美国人发明的&#xff0c;由于计算机能够处理的数据只能是0和1组成的二进制数据&#xff0c;为了让计算机能够处理字符&#xff0c;于是美国人就把他们会用到的每一个字符进行了编码&#xff08;所谓编码&#xff0c;就是为一个…

《CSS 简易速速上手小册》第3章:CSS 响应式设计(2024 最新版)

文章目录 3.1 媒体查询基础&#xff1a;网页的智能眼镜3.1.1 基础知识3.1.2 重点案例&#xff1a;适应三种设备的响应式布局3.1.3 拓展案例 1&#xff1a;改变字体大小3.1.4 拓展案例 2&#xff1a;暗模式适配 3.2 响应式图片和视频&#xff1a;让内容自由呼吸3.2.1 基础知识3.…

猫头虎分享已解决Bug | Go Error: cannot use str (type string) as type int in assignment

博主猫头虎的技术世界 &#x1f31f; 欢迎来到猫头虎的博客 — 探索技术的无限可能&#xff01; 专栏链接&#xff1a; &#x1f517; 精选专栏&#xff1a; 《面试题大全》 — 面试准备的宝典&#xff01;《IDEA开发秘籍》 — 提升你的IDEA技能&#xff01;《100天精通鸿蒙》 …

【linux系统体验】-archlinux简易折腾

archlinux 一、系统安装二、系统配置及美化2.1 中文输入法2.2 安装virtualbox增强工具2.3 终端美化2.4 桌面面板美化 三、问题总结3.1 一、系统安装 安装步骤人们已经总结了很多很全: Arch Linux图文安装教程 大体步骤&#xff1a; 磁盘分区安装 Linux内核配置系统&#xff…