读人工不智能:计算机如何误解世界笔记04_数据新闻学

1. 计算化和数据化的变革

1.1. 每一个领域都在进行计算化和数据化的变革

1.1.1. 出现了计算社会科学、计算生物学、计算化学或其他数字人文学科

1.1.2. 生活已走向计算化,人们却一点也没有变

1.2. 在如今的计算化和数据化世界中,调查性新闻的实践必须依靠高科技

1.3. 视觉艺术家使用诸如Processing之类的编程语言来创建多媒体艺术作品

1.4. 3D打印技术让雕塑家能够更深入地探索艺术的物理可行性

2. 数据新闻学

2.1. 数据记者

2.1.1. 拓宽了新闻学中应用技术的边界

2.2. 数据记者首先是记者

2.2.1. 使用数据作为原始资料,使用各种数字工具和平台来讲述新闻

2.2.2. 数据记者倾向于依赖既定的学术研究方法

2.3. 好记者

2.3.1. 首先要知道何时求助于相关学科的专家

2.3.2. 其次要认清专家和骗子的区别

2.4. 美国政府的一举一动在默认情况下都是公开的

2.4.1. 公开了政府数据,不代表消灭了腐败

2.5. 佛罗里达州还有“阳光法律”,保证公众可以访问这些资料,也保证了相关磁带、照片、影片和录音都是公开的

2.5.1. 大限度地公开档案法条意味着人们可以轻易获取政府的官方数据,这也就意味着大量数据新闻都与佛罗里达州有关

2.6. 有些数据记者会从官方渠道获取数据,并对其进行分析,以找到看点

2.6.1. 在佐治亚州,每三名因与病人发生不当性行为而受处罚的医生中,就有两名被允许再次执业

2.6.1.1. 分析了1999年到2015年超过10万份针对医生的医委会调查令
2.6.1.2. 全国各地都有医生因虐待患者而获罪,却又获准恢复行医资格

2.6.2. 数据记者曾坐在高速公路边,记录警车经过的时间

2.6.2.1. 从收费站的警察应答器中获取数据,发现当地警察普遍以危及公民安全的高速行驶
2.6.2.2. 调查结束后,警察超速驾驶的比例下降了84%

2.6.3. 查看了50个州的警察对公民的截停记录数据

2.6.3.1. 在每个州,有色人种被警察截停的情况都要比白种人多得多

2.7. 学术研究是数据新闻的重要补充

2.8. 数据新闻学还包括对算法的问责报道

2.8.1. 在民主政体中,新闻自由的职能一直是问责决策者

2.8.2. 算法问责报道也承担着同样的职能,并将其应用到计算世界

2.8.3. 逆向工程算法是算法问责决策者的一部分

2.8.3.1. 论文《算法的责任——计算结构下的新闻调查》(“Algorithmic Accountability:Journalistic Investigation of Computational Power Structures”)
2.8.3.2. 2012年,C. W. 安德森发表了研究论文《关于计算与算法新闻的社会学》(“Towards a Sociology of Computational and Algorithmic Journalism”)

2.9. 算法,或计算过程,正被越来越多地用于替代我们做决策

2.9.1. 算法决定了我们在网上购物时看到的订书机的标价,也决定了我们购买医疗保险的价格

2.9.2. 当你通过线上招聘网站提交求职申请或投递简历时,就会有一个算法决定你是否符合标准,符合则交由人类做下一步评估,否则直接回绝你的申请

3. 数据驱动的调查报道

3.1. 在新闻报道中使用数据不是什么新鲜事,这件事要比大多数人想象的更早

3.2. 最早由数据驱动的调查报道出现在1967年

3.2.1. 菲利普·迈耶

3.2.2. 《底特律自由报》

3.2.3. 分析了有关底特律种族暴动的数据

3.2.3.1. 暴动的参与者来自社会各阶层

3.2.4. 获得了普利策新闻奖

3.2.5. 精确性报道

3.3. “精确性报道”也就演化成了“计算机辅助报道”

3.4. 计算机辅助报道又演化成如今的“数据新闻”

3.4.1. 视觉新闻、计算新闻、绘图、数据分析、机器人构建和算法问责报告

3.4.2. 这些故事有时是爆炸性新闻,有时是娱乐性新闻,有时是调查性新闻

3.4.3. 这些新闻的信息量通常都很大

3.5. 《华尔街日报》对价格歧视现象的调查

3.5.1. 诸如史泰博和家得宝之类的大型连锁超市在他们的网站上,会根据邮政编码判断访客可能所在的地区,并且对不同地区的访客收取不同的价格

3.5.2. 邮政编码所在地区较富裕的顾客比邮政编码所在地区较贫穷的顾客收费低

3.6. 影响力大的调查数据新闻报道的制作成本高达数十万美元

3.7. 如今做新闻还得学会阅读数据,使用工具来分析数据,并且找出其中有意思的部分

3.8. 不偏不倚地看待数据分析结果,并且按最合适的方式整合数据,把握国内现状,从而真正去帮助人们

4. 机器偏见

4.1. ProPublica的记者发现,司法量刑使用的一种算法对非裔美国人有偏见

4.2. 计算机中一个名为“替代性制裁惩教罪犯管理”(Correctional Offender Management Profiling for AlternativeSanctions,简称COMPAS)的算法,会计算出一项分数,“预测”出该疑犯在未来犯罪的可能性

4.2.1. 目的是让法官能够在量刑时做出更为“客观”且由数据驱动的决定

4.2.2. 其结果是非裔美国人获得的刑期比白种人更长

4.2.3. 技术沙文主义蒙蔽了COMPAS的设计者,他们意识不到他们的算法可能会对人们造成怎样的伤害

4.3. 计算机在发展,而人类的本性却没有进化

4.3.1. 人只有被监督,才能真正诚实

4.4. 如果你相信计算机做的决定比人类做的决定更高明,那么就代表你全然信赖那些输入系统的数据的有效性

4.4.1. 无用数据入、无用数据出

4.4.2. 如果你输入的是垃圾,那么输出的也一定是垃圾

4.5. 我们要对这些算法以及算法的制作者存疑,看算法是在让世界变得更美好还是更糟糕

4.6. 你可以质疑技术上的虚假说辞,发现当今计算系统中的不公与不平等

4.7. 质疑可能的错漏之处,能让我们远离盲目的技术乐观主义,让我们的看法变得更加合理和中立

4.8. 我们的生活才能因技术而变得更好,而不至于受到技术的牵制,或需要对技术做出让步

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2812022.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

掌握ChatGPT润色绝技:什么是人工智能写作以及如何使用它来完成写作任务

如对AI写论文感兴趣,欢迎添加作者wx讨论 : ryan_2982 人工智能 (AI) 的出现开创了技术进步的新时代,彻底改变了包括写作和内容创作在内的各个行业。人工智能写作和人工智能提示已成为可以简化和增强写作任务的强大工具。在这篇博文中,我们将…

2018-02-14 新闻内容爬虫【上学时做论文自己爬新闻数据,原谅我自己懒发的图片】

2018-02-14新闻内容爬虫【上学时做论文自己爬新闻数据,原谅我自己懒发的图片】资源-CSDN文库https://download.csdn.net/download/liuzhuchen/88878591爬虫过的站点: 1QQ新闻 1,准备爬取滚动新闻页面 2 通过F12 开发工具查找发现&#xff…

k8s节点负载使用情况分析命令kubectl describe node [node-name]

1.到任意安装了kubectl节点命令的节点上执行kubectl describe node [node-name] 上面的Requests最小分配 Limits最大分配是所有pod之和,最小分配之和不能超过服务器实际参数,否则新的pod会因为资源不够起不来,最大分配是预设之和&#xff0…

office word保存pdf高质量设置

1 采用第三方pdf功能生成 分辨率越大质量越好

leetcode(算法) 83.删除排序链表中的重复元素(python版)

需求 给定一个已排序的链表的头 head , 删除所有重复的元素,使每个元素只出现一次 。返回 已排序的链表 。 示例 1: 输入:head [1,1,2] 输出:[1,2] 示例 2: 输入:head [1,1,2,3,3] 输出&…

Android WebView访问网页+自动播放视频+自动全屏+切换横屏

一、引言 近期,我发现电视家、火星直播等在线看电视直播的软件都已倒闭,而我奶奶也再无法通过这些平台看电视了。她已六十多岁,快七十岁啦。这些平台的倒下对我来说其实没有多大的影响,但是对于文化不多的她而言,生活中…

大模型学习笔记四:LangChain开发框架解析

文章目录 一、langChain核心组件介绍二、模块I/O封装1)多轮对话 Session 封装2)模型的输入(1)Prompt模板封装(2)从文件加载Prompt模板 3)模型的输出(1)Pydantic (JSON) P…

c入门第二十四篇: 学生成绩管理系统优化(可执行文件传参)

前言 我:“师弟,review完你的代码之后,你觉得有没有什么地方可以优化?” 师弟一脸懵。 我:“比如,你把客户端和服务端的可执行文件生成之后,我把服务端部署到我的测试机器上,客户端…

通过css修改video标签的原生样式

通过css修改video标签的原生样式 描述实现结果 描述 修改video标签的原生样式 实现 在控制台中打开设置,勾选显示用户代理 shadow DOM,就可以审查video标签的内部样式了 箭头处标出来的就是shodow DOM的内容,这些内容正常不可见的&#x…

下载huggingface数据集到本地并读取.arrow文件遇到的问题

文章目录 1. 524MB中文维基百科语料(需要下载的数据集)2. 下载 hugging face 网站上的数据集3. 读取 .arrow 文件报错代码4. 纠正后代码 1. 524MB中文维基百科语料(需要下载的数据集) 2. 下载 hugging face 网站上的数据集 要将H…

07_第七章 前端工程化(es6,Vue3,Element_plus组件库)

文章目录 第七章 前端工程化一、前端工程化开篇1.1 什么是前端工程化1.2 前端工程化实现技术栈 二、ECMA6Script2.1. es6的介绍2.2 es6的变量和模板字符串2.3 es6的解构表达式2.4 es6的箭头函数2.4.1 声明和特点2.4.2 实践和应用场景2.4.3 rest和spread 2.5 es6的对象创建和拷贝…

绝地求生:春节部分活动将结束,3月有新版本上线,通行证不偷懒可换成长型

嗨,我是闲游盒~ 感觉过年就在眼前但是已经结束了,时间过的太快了又回归了工作的生活中,而年前更新的28.1新春版本也进行到了小一半的进度。 ◆ 春节版本部分活动即将结束 在大厅首页右上角的活动中心里,春节积分商店和觉醒之旅活动…

MATLAB环境下一种改进的瞬时频率(IF)估计方法

相对于频率成分单一、周期性强的平稳信号来说,具有非平稳、非周期、非可积特性的非平稳信号更普遍地存在于自然界中。调频信号作为非平稳信号的一种,由于其频率时变、距离分辨率高、截获率低等特性,被广泛应用于雷达、地震勘测等领域。调频信…

sqllabs第46关 order by 注入(通过盲注)

打开第46关 提示我们(请将参数输入为sort(带数值)) 用sort注入排序 尝试操作 order by注入 什么是order by 在MySQL支持使用ORDER BY语句对查询结果集进行排序处理,使用ORDER BY语句不仅支持对单列数据的排序,还支持对数据表中…

vulnhub----hackme2-DHCP靶机

文章目录 一,信息收集1.网段探测2.端口扫描3.目录扫描 二,信息分析三,sql注入1.判断SQL注入2.查询显示位3.查询注入点4.查询库5.查询表6.查字段7. 查user表中的值8.登陆superadmin用户 四,漏洞利用文件上传命令执行蚁剑连接 五&am…

商家入驻平台怎么让资金自动分配给商家

最近很多上线了多商户电商系统的朋友咨询,我们平台的用户支付后,钱进入了我们的对公账户,怎样让钱在走完流程后,自动进入商家的账户呢?今天商淘云为您分享商户入驻平台自动分配给商家资金的三种方法。 首先是平台应建立…

k8s二进制部署的搭建

1.1 常见k8s安装部署方式 ●Minikube Minikube是一个工具,可以在本地快速运行一个单节点微型K8S,仅用于学习、预览K8S的一些特性使用。 部署地址:Install Tools | Kubernetes ●Kubeadm Kubeadm也是一个工具,提供kubeadm init…

Java根据excel模版导出Excel(easyexcel、poi)——含项目测试例子拿来即用

Java根据excel模版导出Excel(easyexcel、poi)——含项目测试例子拿来即用 1. 前言1.1 关于Excel的一般导出2.2 关于easyexcel的根据模版导出 2. 先看效果2.1 模版2.2 效果 3. 代码实现(核心代码)3.1 项目代码结构3.2 静态填充例子…

数字电路 第四章—第一节(触发器——概述)

一、对触发器的基本要求 1、触发器的概念 在数字电路中,基本的工作信号是二进制数字信号和两状态逻辑信号,而触发器就是存放这些信号的单元电路。 2、对触发器的基本要求 (1)具有两个稳定状态——0状态和1状态,以正…

负载均衡.

简介: 将请求/数据【均匀】分摊到多个操作单元上执行,负载均衡的关键在于【均匀】。 负载均衡的分类: 网络通信分类 四层负载均衡:基于 IP 地址和端口进行请求的转发。七层负载均衡:根据访问用户的 HTTP 请求头、URL 信息将请求转发到特定的主机。 载体维度分类 硬…