OBT商业科技观察

弗洛伊德案引发美国警察数据开源项目:技术能否让执法变得公正、透明?

“乔治·弗洛伊德在美国明尼阿波利斯警方的拘留中被杀害”一事,在美国引发了一场“技术能否改变警察执法”的大讨论。

一个让警察数据可访问的开源项目,也在美国Reddit网站上迅速启动。

“长期以来,尽管美国察执法的信息是公开的,但一直被埋没在这些非常蹩脚或过时的公共信息门户网站里,”发起该项目的克里斯汀·廷斯基说,“是时候作出改变了”。


一个网络号召

5月18日,克里斯汀·廷斯基在美国Reddit社区网站上留下了一个链接声明:“我翻看了法庭记录,找到了那些有污点记录的警察。”

拥有一家营销公司的廷斯基收集了她所居住的棕榈滩县的公共警察记录,并在交通引用和种族等数据标签上写下了她的发现。

她想知道是否有其他Reddit社员也想在他们的县做同样的事情。“如果警察能监视我们,我们就应该监视他们,”她写道。

正是因为乔治·弗洛伊德的死亡过程被目击者现场录制并上传到网上,才让人们发现警察执法过程中的暴虐、歧视和不公正。
 

照片:安格斯·莫丹特/布隆伯格/盖蒂图像公司

当愤怒开始在那个城市的街道上蔓延时,廷斯基选择在Reddit上发起“让警察数据开源”的项目。

“我想我无意中发起了一场运动,”她在5月26日写道,目前几十个人已经加入了她的项目并为之努力。人们不仅仅是出于一时的兴趣而参加。

 

公众无法轻易获得警察执法公开数据

廷斯基无从得知人们为啥加入这个项目,但她发起的这个小型数据挖掘项目的启动时间,与这次美国历史上最大的这个抗议运动的时间相吻合。

数以千计的Reddit社区成员投票支持她的帖子,在子页面r/DataPolice上,大家共同努力收集警察相关的公共记录。他们的使命是:“通过让执法公共记录成为开源的、易于公众获取的记录,让社会变得更加透明和强大。”

目前在美国警界还不存在这种集中的、全国性的数据库。多年来,研究人员、记者和活动人士已经将官方记录,包括从事件报告到不当行为投诉等,作为了解美国警察行为的一个窗口。“问题是,尽管这些数据是公开的,却被埋没在这些非常蹩脚或过时的公共信息门户网站里,”廷斯基说。很少有哪个州能轻易地大规模输出警察执法数据,也很难查阅警察执法情况,整个操作过程也很乏味。

美国有些州要求,公众提出申请,只有获得正式批准之后,才能获得这些文件;有时人们不得不通过起诉方式,以获取这些数据。

一旦数据被下载,它必须被整理、合并和标准化,以创建一个全国性的数据集——这种数据可能有助于研究人员发现种族偏见、过度使用武力或重复不当行为的模式。廷斯基的团队自称,警察数据可访问开源项目,旨在做到这一点。

 

以往的努力

警察数据无障碍项目并不是第一个试图收集警察公共数据进行分析的项目,但之前的努力大多落在了大学和记者身上。政府也曾做过一些努力:联邦调查局在2019年推出了一个新的全国使用暴力或武力情况的数据库,但执法机构自愿参与。

警察数据无障碍项目是一项大众参与的工作。超过2000名感兴趣的互联网用户加入了一个相关的Slack小组,超过6000人订阅了r/DataPolice。(拥有《连线》出版商康德纳斯特(Condé Nast)的高级出版公司是Reddit的股东)

相比较而言,这个项目的规模也更大。与以前受地理或记录类型限制的项目不同,警察数据无障碍项目旨在将全国所有公共警察记录汇集成一个易于搜索的数据库。“决定这个项目能否持续的因素是,当地警察会发布什么?我们想要所有的公共数据,”埃迪·布朗说,他是一名美国陆军老兵,曾担任该组织的首席运营官。

这注定是一项困难的、乏味的的技术性工作。到目前为止,警察数据可访问项目的成员大部分时间都花在构建从数据门户导出文件所需的定制化上,而不是收集数据本身。

有这么多志愿者参与进来,关于这个项目的道德问题也引发很多争论:应该把警察的名字纳入数据库里吗?应该使用像“蓝色泄密”这样的有争议的数据来源吗?这是一个在6月份公布的被盗警察文件的数据库。

该项目的组织者对以上两个问题上都做出了否定的答复,理由是隐私和数据保管的重要性,以及大众对集合的数据拥有合法权利。

 

挑战

该项目规模庞大,加上分散的志愿者队伍,因此面临着一些挑战。

“这当然是一个令人担忧的问题,我们将失去动力,仅仅是因为不能足够好、足够快地组织起来,”廷斯基说。虽然抗议仍在全国各地定期发生,但6月初已达到了顶峰。注意力的转移可能会减弱人们参与的积极性,廷斯基表示,她已经看到数百名“成员”退出了Slack和这个团体。

廷斯基希望人们将继续把数据收集的价值视为一种民事行动。“这是一个技术挑战,”她说,“许多技术型美国人认为他们可以做一些切实可行的事情,这是可行的。”为此,该组织计划将自己从志愿者队伍转变为非营利组织。

埃迪·布朗正在参加斯坦福大学商学院的点火项目,他也成功地将PDAP作为一个风险项目,以进一步发展其商业计划。

廷斯基坚持认为该小组的工作是收集数据,而不是分析数据。她认为,分析数据是一项微妙的任务,最好留给专家去做。

关于警察数据的分析

许多人已经在分析警察数据方面进行研究:2017年,斯坦福大学的研究人员创建了开放式警务项目,以收集和标准化全国交通站点的数据。到目前为止,该公司已经向其存储库中添加了超过2亿条记录,并将其标准化为一个数据库,还发现了针对黑人和西班牙裔司机的系统性偏见的证据。保龄格林大学于2017年创建的亨利·华莱士警察犯罪数据库,是一个对所有50个州的警察所犯罪行进行刑事逮捕的数据库。

这些研究人员发现,只有一小部分警察因在羁押中杀害嫌疑人而被刑事指控,而被定罪的人数更少。

特定城市的项目,如芝加哥的“隐形研究所”的“公民警察数据项目”或纽约的“法律援助协会”的“警察责任项目”,也从公共数据中取得了惊人的发现——比如,有很高比例的官员对他们提出了10次以上的投诉,或者特定官员因不恰当使用武力而被起诉十几次以上,而该部门却没有任何纪律对此加以限制。

一些项目的出现,填补了官方公共记录系统的空白:自2015年以来,《华盛顿邮报》一直试图追踪美国值班警察的每一起致命枪击事件。联邦调查局也收集这些数据,但是因为执法机构的所有贡献都是自愿的,所以这些数据被批评为“不完整”。

警方的数据只能说明事情的一面。警察部门的记录可以忽略很多行为,这些行为一旦被拍摄下来,就会引起公众的愤怒、厌恶和抗议。摄像头的出现表明,例如,在一些警察部门,警察严重低估了他们的武力使用。出于这个原因,一些项目——比如奥克兰的拉希姆——努力从公民那里收集与警方互动的数据,而不是仅仅依靠警方对公共文件的解读。

对研究人员来说,收集数据并做出推论是一回事,但数据本身并不能带来更好的监管。警察改革组织“零运动”的数据科学家塞缪尔·辛扬威说:“被警察杀害的人数并没有逐年下降。”。(根据《邮报》的追踪报道,自2015年以来,美国警方每年都要枪杀大约1000人。)“因此,除了花言巧语和政策建议之外,看看数据分析和分析结果,看看机构是否在做他们所说的事情,变得非常重要。”

 

警察记分卡

一年前,辛扬圭设立了警察记分卡,利用加州的公共数据来评估警察部门,该记分卡发布的记录比大多数州都要详细。

官员们必须在每次互动中报告人口统计信息,比如种族和性别,这被认为是为了更容易追踪偏见。加州警察部门也被要求报告警察使用武力的情况,包括当警察发现嫌疑人持有武器时。辛扬威说:“一些部门有大量(警察)杀人的案件,他们认为那个人有枪,但他们没有枪”。所有这些数据都可以提供线索,说明各部门甚至具体的官员,是否有问题。


归根结底,数据是一种工具,就像任何工具一样,它可能被错误地处理——即使是出于好意。另一个“零运动”项目——“#8CantWait”,提供了一个最新的警示故事。

这场运动是在乔治·弗洛伊德去世后发起的,它推动了一个由八项政策组成的平台,供城市采纳,比如禁止巧克力。

该组织在其网站和社交媒体上表示:“数据证明,这八项政策加在一起可以减少72%的警察暴力行为。”该项目的许多名人支持者都支持这一说法。

然而,深入研究这些数据后,一些批评者发现这个数字具有误导性,而且是基于薄弱的数据科学;其他人指出,在实行类似政策的城市,杀戮仍在继续。

“使用统计数据在很大程度上是一个分析解释的问题,”两位活动家切雷尔·布朗和菲利普·麦克哈里斯在一篇批评该运动并要求删除这些统计数据的帖子中写道。“当人们调用数据和统计数据时,它可以充当经验证据的外衣,使得某些东西难以批判。警方也使用统计数据,并以某种方式来解释他们的行为。”

随后,#8CantWait项目更新了其平台声明。(辛扬威本人发表声明,承认竞选活动的开展和信息传递是“有缺陷的”,“40年的研究表明,使用武力标准越严格的地方越不容易杀人,但要证明因果关系却极其困难”。)

尽管如此,数据仍然是理解美国执法现状和未来的重要一环。让这些信息更容易获取,让人们讲述的关于警务的故事更透明,这只是第一步。