技术如何塑造选举、隐私和民主

2016年初,随着唐纳德·特朗普的总统竞选从共和党中脱颖而出,希拉里·克林顿在漫长的民主党初选季节中与伯尼·桑德斯展开斗争,计算机科学家拉坦娅·斯威尼启动了一项新的研究项目。十多年来,信息技术在美国政治中变得越来越重要。到那一年的选举中,社交媒体、在线竞选和数字选民记录似乎无处不在。因此,斯威尼,身为单位和技术实践的教授,决定比平时更密切地关注这次选举。

她和一组学生开始研究技术创新与选举过程交汇的地方。“我们想看看,”她说,“技术如何可能让一切出错。”他们确实做到了。在北卡罗来纳州三月份初选前几周,斯威尼和她的班级发现,当选民在选举委员会网站上搜索他们的投票站时,得到的是错误的信息。(她和她的学生建立了一项网络服务,为全国各地的选民提供正确的信息。)在另一个实验中,他们发现35个州和哥伦比亚特区的在线选民注册系统容易受到身份盗窃的影响:

黑客可以更改选民的住址或党派隶属关系,申请缺席投票,或者完全删除记录——这一切都只需几条公开或易于购买的信息。随着竞选的推进,斯威尼和她的学生发现了另一件事:一些Twitter账号由她称之为“人格机器人”的假装是真人的机器人运营,这些假账号有似乎可信的名字、照片和粉丝数。成千上万这样的假账号在运行,她说,许多情况下是由“国家行为者”——外国单位管理的,他们向几乎全是人类的推特粉丝喂食宣传。

这些机器人当时是一项创新,而斯威尼的小组是第一个发现并描述它们的。去年秋天在哈佛肯尼迪学院(HKS)的公开演讲中,她讲述了整个故事:这些机器人并不是一直在发布宣传信息;它们大多保持不显眼,发布无害评论,征集粉丝,建立信任。“然后突然之间,”她说,“机器人会传递一段彻底的虚假信息,”这是传播可信虚假信息的强大方法。“这就是人们将一生积蓄交给某人的原理”——或者他们的选票。

她将早期与人格机器人对抗并逐渐意识到他们目的的经历描述为一种“诡异的体验”。但对斯威尼来说,这并不罕见:近三十年来,她的专注工作一直是揭示新信息技术的意外后果。她帮助创立了数据隐私和算法偏差的子领域。法律和教科书已经因为她的工作而改变。公众情感也随之改变,因为斯威尼继续揭示对隐私、公平性、甚至越来越多地对民主本身的技术威胁。

现年64岁,留着短发,戴着黑框眼镜,她表现出一种温和的礼节,同时让人感到友好和正式。在谈话中,她机智而不拘小节,同时也是严格而精确的。当她在家中或办公室时,经常可以看到她穿着Currier House的连帽衫——自2016年以来,斯威尼与她的配偶、律师Sylvia Barrett,以及他们的儿子Leonard,一起担任这座学生宿舍的教务主任,与300名本科生住在一起。

自2011年以来担任哈佛大学教职的斯威尼,在单位系和肯尼迪学院都有联合任命,她是数据隐私实验室和公共利益技术实验室的主任。她年轻时创立了数据隐私实验室,并在2021年帮助成立了公共利益技术实验室。这两个组织的宗旨都与斯威尼的工作密切相关。数据实验室,设在定量社会科学研究所,研究信息共享的具体问题,并寻找保持数据保密性同时确保其有用性的方法。技术实验室则更广泛;它是一个实验的“沙盒”

,让学生、研究人员和实践者可以探索技术对社会问题的影响,并为发现的问题设计干预措施。“我们生活在技术统治之中,”斯威尼常说:今天的技术如此普及和广泛,以至于它们已将美国生活的每个角落——从家庭和工作到休闲、购买和政治——都吞没了。现在,“技术设计是新的决策者,”她解释说。“因为如果技术不尊重它,或不允许它,那么拥有一项法律”——比如关于就业歧视、隐私或投票权——“已不再重要了。”

单位政策需要多年才能改变,但技术进步则发生在几个月或几周内,这种不匹配只会变得更加尖锐。她几年前在一场数据科学会议上告诉与会者:“有点像我们坐在车里,我们在这趟旅程中,但是没有人在驾驶。”现在,“一切都可以被争夺。”“我可以让计算机做任何事”如果说斯威尼是一个预言者,她是一个乐观的预言者,她对技术可以提供的好处有着显著持久的信念。

这种信念从她的儿童时期就开始驱动她的好奇心和雄心,也是她发现技术危险时通常会提出基于技术的解决方案的原因。这就是为什么她的签名课程——每年春天教授的、充满基于真实问题的动手实验,被称为“技术科学拯救世界”。这也是为什么她即将出版的书——预计在2025年发行,聚焦于如何保持技术的好处而不带来危害的书——被命名为《在科技中我们信任》。这种乐观部分源于她最早对数学的介绍。

Sweeney在田纳西州的纳什维尔长大,由曾祖父母抚养。在她五岁时,幼儿园老师有一天打电话回家,担心Sweeney在基本加法上有困难;在学校里,这个孩子总是给出错误的答案。因此,家里买了一套闪卡,她的姑姑坐下来和她一起练习。三加二?“六。”四加二?“八。”三加四?“十二。”答案本能地,不假思索地给出。尝试了几次后,她的姑姑突然意识到:Sweeney不是在加数字——而是在乘数字。

直到今天,她姑姑惊讶的表情仍然是Sweeney最生动的记忆之一。“每个人都在试图找出我哪里出了问题,”她说,但没有任何问题。从那一刻起,她爱上了数学。“我发现自己越来越深入其中,”她说。一个叔叔从一所历史悠久的黑人大学菲斯克大学毕业,Sweeney细读他留下的教科书。在七年级时,她在当地社区大学上课,学习矢量力学和几何证明。

她爱数学,因为她擅长它,但也因为它的有序性为她提供了一个逃避的空间,可以从经常感觉杂乱无章的家庭生活中暂时脱身。Sweeney的曾祖父母在她还是个婴儿时收养了她,在她的父母无法照顾她时挺身而出。这个庞大的扩大家庭异常紧密,但“我实际上是个异类”,她说。“我周围的没有其他任何人的父母是离婚的。”与之相比,她的家庭动态是“复杂的”。

她在Dana Hall School,一所位于马萨诸塞州韦尔斯利的女子预科学校,第一次接触到计算机科学。1973年,作为14岁的寄宿学生,她在民权运动后的首批非洲裔美国人中入学,享全额奖学金。在计算机编程课程中,她找到了自己的使命。这是她对数学的热爱,但更好。“在纸上写一个证明——那很好,”她说。“但一个程序实际上在现实世界中执行操作。”她开始为各种随机任务编写程序:

动词的变位,为行政办公室协调会议。“在Dana Hall,没有什么我没有写个程序来解决的,”她说。她感觉世界在渐渐露出曙光。1978年,她进入麻省理工学院。她回忆起那时的学院非常白人和男性化,具有“对科学宗教的强烈信仰”。后者似乎充满希望:一个欢迎和发展的想法的地方。“那是一个令人难以置信的激动人心的时代,”她补充道。“你可以看到个人电脑的革命即将来临。你知道这将改变一切。”她想成为其中的一部分:

“我生活在计算机实验室。”但在校园里的欢迎并不总是扩展到她身上。通常,她是教室里唯一的女性或非洲裔美国人,她经常发现她的想法被忽视或被拒绝。很难找到支持的导师。“你可以想象那些情况,”她说。“我在那里经历了一些困难时期。”此外,在计算机科学的初期阶段,“没过多久,你就开始知道的比任何讲师都多了,”那些博士学位持有者在数学和工程而非计算机领域。

1981年,她辍学在Kendall Square开始自己的软件咨询公司,运营了10年(Barrett,她在MIT时认识的,成为她的商业伙伴)。“那时,在计算机业务中,没有两天是相同的,”她说。“我们在做一些令人惊奇的事情。我感觉我可以让计算机做任何事。”但她不断遇到一个熟悉的挑战。许多客户都是博士级别的计算机科学家,Sweeney在他们中赢得了解决困难问题和构建不可能系统的声誉。

然而,这中间存在着脱节:“我想让我的思想被了解,”她说。“但问题是,你是个年轻的黑人女孩——那么,你是谁?我正在做这项工作并得到报酬,但我的想法没有得到关注。”事实上,她说,学术界的客户有时会发表关于她创新的论文。“我得到我认为我应得的那种认可的唯一方法,”她意识到,“就是拥有学术资质。”1991年,她就读于哈佛扩展学院,边工作边学习。

她深入学习计划,在Henry Leitner这位高级讲师的指导下,修读了很多计算机科学的研究生课程,这学期成为了一位重要的导师,同时也学习了诗歌、哲学、宗教和语言。1995年获得学士学位后,她重新进入MIT这次作为研究生。2001年,她获得了计算机科学的博士学位,成为学院第一个这样做的黑人女性。

到那时,她已经通过一项也许是她最著名的实验做出了一个震撼发现,开启了她作为技术未预见后果预示者的职业生涯。“这真是一个虫罐”斯威尼把技术革命的影响看作是一系列“技术与社会的冲突”波浪而来。首波浮现的是数据隐私。在她著名的1997年实验中,她从一组公开可得的马萨诸塞州员工健康信息的数据集中找到了当时威廉·维尔德州长的所谓匿名医疗记录(见“暴露”,2009年9月至10月,第38页)。

这些数据集对于公共卫生研究至关重要,因此州单位官员已经移除了他们认为的所有识别信息,只剩下几个人口数据:邮政编码、出生日期和性别。斯威尼将数据与她以25美元从剑桥市政厅购买的选民名单交叉引用——令她惊讶的是,很快她就能够重新链接维尔德的名字与他的医疗记录。后来,她计算出仅使用这三条信息87%的人口可以被唯一地识别。

斯威尼原本并没想到会发现这些问题——她最初打算解决一个与一位医学伦理学家的争论,这位曾警告她计算机记录正把私人信息置于风险中。“计算机是邪恶的,”布兰代斯大学的贝弗利·伍德沃德告诉她。“我想纠正她的想法,”斯威尼回忆说。“但她实际上预见了未来。”结果是一场地震。在一个月内,斯威尼在国会作证;

当时立法者正在起草医疗保险可携性和责任法案(HIPAA,医疗记录的主要保障措施),她的工作被引用于随后的法规中。不久之后,斯威尼仍在研究生院学习时,她合著了一篇论文,引入了“k-匿名性”的概念——一种更严格的去识别形式,并建议如何实现这一点的方法。世界各地的官员开始更新他们的标杆和最佳实践,用于记录存储。“她基本上发明了数据隐私的领域”

,麦凯计算机科学实践教授、公共政策的教授Waldo说,曾与Sweeney一起工作和合著书籍。“有一大块与隐私相关的技术没有Latanya的工作就不会发生。”这些年以来,斯威尼、她的学生和数据隐私实验室的同事继续探索隐私保护的薄弱环节,这些看来只会增多。

他们对伊利诺伊州的亨廷顿病患者、华盛顿州的医院出院记录以及追踪生物信息如运动、体温和心率的Apple Watches和Sleep Number床进行了研究。在一次实验中,斯威尼重新识别了参与个人基因组项目的匿名志愿者,这是一项由Winthrop遗传学教授乔治·查奇领导的DNA研究。在公开谈话中,她经常展示一张数据地图,显示出一个典型患者的健康记录可能去往的诸多目的地:

不仅是医院、药房和保险公司,还包括律师事务所、运输公司、研究实验室、单位机关、媒体机构和雇主。地图看起来像一个奇异的蜘蛛网,斯威尼说,这其中至少有一半的数据流甚至没有受到HIPAA法规的覆盖:“一旦我们开始打开虫罐子,它果真是一个虫罐。”第二波技术与社会的冲突出现在不到十年之后,其中心是偏见。斯威尼再一次成为首批抵达该领域的研究者之一。

在与当时的路透社记者Adam Tanner的采访中,她在搜索自己撰写的期刊文章时在谷歌上搜索了自己的名字,一则暗示她有犯罪前科的广告意外地弹出在屏幕上。“告诉我你被捕的事”,Tanner说。但她从未被捕过,这段让人震惊的经历让他们花了好几个小时在搜索栏中输入其他名字。随后进行的正式实验证实了斯威尼和Tanner所推测的:

在120,000次搜索中,她发现在谷歌搜索黑名字时,出现逮捕记录广告的频率比搜索白名字时更高(见“观察者”,2017年1月至2月,第56页)。对某些名字,在没有逮捕记录存在的情况下,广告出现的频率甚至高达80%。斯威尼在2013年发表的关于这种现象的论文是第一个关于算法公平性的研究。

自那以后,她和她的学生以及同事进行了大量有关由算法驱动的偏见的研究,调查了种族歧视的Facebook广告、不公平定价的普林斯顿评估SAT在线辅导,以及Airbnb中费系统,其中奥克兰和伯克利的亚裔房东比类似租屋的白人房东少赚取20%。

2014年,在她担任联邦贸易委员会(FTC)首席技术官的一年期间,斯威尼审查了学生组织的网站上的广告实践,包括Omega Psi Phi,一个非洲裔美国人兄弟会,在那里她发现了辩护律师和最低排名信用卡的广告。在其他兄弟会的网站上,信用卡广告则推广了价值更高的美国运通蓝卡。“Latanya真正引领并揭露了看待这些概念的重要性,在一个仍然非常由白人男性主导的领域中,”

Ji Su Yoo说,她曾是Sweeney的学生和教学同事,现在作为UC Berkeley信息学院的博士候选人研究技术与不平等的交集。算法偏见的研究近年来发展迅速,一些最杰出的研究人员是引用Sweeney工作的黑女性:普林斯顿社会学家Ruha Benjamin;UCLA互联网研究学者Safiya Noble;

以及MIT媒体实验室的计算机科学家Joy Buolamwini,她2018年的面部识别软件研究戏剧性地展示了其在深肤色面孔上表现不佳,尤其是黑女性的面孔。“很多人站在这些巨人肩膀上,”Yoo说,“而Latanya从一开始就在铺路。这始终是一场艰难的战斗。至今仍是。”“连接不同的世界”人们常常询问斯威尼辨识这些冲突的才能:为什么她能察觉同行看不见的问题?部分答案显而易见;

作为女性和非洲裔美国人,她以不同的眼光看待。她的生活历史也是一个因素。思考数据隐私时,她不禁想到她的曾祖父母,他们出生于1899年和1900年的田纳西,在大部分生活时期都生活在吉姆·克劳法下。斯威尼在2021年告诉一位记者:“我的曾祖父有这些关于他找到的生存之道的规则。”大部分规则都是为了在敌对的社会中保持匿名。隐私意味着安全,一个可以正常运作的空间。民主价值观并不是抽象的。“我经常想到这一点,”

她现在说。但斯威尼看待系统的方式也有一种整体性和扎根于现实的特点。她善于注意自己在注意什么,并将观察转化为实验。“这是连接不同行至时的一种功能,”计算机科学家Kathy Pham说道,她是公共利益技术实验室的兼职公共政策讲师和教员。“保持在奖学界是很容易的,但Latanya将学术与实践结合在一起,以一种彻底改变世界的方式。她不仅讨论投票;她构建技术和组织,以使投票更好。”

这是斯威尼的同事们经常提到的:她工作的实用性和优雅性,特别是她实验设计的简洁性。“考虑到她的培训,这不是小事,”东岸计算机公司首席执行官Sharad Goel说,他是通过计算方法研究刑事司法改革和民主治理的公共政策教授。在计算机科学中,“技术方法很容易。”他补充道:“思考实际问题,及那些有效解决方案的设计——这并不容易。她的目标不是证明定理,尽管她也做到过;而是解决问题。”

James Waldo忆起几年前的一次,当时斯威尼在传授有关隐私和监视的课程,并派她的班级拍摄在不同任务中为他班上一些学生拍摄他们在校园周围的监控摄像机的活动。她希望她的学生测试一个假设,即人们会忽视被观察的行为,尽管到达了他们认为不可接受的水平。她是对的:Waldo的学生对无人机感到不安,但什么也没做来阻止它们:“Latanya研究的真正聪明之处在于她能想出实验来支持或证明她直觉声称的虚假性,”

他说。“我几乎把它看作是二十世纪英国物理学家的传统,例如欧内斯特·卢瑟福和亚瑟·爱丁顿,他们制造这些优雅而便宜的实验,通过不使用数百万美元的设备而取得了巨大的进步。”斯威尼对简洁的强调部分与她对教学的关注有关。然后,与她对技术可能对人类有帮助的不变信念联系在一起,以及她为之作出努力的毅力。她在FTC度过的那一年是令人大开眼界的,她说:

“就像蜘蛛侠的巢穴——立刻清楚我看到的关于数据隐私问题和算法公平性的微小一瞥,对比这里存在的不同。他们在如何重塑社会一直以来都是小巫见大巫。”她看到的另一件事是FTC如何对技术型威胁准备不足;它是一个越来越数字化世界中的砖块和灰泥的机构。2015年,她回到哈佛,决意培养一支技术精英队伍。在单位部,斯威尼展开了一项本科生技术科学项目。“这些是简单的实验,”她说她与学生进行的研究。

“重要的是知道要找什么,知道你在找什么。”“类固醇上的误导信息和虚假信息”最近,斯威尼和她的学生所记录的技术社会冲突似乎逐渐变得事关生死立维。现在的危险是对民主本身而言,波浪进来的速度更快。过去十年中,虚假信息和误导信息已经崭露头角成为主要威胁,并借由人工智能(AI)加速。“AI创造类固醇上的误导信息和虚假信息,”她说。“突然间,文本信息和电话呼叫的规模超乎我们想象。

借助AI,每个信息都可以个性化。”同时,在网上,人们可以几乎没有透明度地说任何话。“而你最终得到这些[选民]小组,认为他们了解你,但实际上,没有人知道你真正是谁,”她说。“我们真的还没有解决这个问题。”像这样的问题现在占据着斯威尼很多注意力。她和她的学生非常密切地关注2024年的选举。

为应对2016年他们揭示的身份盗窃漏洞,她的班级为乔治亚州2020年美国参议院竞选中的死因轮选建立了一个工具,随后他们在全国范围内扩展此工具,命名为投票火花。它监控在线登记的人注册资料,如有所变动通过短信、邮件或电话通知他们以提升意识。2024年,斯威尼和她的学生正在用这个工具追踪和分析全国各地选民登记信息的更改。

另一个实验室项目政治信息档案正处于创建63,000个假设人设过程中,每个邮政编码两个——一个代表中位数民主党选民,另一个代表中位数共和党选民。“随后,我们将他们注册到这类人设的所有活动中,”斯威尼说:在线邮件列表、订阅、组织小组。“然后我们监控他们在社交媒体、短信和电子邮件上收到的信息,”编制一个可以在politicalmessingingarchive.org上公开查看的档案。

另一个计划今秋推出的工具,叫做Same Source(同源,samesource.org),将显示用户数字图像和视频的出处——真实的、修改过的或AI生成的。其图书馆中有6,000,000个条目的项目能够识别一幅图像首次出现的时间以及可能发生了哪些变化。“而且你可以查看类似图像,因为我们学到的经验是你可以从中辨别很多,”斯威尼说。“这里是一幅图像,突然之间你看到它变化了,完全具有不同的政治意义。”

拥有技术,这些变化是可以追踪的。“所以,”她最终说道,看着,微笑着,“这就是我们一直在做的事情。这就是我们认为我们可以提供帮助的一些方式。”即便2024年的选举过去,新的技术冲突波浪仍然会不断涌来,Sweeney将开发新的技术工具来试图让社会维持漂泊。“我有这个奇怪的想法,”她说:“好像仅仅与问题待在一起是不够的。我迫于要提出‘我们如何解决它?我们如何支持社会的利益、处境不利者的利益?’”

几乎总是,她在发源问题的地方找到答案:她的计算机面前。