团队操纵大数据+AI左右竞选引舆论哗然

2018-3-21 14:57 新智元(闻菲，张乾)

摘要：

特朗普团队操纵大数据+AI左右竞选引舆论哗然

一家名叫Cambridge Analytica的数据分析公司成了这两天新闻的焦点，他们使用大数据和AI分析Facebook用户资料，操纵舆论帮助特朗普竞选。研究早已发现，机器能比人类更加精准地掌握人类的性格。AI和大数据正在成为强大的政治武器，假新闻、机器人水军、AI换脸既成为一种技术现象，也是一种社会现象，是我们每个人都需要面对和思考的问题。

消息已经出来了：俄罗斯大选，弗拉基米尔·普京轻松赢得了第四个任期，对70%的得票进行抽查的结果显示，普京得票率为75.91％。

民意调查显示，普京的支持率远远超过其他对手，当选可以说是早成定局。然而，针对俄罗斯的这场大选，舞弊的质疑声不绝于耳。此前俄罗斯非政府研究机构利华达中心的一项调查结果，有58％的选民计划抵制这次选举。普京最有力的竞争对手，也因欺诈罪被送入牢狱，未能参加此次选举。

另一边厢，美国的特朗普也不得安生。关于他2016年操纵舆情当选总统的报道再一次飞满天，其中也包括他与俄罗斯勾结的可能。美国这边的舆论风暴更加猛烈，而位于暴风中心的，是一家数据分析公司，以及这家公司使用的方法——人工智能。

这家叫做Cambridge Analytica的公司是这两天全美关注的焦点。公司内部人士走向前台，主动公开Cambridge Analytica非法获取超过500万Facebook个人账户信息，然后使用这些数据构建算法，分析Facebook用户个性资料，并将这些信息与他们的投票行为关联起来。

算法和大数据两相结合，形成了一种强有力的政治武器，让竞选团队能够准确识别在两位候选人之间摇摆不定的选民，并有针对性地制作和投放广告。

根据这位吹哨人的表述，Cambridge Analytica使用这些非法得来的数据，最终目标是“利用这个训练集，构建一个理解Facebook用户个人资料的‘黄金标准’”。

大数据和AI在竞选中的力量：机器能比人更加精准地掌握人类性格

Cambridge Analytica首席执行官Alexander Nix在2016年的一次演讲中，详细阐述了这家公司的方法论：“我们推出了一个长表（long-form）量化工具来探究人格的基本特征。如果你知道了目标人物的个性，你就可以细化信息，更有效地与这些关键群体产生共鸣。”

Cambrige Analytica CEO 在会上演讲《大数据和心理分析在竞选中的力量》

Cambridge Analytica通过收集到的数据——我们先把数据收集方法放在一边——建立了模型，并将其转化为美国成年人的个性概况。Nix声称，他们“在美国每个成年人身上大约有4000或5000个数据点（data points）”。

他们模型的基础，是Michal Kosinski的心理测量学研究，Kosinski在2013年是剑桥大学的一名博士候选人（这也是Cambridge Analytica公司名字的由来）。Kosinski和他的同事开发了一个模型，将受试者在Facebook上的点赞（like）与他们的OCEAN分数联系起来。OCEAN是心理学家使用的一种调查问卷，描述了五个维度的人格——开放（openness to experience）、自律（conscientiousness）、外向（extraversion）、随和（agreeableness）和神经质（neuroticism）。

Cambridge Analytica公司将这种社会心理与数据分析结合起来。他们从Facebook和Twitter收集数据，并从第三方那里购买一系列其他的数据，比如电视偏好、航空旅行、购物习惯、去教堂的频率、订阅的杂志等等。然后，他们将所有这些信息用于Nix所谓的“行为微观定位”（behavioral microtargeting），简单说就是个性化广告。

Cambridge Analytica使用心理测量学而不是根据人口统计来定制广告，以选民个人的情感内容为目标。换句话说，就是为了激发人类情感上的偏见而设计广告。

这种方法成功与否，或者有多成功，取决于对人心理概况的掌握。我们是否能够根据社交网络上的评论、留言和推文来了解一个人的心理状况？

答案是肯定的。

Kosinski在他2016年接受采访时，谈到了他的模型的预测能力。“70个“喜欢”就足以超过这个人的朋友对他的理解，150个就能超过他的父母，300个超过伴侣，更多的“喜欢”能让模型比这个人本身都更了解他自己。”

或许这是Kosinski在王婆卖瓜，但研究早已证实，机器能比人类更加精确地判断人类的性格特征，这与社交认识能力无关，一切都在大数据。

2015年发表了PNAS的一项研究表明，计算机模型基于数字足迹对人物性格的判断，比亲密的人（朋友，家人，配偶，同事等）所作的判断更准确和有效。研究人员表示，“我们的研究结果强调，人的个性可以自动预测，而不涉及人类的社会认知技能。”

利用AI和大数据控制公众舆论：从假新闻到换脸，初中高三级进阶

将机器的这种预测能力与一群bot结合起来，就成了更加强大的宣传工具。牛津大学互联网研究所计算宣传项目（Computational Propaganda project）负责人Samuel Woolley说：“控制一千个僵尸计算机帐户的一个人，不仅能够影响他们直接圈子中的人，还可能影响他们操作的网站的算法。”

这些技术可以捕捉到人们在某个特定时刻的想法，并一次又一次地向他们提供服务。不仅如此，活跃在网络中的bot能够对Twitter和Facebook上的热门话题做出迅速的反应，生成有针对性的帖子、图像，甚至YouTube视频。

随着大数据和人工智能的发展，利用相关技术开展社会学研究已经成为一种趋势。然而，就如上文所说，利用这些技术同时也能影响甚至操控人和社会本身。

牛津大学互联网研究所计算宣传研究项目（Computational Propaganda Research Project，COMPROP）就专门针对这种新的现象，调查算法、自动化和政治的相互作用。研究人员的工作包括分析如何利用社交媒体机器人等工具，通过放大或压制政治内容、假情报、仇恨言论和垃圾新闻来操纵公众舆论。

项目官网介绍：“我们使用组织社会学，人机交互，沟通，信息科学和政治科学的观点来解释和分析收集到的证据。 ”

新智元也简单梳理了AI和大数据在总统竞选中的应用。

初级篇：Fake News，制造假新闻在Facebook上传播

2016年，特朗普当选总统，假新闻可谓助了一臂之力。

在整个竞选期间，美国的充斥着大量的假新闻。BuzzFeed在2016年12月做的一项调查显示，75%的美国人看到过假新闻。以其中一条假新闻为例，“调查希拉里邮件泄露门的FBI特工自杀-FBI Agent Suspected in Hillary Email Leaks Found Dead in Apparent Murder-Suicide (Fake)”这则新闻，有52%的希拉里支持者和85%的特朗普支持者认为是真的。