大数据时代(图片来源视觉中国)
“大数据”是近年来兴起的热词,它的威力可能我们每个人都已经有所体会。新冠肺炎疫情暴发以来,基于大数据的行程追踪在防疫抗疫过程中就发挥了关键作用;基于基因大数据的嫌疑人比对系统近年来在陈年积案的破获过程中屡屡有着高光表现;气象大数据可以让人类更好地掌握广域范围内的气候和天气变化……让我们来逐一领略大数据的这些神奇应用吧。
手机只要在网,就会与各种形式的通信基站发生信息交换 图片来源Freepik.com
先来看看通信大数据是如何帮助我们实现疫情追踪的。我们通过手机发射的无线电信号与外界交换情报,这些信号会被运营商基站和互联网公司所捕捉,运营商和互联网公司正是通过分筛这些信息来进行追踪的。在我们用手机交换信息的同时,不论我们是在通话还是在上网,手机发出和接收的无线电信号不仅包括双方输入的语音或者文字信息,还会伴随着一种我们作为用户无法感知的信号,这就是“信令”。
信令信号并不会直接传递语音文本信息,而是在通话中承载控制的功能。简单来说,当小明通过手机的运营商网络给小红打电话,在小明拨出号码以后,手机发送的信令信号就会通过运营商的基站进行传递,此时小明的位置等信息就会被运营商捕获。同时,信令信号会在中转站请求通话,在小红同意通话以后,小红的反馈信令也会被运营商捕捉。这样,运营商就可以通过信令信号获知人们在一定范围内的实时位置等信息。
此外,信令并非只在通话过程中才有效,只要你有一部在网手机,它就会定时自动传输信令信号,甚至是在关机的状态下。有时,当我们进入新的市域时,会自动接收到运营商发送的短信。可见,在我们不操作手机的时候,手机也会自动与基站交换信令数据。使用手机上网也一样,所不同的是,网络日志和记录还会被互联网公司所捕获,它们往往又会成为信令的辅助数据。
说完了手机信令大数据,我们再来看看基因大数据是如何协助人们破获疑案的。利用基因大数据破案的关键是必须获得犯罪嫌疑人的DNA,这一条件在大部分的凶案中都能得到满足。无论是多么狡猾的犯罪分子,都很难完全消灭自身曾经出现在犯罪现场的痕迹。警方采集到可疑DNA后,会采用各种方式寻找拥有该 DNA的嫌疑人。如果我们通过将采集到的数据与基因数据库中的个人DNA信息进行比对,一旦比对成功,就可以确定嫌疑DNA的归属。这就是基因大数据破案的理论基础。
需要指出的是,通过基因大数据比对直接找到线索现阶段还有两大问题。第一,比对成功的概率仍然很低,白银案和南医大案在我国刑侦人员广泛采用类似的比对技术后,仍然花了很多年才得以破获,原因就是一直没找到比对命中的目标。例如,白银案是嫌疑人家族中某男性亲属因涉经济案件而入狱,警方将他的 DNA数据输入数据库中后,才发现与白银案的嫌疑人存在亲缘关系。
比对方式存在的第二个问题就是伦理争议,它包含很多的潜在议题。例如,收集公民的DNA数据是否有法律依据;在公民不知情的情况下进行DNA数据的比对是否有侵犯公民隐私的嫌疑;大部分面向公众开放的DNA数据库都不是以破获刑事案件为目的(例如为了寻找失散的亲人等),如果违背上传者的本意而使用这些数据,是否涉嫌违反最初的用户协议;寻找嫌疑人家族成员的方式会不会造成歧视行为(例如当事人周围的舆论会有“某某家族的人都是罪犯”一类的议论)。
大数据的应用还体现在环境保护等方面。2017年10月13日,Sentinel-5P卫星 从俄罗斯普列谢茨克航天发射场发射升空,这颗卫星专门用于大气化学、环境污染、臭氧及气溶胶等方面的环境监测。早在2018年,欧洲航天局就将该系列卫星采集的数据向民众公开,政府、社会组织和企业都可以获得这些数据,用于环境污染监测领域,全球环境质量实时呈现在公众面前。
环境问题是全球性问题,卫星遥感动态监测技术正逐步走进我们的日常生活。随着Sentine 1系列卫星相关数据的开放,环境质量监测将更为精确和透明。这一转变将吸引更多民众的关注,影响政府的环境政策,进而为改善环境问题、 造福人类与自然作出贡献。
可见,大数据技术以及大数据本身对于一个国家来说都是关系重大的基础性战略资源。管理、利用好大数据,通过大数据产生实际的经济效益和社会效益,将是大数据技术发展不变的目标。
什么是大数据
大数据(big data ),本质上是巨量的资料。海量数据也可以定义为各种来源的 大量非结构化或结构化数据。海量数据通常包含的数据大小超出传统软件在可接受 的时间内处理的能力。由于近期的技术进步,发布新数据的便捷性以及全球大多数政府对高透明度的要求,大数据分析在现代研究中越来越突出。
来源: 江苏领导干部和公务员科学素质手册