中国数字经济发展正步入快速发展的新阶段,正处于从量变到质变的关键节点上。会议全方位解读大数据AI时代的技术进程,深度解析人工智能行业发展、深度学习、区块链最新前沿议题。

在本次论坛上,哈尔滨工业大学深圳研究生院教授、博士生导师、深圳市互联网信息协同技术与应用重点实验室主任叶允明表示空间大数据应用的趋势,最重要的就是人工智能挖掘。

林允明.jpg

以下为哈尔滨工业大学深圳研究生院教授、博士生导师、深圳市互联网信息协同技术与应用重点实验室主任叶允明在AI与大数据发展趋势与应用论坛上的精彩演讲,由云现场整理。

首先,大家需要知道什么是空间大数据?广义来说,空间大数据主要是为了实现对宇宙空间物质的观测所产生的数据。在我们已有的产业应用中,以及实际生活中所碰到的,更局部的范围主要是以地球为观测中心的空间大数据,接下来我要讲的也是指以地球为中心的观测。

    以地球为中心的空间大数据蓝图,我是从四个维度去定义的,主要包括天、空、地、网。

    天主要以卫星观测和卫星载荷为主,形成了卫星大数据。卫星大数据有一个非常天然的优势,它可以实现全球大范围覆盖的数据遥感,但也有一些缺陷,目前很多卫星的时间分辨率和空间分辨率比较低,需要其他类型数据进行弥补,包括空间的、航拍的、探空设备所采集到的数据,以及地面的传感器,比如雷达及各种传感设备。在此基础上,现在互联网时代需要设备传感,比如微博、微信,日本现在就有专门面向气象的,每个人手机上都可以采集气象设备。这些数据综合应用起来,就可以实现很多我们原来想不到的应用,这都是更加精准、可落地的人工智能应用。

    现在人工智能应用的最好领域就是视觉、语音识别,这些领域大部分都属于单一类型的数据。

    空间大数据最核心的是需要异构数据。外行很多人一讲大数据,都认为只要是很大的数据就是大数据。在我的观点里,我觉得大数据不仅仅是大,更重要的是异构。我经常举的一个例子,大数据就像“盲人摸象”,有很多盲人,他只能观察到大象不同的侧面。大数据也是这样的,需要通过不同来源的数据,使得我们对一个事物的真相得到更全面、更精准的策划及预判。目前全球的卫星大概有1000多颗,截止到2019年,美国有901颗,中国现在有299颗,但我们发展得非常快。俄罗斯有153颗,日本87颗。所以说在航天领域,我们发展得非常快。

    在卫星这个领域,目前主要包括三大类,包括通信卫星、导航定位卫星、遥感卫星。当然还有一类,主要是科学实验卫星。这三类当中,遥感卫星是跟大数据直接相关的,目前天上的卫星主要也是遥感卫星。目前全世界在轨的遥感卫星有700多颗,在这些在轨的遥感卫星当中,可以分为三大类型,主要是气象卫星、资源卫星、海洋卫星。

    卫星遥感大数据应用非常广,从天气预报到灾情预警,再到微观环境监测、人居环境监测、智慧物流、智慧农业、智慧交通等等。

    对地观测遥感卫星领域的发展趋势:

    第一点,卫星发射成本快速下降,每公斤成本不足10万美元。

    第二点,小卫星、微小卫星应用快速增长。哈工大是国内第一个由在校大学生进行发明、设计、制造并最终上天制造了微小卫星,所以说门槛大大降低了。

    第三点,“星座”计划。目前国内外重要的星座计划,包括大家都知道的Space X的Starlink计划,他们计划发射1万多颗低轨卫星。今年五六月份,Space X也用火箭发射了60颗卫星,所以卫星将来的制造、发射、应用速度将大大加快。包括俄罗斯公司的288颗星太空计划。软银支持的OneWeb、三星、播音等等公司,提出未来要发射几万颗卫星。中国也有“灵鹊”计划、“虹云工程”等,我们要发的大部分都是微小卫星。

    可以看到,卫星的发展、应用非常快,超乎了很多人的想象。它的应用领域也非常广,包括天气预报,天气预报最主要的来源就是气象卫星。

    结合地面雷达、地面观测站、地面气象站的数据,大家可以看到天气预报现在越来越准了,当然还有一些领域没有解决,所以需要我们用先进技术进行解决。包括在生态环境的监测上,现在国家要求生态审计,每一任省长都要对上任后和离职前的生态气象情况进行审计,这都离不开卫星技术。

    空间大数据应用的趋势,最重要的就是人工智能挖掘。传统方式,气象预报员要看卫星图、雷达图,然后结合自己的经验做判断。未来,这种模式很显然越来越难以为继,每个局的预报员每天早晨要通过会议系统,大家一起看图、一起讨论,未来这种模式会逐步以人工智能的方式被卫星、雷达、地面站所采集,数据会做综合的融合、建模、预判,这是未来的基本趋势。

    另外,要实现地球活动的动态感知和预测。大家可以想想,这么多的卫星,其实相当于现在在地面的摄像头,你可以把这些卫星当作是在天上的摄像头,只不过它能看的范围更广,而且搭载的传感器更多。我们现在在卫星上搭载的传感器有可见光通道的,有微波等等不同的载荷,未来可以实现动态地球感知和预测,所以需要有相对应的人工智能算法。现在在图像识别、人脸识别领域的一些算法,用到卫星数据上,还是会碰到很多问题的。

    主要的挑战

    第一,海量复杂空间数据带来的对计算能力的挑战。我们地面建了很多数据接收站,遍布全国、全球,这些数据需要传输、储存、处理、检索、分析、挖掘、可视化,所以会带来大规模的计算。我们是把数据集中之后再计算,还是在分布的各个点处理完?还是两者进行结合?这是未来的挑战。是把原始数据都保存下来,还是进行摘要?这都对数据管理提出了要求和挑战。

    第二,异构时空数据对人工智能算法的挑战。数据的格式不一致,这是小的问题,还有量纲不一致、时空尺度不一致、测量精度不一致、可靠性不一致,包括卫星定位定标的问题,包括不同数据如何集成?信息和空间如何融合?这都是比较新的大数据领域中需要解决的问题。

    第三,数据安全与隐私的挑战。我刚才说了,将来几万颗卫星在天上,相当于每个人头里都有一个摄像头,这会给将来的国家安全问题、个人隐私问题带来很多挑战。包括数据管理和应用,也将面临很多安全的挑战,这些领域我们现在都要提前布局。包括从国家安全的角度,天上有这么多颗卫星,你的设备、部署,未来人家都会一目了然,对国家来说这也是非常大的挑战。

    目前在空间大数据领域,卫星的普及应用发展速度将超过很多人的认知; 空间大数据对人工智能技术研究提出了新的挑战。

    产业的发展需要应用牵引、总体规划、技术驱动,特别是在一些垂直领域的应用当中,需要深挖深耕,学术界也需要静下心来做研究。包括我们刚刚看到的一个很简单的结果,但实际上我们十几个博士静下心来做了两年多,才能做出这样的效果。所以在很多垂直领域,真的需要我们静下心来;

    现在我感觉人工智能这个领域有一点浮躁,所以在很多领域需要跨学科、多领域、政产学研用协同发展,才能为我们带来更多真正可用的结果。