近年来,伴随着数据科学的迅猛发展,“大数据”似乎一夜之间融入到各行各业,并渗透进人们的生活,对于一向吸引着人类探索和求知目光的海洋来说,亦不例外。大数据甚至与人工智能、超算一起被誉为带动海洋科学发展的“新三驾马车”。
在新的时代背景下,如何获取、管理和用好海洋大数据,发挥其在智慧海洋建设中的灵魂作用,如何实现海洋大数据科学与人工智能的交叉融合,让人类的智慧之光持续闪耀在深海大洋,已成为当今海洋学界绕不开的重要话题。
近日,国家发展和改革委员会完成了2018年度国家地方联合工程研究中心拟确定名单的公示。由中国海洋大学信息科学与工程学院院长、青岛海洋科学与技术试点国家实验室(以下简称“海洋试点国家实验室”)高性能科学计算与系统仿真平台主任魏志强教授领衔申报的“海洋大数据国家地方联合工程研究中心”在列。作为中国海洋大学首个国家地方联合工程研究中心,此中心的设立对于推动青岛海洋科技创新能力建设,特别是以海洋大数据为核心的智慧海洋建设无疑是重大利好消息。
何为智慧海洋?在魏志强看来,就是把新一代信息技术融合到海洋领域。大数据、超算和人工智能作为新一代信息技术的典型代表,自然而然成为了智慧海洋建设的核心支撑。“三者中,海洋大数据是基础,也是智慧海洋建设的灵魂。”魏志强说。聚焦海洋领域的数据科学与大数据技术,他简洁地归纳为三大板块:“大数据怎么来”“大数据怎么放”“大数据怎么用”,即海洋大数据的获取、存储和应用。
近年来,伴随着海洋观测技术的进步与发展,围绕海洋大数据的获取,我国已基本形成了“空天地海”多元立体化的采集系统,但距离智慧海洋建设所需求的数据采集体系还有许多亟待提升和优化的空间。
在深海大洋进行数据采集,传感器是必不可少的装置,而目前我国海洋科研领域使用的高端传感器90%以上皆源自进口,这一领域的关键技术和核心设备还掌握在少数发达国家手中。“这对我们的海洋科研来说是‘卡脖子’的关键技术,建设海洋强国必须要突破这一点。”魏志强说。此外,深远海、南北极等极端或恶劣环境下的大数据获取,也迫切需要有高质量、高分辨率的传感器来完成监测和传输工作。
围绕海洋观测、探测和大数据获取,早在2014年,中国科学院院士、中国海洋大学副校长、海洋试点国家实验室主任吴立新便提出了“透明海洋”大科学计划:即围绕我国海洋环境综合感知与认知、资源开发与权益维护等国家重大需求,以“海洋物联网”技术为核心,面向全球海洋及重点海区的海洋环境与目标信息感知,实施“海洋星簇”“海气界面”“深海星空”“海底透视”和“深蓝大脑”五大计划,提升我国在海洋环境观测预测、海洋权益维护等方面的科研能力和水平,支撑海洋强国建设。“科学家在实验室就能知道全球海洋正在发生的事情以及未来将要发生的事情,如海洋的温度变化、水声通道的变化、鱼群的变化等,并能做出预测,国家海洋利益拓展到哪里,‘透明海洋’工程就建设到哪里。”吴立新如此描绘“透明海洋”大科学计划的美好蓝图。
4年多来,在这一“上天下海驻底”的五大计划驱动之下,“透明海洋”在海洋观测领域,尤其是海洋大数据获取方面颇有建树,并逐渐朝着“看得清、查得明、报得准”的目标迈进。初步构建了世界上最大规模的区域海洋潜标观测网——“两洋一海”潜标观测网,突破了潜标实时传输这一全球性难题,首次实现深海数据长周期稳定实时传输并共享应用;“白龙”浮标成功布放印度洋,数据上传GTS实现全球实时共享;国内最大规模海洋智能装备立体组网观测在南海成功进行;高分辨率“两洋一海”海洋-大气耦合预报系统研制成功,并进入常态化预报。
在海洋观测和大数据获取方面,如何充分考虑海洋大数据的“时空耦合”“地理关联”等特性,实现空、天、地、海等不同运载平台之间的协同观测,从“单点”走向“组网”?在魏志强看来,破解这一“瓶颈”的关键正是“透明海洋”大科学计划中提到的“海洋智能物联网”,即人工智能、大数据技术与海洋物联网的深度融合,此举也将为未来海洋大数据的获取提供强有力的支撑。
“通过海洋观测和探测获得的大数据,好比是产品加工的‘原材料’,我们不仅要有存储‘原材料’的‘仓库’,还要有科学合理的制度体系把‘原材料’管理好,做到安全、可控、高效;紧随其后的是‘原材料’的加工环节,加工首先要有‘设备’,其次要有‘工艺’。”魏志强用如此生动的比喻来描述海洋大数据的存储、管理、分析和加工。在魏志强看来,海洋大数据的加工处理主要取决于“软”“硬”两个方面,“软”是指“算法”即数据科学与大数据技术;“硬”是指装备,即超级计算机,两者之和便是大家耳熟能详的“超算”。
2018年10月18日-20日,由中国计算机学会主办,中国计算机学会高性能计算专业委员会、海洋试点国家实验室、中国海洋大学和国家超级计算济南中心共同承办的第十四届全国高性能计算学术年会在青岛举行。来自海洋和信息技术领域的多位专家学者,围绕超算与智慧未来、透明海洋、深蓝大脑、国产E级、海洋量子等7个版块进行了深入探讨,为“超算”与海洋科研深度融合把脉开方。“以超算平台、超算互联网体系为代表的重大装备类平台是开展全球气候研究、能源矿产勘探、生物医药研发、人工智能支撑等必不可少的大科学装置,是科研工作亟需且对未来取得颠覆性创新成果至关重要的平台,是建设世界科技强国的国之重器。”大会主席吴立新所作的《从智慧海洋到智慧未来》的主题报告不断激发大家共鸣,赢得阵阵掌声。
拥有海洋大数据可以更好地认识海洋,掌控大数据才能更好地经略海洋,超算便是掌控海洋大数据的关键。在世界范围内,可以说海洋科研与超算相伴而生,且有历代超算皆率先应用于以海洋为核心的地球科学的先例。为了实现海洋大数据处理更快、更准、更精的目标,魏志强和他的团队一直在努力。
海洋试点国家实验室拥有目前全球海洋科研领域运算速度最快的P级超级计算机,每秒运算速度最快可达2.6千万亿次,并构建了目前全球速度最快的百G超宽网络、百公里毫秒级超低延时超算互联网。魏志强结合中国海洋大学与海洋试点国家实验室“你中有我、我中有你”耦合发展的特点,把中国海洋大学优秀的信息化人才队伍与海洋试点国家实验室的高起点平台有机融合,聚焦海洋大数据分析处理,持续进行协同创新。“我们把海洋试点国家实验室超算中心、国家超算济南中心、国家超算无锡中心三个中心的超算大科学人工智能和大数据公共支撑平台装置统一互联起来,构建形成了一套超算大科学装置群。”魏志强说。在这一超算互联网体系中,神威E级原型机、神威太湖之光、神威蓝光、浪潮千万亿次超级计算机共同服务于海量、多源、异构的海洋大数据分析处理,助力海洋强国建设。
当今世界,信息技术革命日新月异。面对你追我赶的信息化竞争环境,惟有抢抓机遇、持续创新才能勇立潮头,超算领域亦不例外。
“超级计算能力已经成为国家和地方科技创新能力的重要标志之一。”在第十四届全国高性能计算学术年会上吴立新如是说。如今,这句话已经越来越成为科技界的共识。
相对于当下的P级超算,E级超算是指每秒可进行百亿亿次数学运算的超级计算机,被公认为是“世界超级计算机界的下一顶皇冠”。当下,中国、美国、日本等国均提出了百亿亿次计算机研制计划,令人欣喜的是,我国研制的百亿亿次超级计算机“神威”E级原型机已于2018年8月5日在国家超算济南中心亮相,人类迈进E级超算时代近在咫尺。“其服务于海洋领域,进一步推动我们国家在超算领域的发展,为经略海洋打造新的高地,进而走向更加智慧的未来,也指日可待。”魏志强说。
2018年6月12日,对于中国海洋学界来说是值得铭记的一天,也是令广大海洋人激动的一天。这一天,中共中央总书记、国家主席、中央军委主席习近平来到了海洋试点国家实验室,在这里他重申了建设海洋强国的信念。
“在超算仿真大厅,习近平认真察看高性能科学计算和系统仿真平台运行情况,并向科研人员详细询问构建超级计算机互联网、研发人工智能和大数据系统‘深蓝大脑’、打造国家一流海洋系统模拟器的最新进展。得知超级计算机解决了海洋数据‘碎片化’问题,大大提高了海洋观测和预测能力,总书记十分高兴。”每当看见或听见新闻中提及这段话,魏志强总是心潮澎湃。
“深蓝大脑”便是海洋试点国家实验室高性能科学计算与系统仿真平台重点打造的“全球海洋人工智能与大数据系统”。该系统涵盖全球与区域海洋和气候预测、海洋药物智能筛选、海底战略性能源智能勘探、海洋生态系统演变预测、海洋大数据智能分析等众多领域,致力于更准确、更精细、更高效地为海洋科技创新服务。
2018年7月3日,在青岛举行的“2018年全球海洋院所领导人会议”上传来令世界海洋药物学界振奋的消息。中国工程院院士、青岛海洋生物医药研究院院长、海洋试点国家实验室学术委员会主任管华诗发布了全球首个海洋天然产物三维结构数据库。“打造‘蓝色药库’是人类的共同事业,海洋的所有问题都是国际问题,需要国际社会共同参与。我们开放数据库,希望为人类的健康事业造福。”管华诗从构建人类命运共同体的视角解读这一创新举措的非凡意义。
海洋天然产物三维结构数据库由海洋试点国家实验室、青岛海洋生物医药研究院和中国海洋大学医药学院等多家单位联合开发完成,该数据库容纳了30117个海洋天然产物的准确三维结构,可直接用于虚拟筛选与智能药物设计,大大提升了海洋药物的研发效率。据魏志强介绍,药物研发过程相当复杂,从药物先导化合物分子的筛选到先导化合物分子与肿瘤疾病靶点的对接,通常一款传统新药的开发大约需要10到15年,成本约10-15亿美元。但是利用超算平台可以将研发成本和周期缩短三分之一。“这是新药筛选平台和超算平台交叉融合的生动体现,也是药物研发设计与海洋大数据平台和信息技术学科交叉的重大成果。”魏志强表示。
目前,借助该数据库,管华诗团队已经完成170余个美国FDA批准的肿瘤药物靶点对海洋化合物数据库的精确筛选,发现1000余个具有开发前景的抗肿瘤药物苗头分子,经过有机合成、生物实测、药理药效分析和临床前试验,发现了诸多可开发为海洋药物的先导化合物。
当下,魏志强正带领他的团队与中国海洋大学医药学院的杨金波教授团队等携手推进“智能超算药物组学”计划,矢志深蓝,探寻资源,为海洋强国助力添彩,为人类发展造福。
近年来,随着大数据的汇集、理论算法的革新和计算能力的跨越式提升,以及脑科学和人工智能技术的进一步发展,以类脑智能为代表的新一代人工智能技术逐渐绽放光芒。这也给以人工智能和大数据技术为基础打造的“深蓝大脑”提供了跃升的机会。“未来的‘深蓝大脑’将面向浩瀚海洋,实现从机器智能向类脑智能的转化,实现从机器学习到深度学习再到自主学习的跨越,从而在信息处理机制上类脑、认知行为和智能水平上类人,使机器拥有人类认知能力及协同机制,实现对未来‘透明海洋’系统的智能自驱动、自发现和自演进。这是‘深蓝大脑’进化的必由之路,也是海洋科学技术发展的重要途径。”魏志强说。
科技创新的关键是人才培养。中国海洋大学作为一所以造就国家海洋事业的领军人才和骨干力量为特殊使命的综合性大学,面对建设“智慧海洋”的浪潮,自当抓住机遇、乘势而上。
2018年9月19日,中国海洋大学与山东易华录信息技术有限公司签署合作协议,中国海洋大学校长于志刚,中国华录集团党委副书记、副总经理韩建国参加签约仪式,并共同为“海洋科学大数据联合实验室”揭牌。2018年10月18日,中国海洋大学与浪潮集团有限公司签署战略合作协议,决定共建智慧计算联合实验室。浪潮集团执行总裁、中国工程院院士王恩东和中国海洋大学副校长、中国科学院院士吴立新等为实验室揭牌,两位院士跨界携手,使海洋科学与信息科学连接得更加紧密。2018年10月20日,著名量子信息学家、中国科学院院士郭光灿和中国海洋大学校长助理吴强明共同为海洋量子技术协同创新中心揭牌……一系列创新型举措,开启了校企合作、协同培养智慧海洋人才的大幕。
“学校已于2018年向教育部申请增设‘智能科学与技术’专业,下一步我们还将布局‘数据科学与大数据技术’‘微电子与集成电路’等专业,并着手把‘人工智能’变成通识课,服务于全校的人才培养。”在笃定“蓝色信念”,建设智慧海洋的征途中,魏志强心中早已有了清晰的育人路线图。