“这是全球首个亿级参数量的地震波大模型,今天正式发布。”7月28日,由国家超级计算成都中心、中国地震局地球物理研究所与清华大学联合开发的“谛听”地震波大模型正式发布。
出席活动的四川省地震局副局长杜斌表示,四川作为经济和能源大省,地质构造复杂,是中国地震活动水平最高、强度最大的地区之一。此次“谛听”地震波大模型的发布不仅是地震科学技术的重大突破,也是对国家重大战略需求的积极回应。
如何练出听震“神兽”?
“‘谛听’原本是中国神话传说中的神兽,可以通过听音来辨认世间万物。”中国地震局地球物理研究所副所长陈石说,“我们研发的‘谛听’,是一种大型地震学数据集以及在此基础上训练的人工智能大模型。”
发布会上,陈石如此解释“谛听”的来历:它们都是通过“听”去认识、分析自然界中的信息。
陈石说,随着我国地震监测体系的持续优化升级以及近年来人工智能技术的迅猛发展,地震学研究和防震减灾工作也进入了地震波大数据时代,“谛听”地震波大模型应运而生。
那如何训练这只可以辨识地震的“神兽”?
首先要有数量足够的数据,这就是“谛听”数据集。最初,科研团队将2013年至2020年间的震相观测报告和国家测震台网数据备份中心的数据,经过清洗和脱敏处理后,建立了1.0版本的“谛听”数据集。随着数据规模的扩大,2023年9月,成都产业集团运营的国家超算成都中心与中国地震局地球物理研究所达成战略合作,双方合作共建“地震大模型创新应用联合实验室”,新一代“谛听”数据集正式落户成都。
数据集是大模型训练的基础,数据集的规模和质量直接决定了模型的训练效果。目前,“谛听”数据集不仅是国内首个,同时也是目前国内外最大规模、样本类型和标注最为全面的地震学专业AI训练数据集之一。
陈石介绍,第一版“谛听”地震波大模型基于2300万条地震事件波形进行了预训练,而我国中国地震台网每年产生的标注事件波形约为50万条。以此计算,刚“出生”不久的“谛听”地震波大模型已相当于拥有约40年地震信号识别经验的“老专家”。
其次,是算法、模型的设计和调优。来自清华大学自动化系的助理研究员刘畅博士介绍,作为全球范围内地震波大模型的首次探索,需要进行大量基础性研究,否则模型训练不充分,实际应用效果不及预期。
简单来说,算法的选择和设计直接决定了模型的学习能力和表达能力,算法的优化和改进可以提高模型的性能和效果。参数则是大模型训练的调节器,可直接影响模型的准确性和稳定性。在“谛听”大模型中,参数的数量非常庞大,也给最优参数的确认造成极大的挑战。
“人工智能算法的关键在于两个因素,训练数据量和模型参数量。”陈石用比喻来解释:训练数据量可以看作是算法的“阅历”,而参数量则是算法的“脑容量”。要想有效地记忆和理解海量的地震数据,并充分挖掘和利用其中的信息,就必须发展与之相匹配的大“脑容量”的大模型。
“谛听”都能干什么?
据悉,目前“谛听”地震波大模型已可投入使用。陈石谈到,“谛听”地震波大模型依托中国地震台网的海量数据,通过先进的人工智能技术,在测试中发现,可以显著提升地震信号的识别准确率和速度。
因此,从短期看,“谛听”地震波大模型可直接应用于地震信号识别、地震活动监测、大地震快速响应等领域,有望减轻地震局一线业务人员的工作压力。
从长期看,地震学是一门观测科学,重大的突破往往来自对观测数据的深刻理解。对观测的理解越全面,对观测的整合能力越强,离地震学科学问题的突破就越近。目前,传统方法和中小模型均无法充分利用百TB、PB级别的地震观测数据,而这些数据中蕴含着许多重要的地震学科学问题,只有大模型才能深入挖掘这些“宝藏”。因此,“谛听”地震波大模型有望为地震科学研究带来重大突破。
从应用领域看,“谛听”地震波大模型的前景也十分令人期待。
“未来,该模型的应用场景还可用于矿震监测、页岩气开采、城市地下空间结构探测、海底地震监测等多个领域。”国家超算成都中心常务副主任王建波说。
以寻找油气为例。目前全球95%以上的油气田发现主要是依靠地震勘探。王建波说,地震波在不同介质中传播时,强度、形态等特征都不同,“谛听”地震波大模型通过学习储存石油区域的波形特点,就可以推导出地下是否含有油气。
陈石表示,第一版“谛听”地震波大模型完成了从预训练到微调完整流程的从无到有的探索,初步展示了优于中小模型的性能,为后续充分挖掘和发挥地震波大模型的优势探索了道路,积累了经验。
“谛听”之外,超算还能做什么?
“发展地震波大模型不仅是人工智能地震学领域的必然趋势,也是该领域的科技制高点。”陈石说,“在具备了足够的数据和算力基础后,我们迅速组织团队第一时间开展相关研究工作,力求填补这一重要空白,为地震科学研究和防震减灾事业贡献一份力量。”
成都数据集团党委副书记、成都超算中心运营管理有限公司董事长郭黎表示,“谛听”地震波大模型的研发,不仅极大地推动了人工智能算法在地震学领域的开发、测试和应用,更为地震监测预报业务的智能化发展提供了坚实的技术支撑。
作为长期在超算领域工作的资深从业者,王建波认为,“谛听”地震学数据集正式落户国家超级计算成都中心地震大模型创新应用联合实验室,这是垂直领域专业数据和大规模算力深度融合、软硬一体的一次新尝试。
“‘谛听’地震波大模型的发布对于突破中小地震波模型性能瓶颈,提高地震大数据智能处理能力和信息挖掘水平具有重要意义。”王建波说,国家超算成都中心强大算力和技术服务能力,不仅可以满足中国地震局地球物理研究所等科研单位定制化的软硬一体的服务需求,更是为人工智能和机器人等未来产业发展提供了坚实的平台保障。
目前国家超算成都中心已在多个领域形成特色算力应用。其中:在人工智能大模型领域,国家超算成都中心与成都晓多科技合作,研发了基于大语言模型技术开发的垂类电商客服行业的大型语言模型,可为电商企业提供智能化的服务和营销一体化解决方案。今年5月,该模型成功通过国家生成式人工智能服务备案。
在防灾减灾领域,中国科学院成都山地灾害与环境研究所就联合国家超算成都中心,开展了“气候变化条件下山地致灾风险绿色调控关键技术与示范”项目研究,搭建山地灾害风险模拟与险情预报平台,突破精细化、精准化灾害预警预报瓶颈。此外,国家超算成都中心还与四川气象部门合作,提供精准气象预报服务。
“国家超算成都中心还将不断加速人工智能技术在防灾减灾、城市治理等领域的应用与发展,充分发挥我们作为大国重器的战略支撑作用。”王建波说。
|