研讨人员应用人工智能的深度学习措施,发现了38个新的强引力透镜候选体,为研讨天体物理学问题提供了新的“宇宙探针”候选体。 近年来,随着技术日益进步,天文学研讨中产生了海量数据。天文学家要想从郭守敬望远镜、“中国天眼”FAST、LSST大型综合巡天望远镜等遍布世界的大型望远镜捕获的海量数据中找出有价值的信息以资研讨,无异于大海捞针。 如何高效地处置这些数据,已成为现代天文学面临的一项重要应战。由于人工智能在海量数据剖析和处置方面所具有的突出优势,它也很自然地走入了天文学家的视野。 日前,中国科学院云南天文台丽江天文观测站龙潜研讨员与云南大学中国西南天文研讨所宇宙学研讨组尔欣中教授团队协作,应用人工智能深度学习的措施,发现了38个新的强引力透镜候选体,为研讨天体物理学问题提供了新的牢靠的“宇宙探针”候选体。英国《皇家天文学会月刊》发表了这项研讨成果。 天文观测产生海量数据用机器学习给天体分类已十分普遍 随着下一代大范围测光巡天项目的展开,人们等候发现数以万计的强引力透镜系统。但如何在海量天体图像中快速地找到强引力透镜候选体?近年来,人工智能的快速展开,给人类提供了一种新的可能。 以2009年发射升空的世界首个用于探测太阳系外类地行星的飞行器开普勒太空望远镜为例,仅在起初3年半的任务期内,就监控了超越15万个恒星系统,同时也产生了海量数据。这些数据通常要经由计算机处置,但当计算机辨认出一定的信号时,又必须依托人类剖析,判别其能否是行星轨道所产生的,这项庞大的筛查工作单靠美国国度航空航天局(NASA)的科学家或科学小组,是无法有效完成的。 “如此大的数据量,人工剖析在很多时分曾经达不到所需求的速度。借助人工智能的优势,我们能够极大地提升对数据的剖析速率。”龙潜向科技日报记者引见,人工智能展示出来的效率和精确性远高于传统措施。 龙潜研讨员长期从事人工智能深度学习方面的研讨。近期,他与尔欣中教授团队协作,构建并锻炼了一个卷积神经网络,用来寻觅强引力透镜系统。他们把这个网络应用到欧洲南方天文台2.6米巡天望远镜(VST)千平方度巡天数据,并找到了38个新的强引力透镜候选体。此次构建的神经网络,也可应用于其他大型望远镜的巡天数据。 “在这项工作中,我们用计算机分别模仿了强引力透镜图像和非强引力透镜图像,从而来锻炼计算机。我们发现,在准备锻炼计算机的图像时,非强引力透镜图像比强引力透镜愈加重要。”尔欣中说,开端的剖析中,他们运用简单的规则星系图像作为非强引力透镜锻炼样本,发现结果正确率十分低。只需把各种可能的非引力透镜图像都思索进来之后,才干得到比较好的结果。 “这就像在教电脑认识什么是狗的时分,还要通知它猫、羊、牛等都不是狗。而假如你只通知它猫不是狗,电脑有十分大的概率把羊、牛认成狗。”龙潜说,目前应用机器学习来对天文学中各种天体分类曾经十分普遍,最简单的是把恒星和星系分开,或者把不同行态的星系中止分类,以及应用星系的多重颜色来估量星系的距离等。 每秒可辨认上万张照片新型神经网络便于实时修正、锻炼和测试 人眼看强引力透镜系统的图像,最快就是每秒钟看一张图。而计算机每秒钟能够辨认成千上万张图片。 龙潜研讨员和尔欣中教授团队此番锻炼的这个卷积神经网络,能够充沛应用GPU中止并行加速,经过配备更多或更强的GPU,系统能够依据实践需求极大提升搜索速度和效率。 “这个神经网络的锻炼,主要运用模仿数据,只运用了很少的人工标注数据,由于模仿数据能够恣意生成,因而多样性远大于人工标注数据,进一步依据数据的特性调理锻炼参数和锻炼算法,使神经网络的泛化才干得到了极大的进步。”龙潜说,此外,研讨人员运用新型科学计算言语Julia完整自定义网络结构,由于Julia言语兼具速度和灵活性,使得神经网络在CPU和GPU上都有良好的性能,并且能够恣意切换,因而十分有利于研讨人员实时修正、锻炼和测试。 “我们还经过对引力透镜数据的研讨,定制了有针对性的小型网络,有效地抑止了过拟合现象,同时实考证明该网络具有与大型网络相似的精确率。相比大型网络,小型网络在普通计算机终端就能够锻炼和测试,不需求依赖大型GPU集群,这为天文工作者运用和改进网络提供了方便。”龙潜说。 目前,随着技术与配备水平快速展开,人工智能在天文学上的应用还会越来越多。“我们计划对一些变源的多波段光变曲线来中止机器的快速分类,这样在实施大样本巡天的时分,电脑能够自动对所发现的变源中止选择,并对我们感兴味的天体做出提示,以便进一步展开后续研讨工作。”尔欣中说,正由于人工智能的辅佐,天文研讨者得以从耗时单调的数据筛查剖析中解脱出来,当人力“大海捞针”难以抵挡之日,正是人工智能大显身手之时。 |