海南三亚:年轻育种人利用大数据和人工智能育成新品种

aixo 2024-10-20 10:11:06
算力 2024-10-20 10:11:06

十月深秋,长江南北的农田中,进入了秋收的最后阶段,一层又一层秋风,把玉米、水稻、大豆吹得金黄一片。而远在海南三亚,温暖如春的海岛上,也迎来了一年一度南下育种的人们。

海南是育种圣地,冬季温暖的气候,使需要世代选育的育种,在这里可以增加一代。所以,每年冬天,都有来自全国各地的育种人,带着他们正在选育的种子,播种在三亚的农田中,这一过程,被称为“南繁加代”。

不过,与以往不同的是,如今的海南三亚,有一群年轻的育种人,他们没有自己的农田和种子,甚至也不是农学专业出身。他们学习分子生物学或者现代信息技术,利用大数据、人工智能等,在数据之中,开辟自己的“田园”,在虚拟世界,育成“新的品种”。

“电脑上的育种人”

一台电脑,就是陈守坤的“试验田”。

大数据_数据大屏_数据大屏可视化展示案例

陈守坤。受访者供图

几年中,从打造自己的“大模型”开始,到搜集数据、进行配组、测试千万种不同的组合,再到找到育种者需要的作物基因组合,同样的工作,不知道重复了多少次。陈守坤也不记得,到底成功了多少种组合。

一粒种子的育成,从选择父本和母本开始,然后进行一次又一次杂交,一代又一代种植和选择。传统时代的育种家们,需要六到八年的时间,才能选出一个新的品种。南繁加代的出现,使得育种家们每年能多种一季,将这个时间缩短了三分之一到一半。

陈守坤原本也是众多南繁加代育种大军中的一员。每年秋冬,他都会带着自己培育的种子,一路南下,在三亚的土地种植。第二年春天,北方开始播种的时候,三亚的种子正好成熟,他又带着种子北上。周而复始,像候鸟一样,追逐着气候的变化而迁徙。

直到转做分子设计育种,陈守坤“失去”了自己的农田。

这是一种利用大数据、人工智能、机器学习等各种新技术的育种新模式。育种者们建立数字化的育种模型,将育种材料的基因数据导入模型,寻找自己需要的组合,进行大量匹配,再输入各种环境参数,通过模型预测,就可以精准地组合成想要的品种。这个过程,通常在一周之内就能得出结果,最快的情况下,只要一天。

整个分子设计育种的过程,完全在电脑上完成,几乎彻底离开了农田。

和陈守坤同在一个课题组的年轻学生们,有许多从来没有下过地,甚至也没有农学背景。今年研二的郭晓冰和冯晓轩,两个人都是学习统计学的,在南繁基地,他们每天的工作就是操作电脑,和各种各样的数据打交道。这些数据来自过去到现在许许多多的育种家们,漫长的育种史中,积累了大量的数据。而随着分子生物学的进步,基因组测序每天都会增加更多的作物基因数据。他们在庞大的数据中,挖掘一切有价值的基因,然后根据需要,配成不同的组合,再通过大模型,预测每一种组合的效果。

农学生的数字庄园

考入中国农科院南繁院之前,统计学专业的郭晓冰,几乎对农业完全不了解,也没有想过,育种究竟该如何进行。冯晓轩同样如此,他们考研的专业,叫作“生物信息学”,听起来和农业、育种毫无关系。他们只知道,考上之后,未来三年的学习,都在海南三亚,一个四季都是夏天的地方。

大数据_数据大屏_数据大屏可视化展示案例

中国农科院南繁院研二学生郭晓冰。受访者供图

中国农科院南繁院建于5年前,位于南繁育种的核心地带,海南三亚崖州湾科技城。这里云集了中国最多的农业科研机构,最多的育种科学家,还有最先进的育种设施。

对郭晓冰他们来说,这里也有最丰富的育种数据。课题组的师生们,都住在南繁院的宿舍里,每天早晨,迎着海风和朝阳,一路骑车到实验室,坐在电脑前,开始一天的学习和工作。

风雨、气温、土壤、微生物、病菌、水分……大自然中的一切,变成一组组数据,不断交互作用,模拟出真实世界的农田。

在这个看不见的虚拟世界中,一粒种子落入“土壤”,生根发芽,经历风雨,开花结果,重新长出新的种子。

当外界急剧变化的气候、频发的极端天气和高发的病虫害,不断影响着人们的粮食时,这间实验室的电脑中,也在不断增加新的数据。

干旱高温、极速降温、病虫害高发……农民需要可以抵抗各种逆境的作物新品种,而传统育种漫长的时间,很难完全应对快速变化的农业环境。作为最尖端的育种方式,分子设计育种可以用最快的方式,进行不同目标的育种预测,通过庞大的作物基因数据库以及各种环境数据,一天到一周之内,就可以组合出相应的品种,并进行预测。

遍布摄像头的农田

“我们是把袁隆平院士这样的育种家的工作,从田间搬到了电脑上。”中国农科院南繁院分子设计育种课题组博士赵盈说。

数据大屏可视化展示案例_数据大屏_大数据

中国农科院南繁院博士赵盈。受访者供图

从许多年前开始,育种就不再只是农业科学家的领域。中国农科院副院长孙坦介绍,在国外,分子设计育种已经发展多年,国际上知名的种业企业,耗费数十亿美元,打造自己的分子设计育种平台,育成了大量新品种。我国分子育种起步较晚,但发展很快,尤其在技术应用上,已经非常广泛,不论是玉米、小麦、水稻等大田粮食作物,还是蔬菜水果,都在利用分子设计育种技术。

赵盈正在进行一项大豆育种的分子设计和预测,大豆是我国最大的油料和饲料作物,也是我国进口最多的作物,提升我国大豆的产量,是关系粮食安全的重要部分,“目前大豆育种最大的目标,首先是单产提升。我国耕地有限,很难通过大规模扩大面积的方式提高大豆产量,提高单产是唯一的途径。同时,因为气候变化等各种影响,未来的大豆生产面临着重重威胁,亟须培育高产且抗逆的大豆品种。”

电脑上的设计和预测,在整个分子设计育种中,是最关键的部分,但并不是全部过程。在预测完成之后,还要在田间进行验证,收集和观察配组之后的各种表型数据。

大数据_数据大屏_数据大屏可视化展示案例

中国农科院南繁院表型大楼。受访者供图

在同一座大楼中,还有另外一个表型鉴定的课题组。所谓表型,即生物所有可被观察和鉴定的特征,比如人的身高、血型,植物的株高、颜色等。在育种中,一些典型的表型,必须在作物真实的生长中观察和收集。比如株高、节数、节间距等,这些特征直接关系着作物的生长能力、抗倒伏能力等。再如穗数、穗粒数、千粒重等,直接关系着产量。

在过去,像袁隆平这样的育种家们,需要年复一年,长时间蹲在田里,用肉眼一株株观察,用笔一个个记录。而在现代智慧育种中,遍布田间的传感器和摄像头,代替了人的眼睛和手中的笔,进行表型鉴定的育种者们,同样在办公室里,用电脑或监视器,观察田间的情况,摄像头会把各种作物的各种表型数据,包括环境的变化搜集起来,传输到后方,育种者们则通过电脑进行汇总、分析、处理。

在赵盈工作的大楼旁边,就有一处我国目前最专业、技术含量最高的田间“高通量植物表型平台”。这是一座5.7米高、21米宽的钢架,横跨在金色的稻田中,仿佛一个小型的“龙门吊”,稻田遍设轨道,钢架搭载十多种监测仪器,在田间自由移动,监测植物从播种到收获全周期的表型数据。

数据大屏_数据大屏可视化展示案例_大数据

中国农科院南繁院基地中的“高通量植物表型平台”。受访者供图

智慧育种的新时代

育种的新模式,远超冯晓轩想象。在进入中国农科院南繁院之前,她只是一个刚刚大学毕业、从未下过田的学生。学习统计学的她,要从零开始,学习育种中的一切知识。尽管她的工作不需要农学背景也可以进行,但她觉得,农学也同样很重要。

大数据_数据大屏_数据大屏可视化展示案例

中国农科院南繁院研二学生冯晓轩。受访者供图

“我们是从零开始做分子设计与育种的,需要自己设计模型,搜集数据,进行模拟预测。”冯晓轩说,“所以学习农学知识也是有必要的。”

虽然同样没下过地,但赵盈学过农学,她本科学农学,硕士学生物,也曾经在实验室里做过农作物的分子实验。

陈守坤自己找了一小块地,延续着以前种地的习惯。虽然新的工作并不需要,但他觉得,有一块自己的地,可以随时验证电脑上的设计结果,同时也保留了一点点过去种地的记忆,“习惯了,总想着有一小块地更好。”

不论是从传统育种转入分子设计育种,还是刚刚进入育种领域的年轻人,他们其实都走在整个世界的最前列。

“我国分子育种的理论,在全球也处于领先地位。”孙坦说。

大数据_数据大屏可视化展示案例_数据大屏

中国农科院副院长孙坦。受访者供图

从很多年前开始,各种新技术就开始运用到育种,从大数据到雷达,从摄像头到计算机,越来越多领域的研究者们,加入了育种的大军。“最开始当然需要磨合,一个计算机专业的博士,和一个传统育种的博士,两个人同在一个课题组,可能连对话都难。但慢慢地,不同领域的科学技术,逐渐融合成一体,变成了现代化的智慧育种。”孙坦说,“和所有科学一样,农业科学的发展,同样越来越超出普通人可感知的世界,向着超微观和超宏观两极发展。如超微观的基因、分子,需要特定的仪器,才能被人们所观察和干预。超宏观的层面,整个地球的生态环境、土壤、植保、栽培,还有计算机、传感器、卫星遥感等技术,都已经融合到了育种之中。所以,今天的育种,和以往的育种已经完全不同,超出了普通人的认知。”

领先的理论水平,并不意味着所有的科研领域都领先。孙坦介绍,我国在基础性研究、数据积累等领域,仍然相对落后,“智慧育种是一个很庞大的系统,不亚于芯片设计和制造,事实上,育种本身也是农业的芯片。它是一个漫长且庞大的工程,举例来说,基因的精准鉴定,需要庞大的人力物力和财力,软件研发,需要很多年轻人参与和创新,数据累积,需要漫长的时间和庞大的人力物力,英国的表型数据、环境数据有百年的积累,我们还差得很远。”

对于陈守坤和他的同事、同学们来说,众多的困难,其实也正蕴含着无限的未来。毕竟,他们走在一个全新的世界里,而且是这个世界中的先行者。

新京报记者 周怀宗

编辑 张树婧 校对 张彦君