写论文的同时,曾凡大脑也在不断思考运转,这次实验向他打开了一个全新世界的大门。
假如把人类基因组序列当做一个程序,一对对碱基就是组成机器语言的一串串零和一,只是它们的组合方式比现在计算机的二进制复杂的多,破解起来难度也更大。
自己这个超级程序员能不能破解开人类基因组这个超级程序呢?
从目前来看,他还需要收集更多更详细的数据,单纯这一个基因包含的信息还远远不够。
就是这一个基因包含的几千个碱基序列,他也还没搞明白呢,这些天的实验也是在前人总结的经验基础上,做了一些简单的假设求证,
目前能得出的结论也只是基因会影响机体脂肪消耗能力,容易造成脂肪累积,从而造成肥胖引发一系列并发症。
至于这个基因如何造成这种现象,其中的碱基序列各部分都发挥了什么作用,还完全两眼一抹黑。
就好像对一个未知程序做黑盒测试,只是知道了程序具备的一部分功能,内部的运行机制,编程算法还没搞明白。
从这个角度看,破译基因功能,和破解一个未知程序很相似,不同的是它的编码规则更复杂,破译过程也更艰难。
破解普通程序只需要在计算机上面对屏幕敲键盘就行了,破解基因序列则必须在显微镜下操作,还需要进行很长时间的实验验证,难度可想而知了。
能不能写一个模拟生命基因功能的程序,在计算机上进行模拟破译呢?
现在已知数据太少,精确度不会很高,随着破解进度的增加,未来精确度会越来越高,当突破某个临界值后,或许不再需要细胞实验,动物实验,在计算机上就能破译基因的功能了。
到时候,不但人体所有基因功能都可以破译出来,还可以修改某些基因,看看能不能达到预期效果,然后再进行实验求证,完成一次基因的进化。
到那时候,甚至可以通过软件设计,用基因编辑重组制造出一个全新物种,那可是神才能拥有的能力!
想想就觉得激动,曾凡被自己这个大胆想法震惊到了,反复思索其中的可能性,越想越觉得值得一试。
人类基因组测序就相当于破解生命程序的源代码,他写的计算机程序就相当于将这些源代码在计算机上重新编译一遍,可以模拟真实人体情况运行起来。
现在的计算机虽然强大,算力方面估计仍然难以支撑,初始的程序架构不能太庞大,功能也不能太复杂,可以根据需要一点点逐步扩展。
人类基因组的测序工作已经进行了大半,他可以尝试根据破解出来的这些序列,总结规律写一个反编译程序,加快测序进度。
测序流程这段时间他天天都在做,已经熟悉的不能再熟悉了,基因碱基序列的组成规律不敢说完全掌握,至少也摸清了大半,对他的程序来说已经够用了。
被这个想法所驱动,曾凡没有像往常那样按时睡觉,熬夜把自己的构想变成了代码。
光有程序代码还不行,还需要把测序完成的基因序列导入进行计算,这些在他宿舍的电脑上做不了。
将程序刻录到光盘上,曾凡凌晨三点多跑到实验室,在实验室的电脑上开始操作,实验室的工作站比他的宿舍电脑当然算力高多了,更主要的可以高速获取基因组数据,还可以调用学校超级计算机的算力进行运算,效率提升可不是一星半点。
由于数据量庞大,导入过程就需要几个小时,程序运行总结规律也不是一时半会能完成,曾凡盯着屏幕困意上涌,趴在桌子上面睡着了。