作者:范成鹏
职称职务:武汉大学基础医学院副教授
学科专业:生物化学与分子生物学
主要工作经历与任职:
2006年10月-2011年11月美国耶鲁大学医学院药理学系博士后
2011年11月-2012年9月美国耶鲁大学医学院药理学系associate research scientist
2013年7月至今作为人才引进到武汉大学基础医学院生物化学与分子生物学系副教授
稿件来源:结构生物学探索(附原文链接)
经常会听到感慨,比较顺利的分子置换,看到LLG和TFZ比较高,初始修正的R因子等等数据统计指标比较好看,真是很容易。但是有些模凌两可的和比较困难的,就需要基础理论和基础知识以及恒心和毅力,而这些还是来自于对理论基础的理解和软件的熟悉。结构生物学博大精深,我懂得很少,还在不断学习,仅仅分享我的一点心得,供各位参考。
case4:去年我收了一套数据,1.18埃的native晶体衍射数据,蛋白质的序列同源性在25%左右,我当时有些迟疑不定,是做分子置换试试看,还是同时做硒代的晶体两手准备,毕竟上海光源近期就要停光休息。我决定熬夜,通过Blast搜寻同源结构后下载了几个结构作为初始模型,用phaser得到的初始解的TFZ是7.3,初始修正的R/Rfree在49%和51%左右(时间久远,记不清楚了,无法精确定位有效数字),我看了看电子密度图,有些region吻合,有些区域则不吻合,然后我采用Acta D有一篇文献推荐的一种非常规的方法进行再次修正,对着高分辨率的电子密度图结合蛋白质序列手动调整一些区域,再次修正,R因子迅速的下降到了30%以下,修正后的统计数据好看,电子密度图也好看,最后快马加鞭,啃着馒头喝着凉水,几个小时全程搞定。只有感慨,差点做了硒代,费钱费力。还是没有被迷惑或者轻言放弃,心中有理论,手中有电脑,终于不慌。磨刀不误砍柴工,前期阅读教材和文献获得的积累,没有白费,在这个比较艰难的结构解析中派上了用场。
case5:去年我收了一套数据,不到100个氨基酸的蛋白质,1.18埃的数据,多种软件尝试分子置换未果,因为序列同源性太低,使用Blast against PDB直接没有任何hit(No significant similarity found),没有可用的同源结构模型。然后硒代晶体和浸泡重原子等等,都失败了,再次准备去上海收集数据进行尝试的时候,疫情来了。呆在家里,作为英雄的城市的一员为国家做贡献,闭门读书,就试试用一些结构预测的软件得到的模型,初步尝试分子置换,没有看到希望,密度图也是惨不忍睹,就算了。然后就忙着别的课题去了。然后近期在朋友圈看到推荐的腾讯的tFOLD,赶紧联系王博试了试,王博士热心慷概的帮助,预测的model的集合发过来,我用Phaser试了试,TFZ是7.3,是manual说的probable的边界值,初始修正,R/Rfree是52/54%,我觉得这个就奇怪了,然后看看电子密度图,也是模凌两可似是而非,然后我在想,接下来怎么办?放弃还是坚持?To do or not to do?这个是个问题,哈姆雷特的名言在脑海里闪电一般出现,我决定live!我因为马上要去上课,就顺手的连接性(phenix phaser之后的run autobuild)的做了autobuild。然后专心的上课,传道授业解惑。吼了几节课,身心俱疲,回来一看,R/Rfree,CC值,FOM值,模型的完整性,电子密度图等等,科学合理,证明这个解析是正确的,R/Rfree已经29%和39%左右了,然后对着电子密度图和蛋白质序列,吃着馒头喝着凉水听着电视剧顺手和朋友们微信聊个天,毕竟能够解决难题的心中慢慢的满足感需要释放,在coot里头手动调整,自娱自乐,经过多轮model building in coot和Phenix-refine之后,最后的R/Rfree降到了18%以下。我不由得对着屏幕感慨了良久,现在的算法和软件真心太棒了,解析结构大部分时候不是瓶颈(我曾经在美国耶鲁大学留学的时候,有个结构的解析全程只花了一刻钟左右),还是要重心在结构测定之后的科学问题的推进。
感谢那些伟大的科学家,不断的努力,不断的推动,精细和优化基础理论,让算法和软件这么棒,从而将结构生物学工作者从繁琐的脑力劳动和体力劳动中解放出来,拿到精修的model之后,深入分析结构,设计实验,挖掘和分析功能,阐释结构与功能的关系,把更多的精力和时间投入到生物学问题的解释和发现上,然后是写作科学“八股文”还是“散文”或者“诗歌”,解释生物大分子的分子机制,基于结构为基础的药物设计与优化等等,探索生物大分子对人类健康与疾病和工农业的改造优化等等的关系。
不抛弃不放弃,永不言败,坚韧不拔,大概这就是结构生物学的无穷魔力所在吧。