美研制“符号散点图”工具 可将基因序列转译成
时间:2017-12-08

  科学与发展网络(SciDev.Net) - 美国开发“符号分散”工具将基因序列翻译成图像

  美国科学家已经开发出一种新的工具,将DNA序列翻译成图像,这将有助于识别导致癌症,亨廷顿病和其他遗传疾病的DNA谱的实时变化,从而使研究人员更快,更有效。进入世袭模式。

  这个由北卡罗来纳州立大学计算机科学博士生David Cox提供的符号散点图工具提供了DNA序列的直观表示。考克斯解释说,人类视觉系统比寻求重复DNA序列的现有计算机程序更能识别模式并区分模式。换句话说,肉眼观看图片的能力目前比计算机更强。

  确定DNA序列的模式非常重要,因为它可以帮助研究人员确定疾病患者(如癌症患者)和健康个体之间的实时遗传变异。提高DNA序列的识别能力有望加速对各种疾病更成功的治疗方法的开发,并使研究人员能够关注部分与该疾病相关的DNA,并增加对这些疾病遗传机制的理解。例如,究竟是什么打开或关闭一个特定的基因?

  那么Symbol Scatter工具如何创​​建DNA的可视化表示呢? DNA由四个核苷酸组成,用字母A,T,G和C表示,并且这些核苷酸的每三个字母串如AAA或ATG被称为3-mers。 Cox解释说,有64种3个矩阵,每个矩阵用0到63的数字来表示。符号分散工具将使用一个很长的字符串来表示DNA序列,并将它们逐一分成三个矩阵。为每个3矩阵绘制一个点,数字0到63作为Y轴。 X轴表示三个底物出现在基因序列中的序列。由此产生的散点图揭示了原始DNA中的有趣模式。一起打击这些scatterpots可以使动画比较DNA序列。

  考克斯选择矩阵3的原因是它与密码子有关,密码子是用来在身体的蛋白质生成中插入特定氨基酸的遗传密码,换句话说,它们监控蛋白质的生成,蛋白质的基本构建人体。

  考克斯说,虽然有64个64个基质,但只有20个氨基酸,所以每个氨基酸对应一个3个以上的基质。这种由Cox设计的符号散点图允许这些对应于相应氨基酸的3个底物彼此相邻。因此,从三种底物中的一种氨基酸到另一种氨基酸存在显着差异时,很容易判断。

  物理学家网络报告(英文)