结构生物信息学常用的py模块

  • PConPy 用于生成二维蛋白质包括空间、距离、氢键分析
  • PyRosetta 自定义的结构预测和设计算法、设计实施和示范蛋白质对接算法,蛋白质折叠,循环模型
  • Biskit 一个py库,分析大分子结构,分子动力学和蛋白质复合物
  • PROVAT 一种蛋白质结构的Voronoi镶嵌和复合物的分析工具
  • ProDy 同源蛋白质,其突为和序列抑制剂分析
  • PyETV 一个查看,分析和预测其操纵的重要蛋白质的pymol插件
  • GimmeMotifs 一个为ChLp芯片做管道分析的包,python实现,可是运行在linux下
  • PIANA 蛋白质的相互作用和网络分析,凝胶蛋白质电泳相互作用 ** 这个比较重要

Blast,(关键点是局部匹配)全称Basic Local Alignment Search Tool,即“基于局部比对算法的搜索工具”,由Altschul等人于1990年发布。Blast能够实现比较两段核酸或者蛋白序列之间的同源性的功能,它能够快速的找到两段序列之间的同源序列并对比对区域进行打分以确定同源性的高低。Blast具有较快的比对速度和较高的比对精度,适用于多种序列比对的情况,在常规双序列比对分析中应用最为广泛。可以毫不夸张的说,blast是做比较基因组学乃至整个生物信息学研究所必须掌握的一种比对工具。

BLAST的运行方式

先用目标序列建数据库(这种数据库称为database,里面的每一条序列称为subject),然后用待查的序列(称为query)在database中搜索,每一条query与database中的每一条subject都要进行双序列比对,从而得出全部比对结果。

  • DNA微阵列或芯片技术:利用光导化学合成、照相平板印刷以及固相表面化学合成,在固相表面合成一堆寡核苷酸探针,或将液相合成的探针由微阵列器或机器人点样于尼龙膜或硅片上,再与放射性同位素的DNA(CDNA)杂交,用于分析DNA突变及多态性、DNA测序、监测同一组织细胞在不同状态下或同一状态下多种组织基因表达水平的差异、发现新的致病基因或疾病等。
  • 单核苷酸多态性:利用的是同一位点的等位差异就那么几种的特性

  • 多态性:多态性是指以适当频率在一个群体的某个特定遗传位点(基因序列或非基因序列)发生两种或两种以上变异的现象,可通过直接分析DNA或基因产物来确定。

  • 开放阅读框架的识别手段:一种是用像隐式马尔可夫的GENSCAN概率上猜 一种是和dbEST库比对

  • EBI 欧洲生物信息学研究所

  • EMBL 欧洲分子生物学实验室
  • EMBnet欧洲分子生物学网络 -Entrez 美国国家生物技术信息中心提供的在线资源检索器
  • EPD 真核启动子数据库
  • HGMP人类基因组绘图计划
  • HSSP 基于蛋白质、序列对比中的结构内涵的蛋白质同源数据库

目前大多数重要技术都是依据一个关键的原则:分子之间的序列和结构的同源性 分子生物学的中心法则:DNA可以自我复制,DNA可以转录成RNA,RNA可以翻译成蛋白质