DNA结合蛋白

当前话题为您枚举了最新的DNA结合蛋白。在这里,您可以轻松访问广泛的教程、示例代码和实用工具,帮助您有效地学习和应用这些核心编程技术。查看页面下方的资源列表,快速下载您需要的资料。我们的资源覆盖从基础到高级的各种主题,无论您是初学者还是有经验的开发者,都能找到有价值的信息。

基于MATLAB的HTa蛋白DNA结合预测模型
本代码库提供基于MATLAB的非参数化模型,用于预测嗜酸嗜热菌DNA结合蛋白HTa的结合位点。该模型利用LASSO回归算法,并结合MNase-seq数据进行峰值检测和评分,进而评估HTa蛋白在不同基因组区域的结合差异。 代码使用方法: 运行LASSO_Input_file_generation.R脚本生成LASSO模型的输入文件。 使用MATLAB R2018a版本运行AH_LASSO_script.m脚本,输入步骤1生成的模型文件,得到LASSO模型系数。 运行LASSO_output_file_generation.R脚本,输入步骤2得到的模型系数以及计算得到的Kmers丰度,生成最终的预测结果。 运行Peak_detection_and_scoring_on_indep_bwFile.R脚本,利用Bioconductor NucleR包对不同MNase-seq数据进行峰值检测和评分,并计算其相对不对称性,用于评估HTa蛋白在不同基因组区域的结合差异。 依赖: MATLAB R2018a R Bioconductor NucleR包
BayesPI探索蛋白质-DNA相互作用的新生物物理模型
为了深入了解贝叶斯分层模型中超参数重估计技术的实施,我们在BayesPI中采用了贝叶斯模型正则化和生物物理建模,引入了拉普拉斯和柯西先验。我们还根据神经网络的结构属性将超参数(模型的正则化常数)分成多个类别。新的BayesPI模型已在合成和真实ChIP数据集上进行了测试,以识别蛋白质结合能矩阵。
PHYLIP DNA简约算法GUIPHYLIP 3.6中DNA简约算法的图形用户界面
这个软件包是Phylip 3.6中dnapars.exe的修改版本,原先的版本使用菜单设置参数,我改为了命令行驱动的mbetoolbox_dnapars.exe,并为其构建了MATLAB接口。在MATLAB中,只需设置路径后,您可以轻松地运行mbetoolbox_dnapars。输入文件应为Phylip格式的对齐DNA序列,命名为“infile”。更多关于Phyip包的信息,请参考:http://evolution.genetics.washington.edu/phylip.html。
DNA提取方法对比分析
比较了水生微生物生态学中两种广泛使用的DNA提取方法:苯酚-氯仿法和PowerSoil DNA分离试剂盒。研究评估这两种方法在社区生态学分析中的适用性和效果。尽管OTU数量较少,但这些方法对社区结构的影响显著,且它们的结果差异显著,不可相提并论。文章提供了用于统计分析的脚本,并包含了相关数据集的SRA登录号在NCBI数据库中。
fastAlign: 蛋白质-蛋白质相互作用网络快速全局比对算法
fastAlign算法代码解析 本仓库包含fastAlign算法的MATLAB源代码,该算法用于蛋白质-蛋白质相互作用网络的快速全局比对。 代码结构 examples/: 包含mat3_greedy算法的运行示例,可通过运行example.m文件进行测试。 data/: 存放示例所需的数据文件。 code/: 存放算法实现的脚件,包括: MAT3_rank.m: 根据输入网络的邻接矩阵、alpha值、迭代次数和首选项矩阵计算相似性矩阵。 greedy_match.m: 根据输入网络对的相似性矩阵计算匹配矩阵M。 align.m: 根据输入的两个邻接矩阵和匹配度计算两个网络的对齐图。 bio_components.m: 计算并输出输入网络对的对齐图中的(强连接)组件。 其他说明 大部分实验还解析了iso_greedy、iso_hungarian和mat3_auction的输出结果,并将结果保存在对应数据集文件夹中。 数值计算部分使用了MATLAB文件,并可能调用了netalign项目中的其他代码。 IsoRank计算使用了本机二进制文件,具体使用方法请参考其文档。
Fortran to MATLAB Programmatic Eulerian Routing for DNA Design with PERDIX
PERDIX (P rogrammed Eulerian Routing for DNA Design using X-overs) is a new, free, and open-source software package written in FORTRAN 90/95 that automates the conversion of 2D computer-generated design files into DNA sequences. These sequences can then be synthesized and mixed to create high-fidelity folded structures based on DNA DX in a 2D lattice framework. The software features a pure Fortran library designed for automated sequence design with support for the GEO (PERDIX's geometric file format) or other input formats for precise edge-length designs of asymmetric and irregular shapes. It provides an intuitive text-based user interface (TUI) suitable for Microsoft Windows and Mac OS, offering 24 predefined target geometric shapes for editing stapled paths and sequences with 3D visual output.
蛋白结构数据库的详细介绍
这份PPT详细介绍了蛋白结构数据库的内容和重要性。涵盖了不同类型的数据库及其在科学研究中的应用,是理解蛋白质结构与功能关系的重要工具。
DIAMOND 2.1.8: Linux版超快蛋白序列比对软件
DIAMOND是一款速度超快的蛋白质序列比对软件,其最新Linux版本2.1.8现已发布。 DIAMOND的主要特点: 比BLAST快500到20,000倍 支持长序列的移框联配分析 资源消耗小,可在普通台式机和笔记本电脑上运行 支持多种输出格式
欧洲国家蛋白质消费数据分析
这是一个关于欧洲国家蛋白质消费数据的txt文件,名为protein.txt。数据集采用制表符作为分隔符,包含了25个国家对9类食物的消费数据。每一行记录代表一个国家的蛋白质消费情况。
基于傅立叶功率谱的DNA序列聚类方法——MATLAB开发
如果您使用我们的代码,请务必引用我们的论文《一种新的基于傅立叶功率谱的DNA序列聚类方法》!论文链接:http://dx.doi.org/10.1016/j.jtbi.2015.026