DNA结合蛋白
当前话题为您枚举了最新的DNA结合蛋白。在这里,您可以轻松访问广泛的教程、示例代码和实用工具,帮助您有效地学习和应用这些核心编程技术。查看页面下方的资源列表,快速下载您需要的资料。我们的资源覆盖从基础到高级的各种主题,无论您是初学者还是有经验的开发者,都能找到有价值的信息。
基于MATLAB的HTa蛋白DNA结合预测模型
本代码库提供基于MATLAB的非参数化模型,用于预测嗜酸嗜热菌DNA结合蛋白HTa的结合位点。该模型利用LASSO回归算法,并结合MNase-seq数据进行峰值检测和评分,进而评估HTa蛋白在不同基因组区域的结合差异。
代码使用方法:
运行LASSO_Input_file_generation.R脚本生成LASSO模型的输入文件。
使用MATLAB R2018a版本运行AH_LASSO_script.m脚本,输入步骤1生成的模型文件,得到LASSO模型系数。
运行LASSO_output_file_generation.R脚本,输入步骤2得到的模型系数以及计算得到的Kmers丰度,生成最终的预测结果。
运行Peak_detection_and_scoring_on_indep_bwFile.R脚本,利用Bioconductor NucleR包对不同MNase-seq数据进行峰值检测和评分,并计算其相对不对称性,用于评估HTa蛋白在不同基因组区域的结合差异。
依赖:
MATLAB R2018a
R
Bioconductor NucleR包
Matlab
5
2024-05-30
BayesPI探索蛋白质-DNA相互作用的新生物物理模型
为了深入了解贝叶斯分层模型中超参数重估计技术的实施,我们在BayesPI中采用了贝叶斯模型正则化和生物物理建模,引入了拉普拉斯和柯西先验。我们还根据神经网络的结构属性将超参数(模型的正则化常数)分成多个类别。新的BayesPI模型已在合成和真实ChIP数据集上进行了测试,以识别蛋白质结合能矩阵。
Matlab
0
2024-09-20
PHYLIP DNA简约算法GUIPHYLIP 3.6中DNA简约算法的图形用户界面
这个软件包是Phylip 3.6中dnapars.exe的修改版本,原先的版本使用菜单设置参数,我改为了命令行驱动的mbetoolbox_dnapars.exe,并为其构建了MATLAB接口。在MATLAB中,只需设置路径后,您可以轻松地运行mbetoolbox_dnapars。输入文件应为Phylip格式的对齐DNA序列,命名为“infile”。更多关于Phyip包的信息,请参考:http://evolution.genetics.washington.edu/phylip.html。
Matlab
0
2024-09-28
DNA提取方法对比分析
比较了水生微生物生态学中两种广泛使用的DNA提取方法:苯酚-氯仿法和PowerSoil DNA分离试剂盒。研究评估这两种方法在社区生态学分析中的适用性和效果。尽管OTU数量较少,但这些方法对社区结构的影响显著,且它们的结果差异显著,不可相提并论。文章提供了用于统计分析的脚本,并包含了相关数据集的SRA登录号在NCBI数据库中。
统计分析
0
2024-08-13
fastAlign: 蛋白质-蛋白质相互作用网络快速全局比对算法
fastAlign算法代码解析
本仓库包含fastAlign算法的MATLAB源代码,该算法用于蛋白质-蛋白质相互作用网络的快速全局比对。
代码结构
examples/: 包含mat3_greedy算法的运行示例,可通过运行example.m文件进行测试。
data/: 存放示例所需的数据文件。
code/: 存放算法实现的脚件,包括:
MAT3_rank.m: 根据输入网络的邻接矩阵、alpha值、迭代次数和首选项矩阵计算相似性矩阵。
greedy_match.m: 根据输入网络对的相似性矩阵计算匹配矩阵M。
align.m: 根据输入的两个邻接矩阵和匹配度计算两个网络的对齐图。
bio_components.m: 计算并输出输入网络对的对齐图中的(强连接)组件。
其他说明
大部分实验还解析了iso_greedy、iso_hungarian和mat3_auction的输出结果,并将结果保存在对应数据集文件夹中。
数值计算部分使用了MATLAB文件,并可能调用了netalign项目中的其他代码。
IsoRank计算使用了本机二进制文件,具体使用方法请参考其文档。
Matlab
3
2024-06-30
Fortran to MATLAB Programmatic Eulerian Routing for DNA Design with PERDIX
PERDIX (P rogrammed Eulerian Routing for DNA Design using X-overs) is a new, free, and open-source software package written in FORTRAN 90/95 that automates the conversion of 2D computer-generated design files into DNA sequences. These sequences can then be synthesized and mixed to create high-fidelity folded structures based on DNA DX in a 2D lattice framework. The software features a pure Fortran library designed for automated sequence design with support for the GEO (PERDIX's geometric file format) or other input formats for precise edge-length designs of asymmetric and irregular shapes. It provides an intuitive text-based user interface (TUI) suitable for Microsoft Windows and Mac OS, offering 24 predefined target geometric shapes for editing stapled paths and sequences with 3D visual output.
Matlab
0
2024-11-04
蛋白结构数据库的详细介绍
这份PPT详细介绍了蛋白结构数据库的内容和重要性。涵盖了不同类型的数据库及其在科学研究中的应用,是理解蛋白质结构与功能关系的重要工具。
MySQL
2
2024-07-19
DIAMOND 2.1.8: Linux版超快蛋白序列比对软件
DIAMOND是一款速度超快的蛋白质序列比对软件,其最新Linux版本2.1.8现已发布。
DIAMOND的主要特点:
比BLAST快500到20,000倍
支持长序列的移框联配分析
资源消耗小,可在普通台式机和笔记本电脑上运行
支持多种输出格式
数据挖掘
2
2024-05-26
欧洲国家蛋白质消费数据分析
这是一个关于欧洲国家蛋白质消费数据的txt文件,名为protein.txt。数据集采用制表符作为分隔符,包含了25个国家对9类食物的消费数据。每一行记录代表一个国家的蛋白质消费情况。
统计分析
0
2024-10-21
基于傅立叶功率谱的DNA序列聚类方法——MATLAB开发
如果您使用我们的代码,请务必引用我们的论文《一种新的基于傅立叶功率谱的DNA序列聚类方法》!论文链接:http://dx.doi.org/10.1016/j.jtbi.2015.026
Matlab
2
2024-07-17