为了深入了解贝叶斯分层模型中超参数重估计技术的实施,我们在BayesPI中采用了贝叶斯模型正则化和生物物理建模,引入了拉普拉斯和柯西先验。我们还根据神经网络的结构属性将超参数(模型的正则化常数)分成多个类别。新的BayesPI模型已在合成和真实ChIP数据集上进行了测试,以识别蛋白质结合能矩阵。
BayesPI探索蛋白质-DNA相互作用的新生物物理模型
相关推荐
fastAlign: 蛋白质-蛋白质相互作用网络快速全局比对算法
fastAlign算法代码解析
本仓库包含fastAlign算法的MATLAB源代码,该算法用于蛋白质-蛋白质相互作用网络的快速全局比对。
代码结构
examples/: 包含mat3_greedy算法的运行示例,可通过运行example.m文件进行测试。
data/: 存放示例所需的数据文件。
code/: 存放算法实现的脚件,包括:
MAT3_rank.m: 根据输入网络的邻接矩阵、alpha值、迭代次数和首选项矩阵计算相似性矩阵。
greedy_match.m: 根据输入网络对的相似性矩阵计算匹配矩阵M。
align.m: 根据输入的两个邻接矩阵和匹配度计算两个网络的对齐图。
bio_components.m: 计算并输出输入网络对的对齐图中的(强连接)组件。
其他说明
大部分实验还解析了iso_greedy、iso_hungarian和mat3_auction的输出结果,并将结果保存在对应数据集文件夹中。
数值计算部分使用了MATLAB文件,并可能调用了netalign项目中的其他代码。
IsoRank计算使用了本机二进制文件,具体使用方法请参考其文档。
Matlab
3
2024-06-30
遗传算法MATLAB初始化种群代码——HP模型蛋白质折叠
在MAI的CI主题背景下开发的项目,解决蛋白质折叠问题,应对自回避路径约束下的优化挑战,并利用MATLAB的optimtool支持代码执行。其主要功能包括:能量函数利用构象指标测量填充正方形空间中每个H氨基酸邻居的能量;初始化阶段有两种实现方式:随机线圈和完全扩展,前者尝试从随机排序的可能方向进行选择,后者则使用所有构象的's';突变阶段随机选择可能的变异,并通过调用acceptance函数实现之前描述的决策;交叉阶段仅实施1点交叉,并要求接受。代码结构随时间演化温度,加速程序。
Matlab
0
2024-08-10
人口增长模型MATLAB代码 - 最小种间相互作用调节工具
人口增长模型MATLAB代码最小种间相互作用调整(MIIA)是用于推断微生物群落中成员依赖性相互作用的工具,深化了我们对生态群落组织原理的理解。该存储库包含MATLAB代码和数据集,适用于Windows、Mac OS和Linux中的MATLAB R2015b+。要使用不同的MIIA版本,请解压数据文件夹中的glvData.zip并参照教程运行runMiia文件。
Matlab
0
2024-08-23
ProteinContactMap.zip 蛋白质接触图的视觉化-MATLAB开发
这段代码可以用于从给定的蛋白质PDB数据计算欧几里德距离,并生成蛋白质接触图的可视化。
Matlab
3
2024-08-01
基于MATLAB的HTa蛋白DNA结合预测模型
本代码库提供基于MATLAB的非参数化模型,用于预测嗜酸嗜热菌DNA结合蛋白HTa的结合位点。该模型利用LASSO回归算法,并结合MNase-seq数据进行峰值检测和评分,进而评估HTa蛋白在不同基因组区域的结合差异。
代码使用方法:
运行LASSO_Input_file_generation.R脚本生成LASSO模型的输入文件。
使用MATLAB R2018a版本运行AH_LASSO_script.m脚本,输入步骤1生成的模型文件,得到LASSO模型系数。
运行LASSO_output_file_generation.R脚本,输入步骤2得到的模型系数以及计算得到的Kmers丰度,生成最终的预测结果。
运行Peak_detection_and_scoring_on_indep_bwFile.R脚本,利用Bioconductor NucleR包对不同MNase-seq数据进行峰值检测和评分,并计算其相对不对称性,用于评估HTa蛋白在不同基因组区域的结合差异。
依赖:
MATLAB R2018a
R
Bioconductor NucleR包
Matlab
5
2024-05-30
蛋白质组学质谱分析的基础及数据处理技术
蛋白质组学质谱分析的基本原理与方法介绍。2. 使用GPM(X!tandem)进行蛋白质组学数据库检索的技术解析。3. TPP软件在蛋白质组学数据统计分析中的应用详解。
统计分析
1
2024-07-16
小麦品种蛋白质产量与植株性状关联的统计分析(1989年)
对73个小麦品种的36个性状进行了详细统计分析,筛选出对蛋白质百分含量(GPC)、单粒蛋白质产量(GPY)、单株籽粒蛋白质产量(PPY)具有显著影响的5个性状。进一步探讨了蛋白质性状与必需氨基酸、非必需氨基酸、产量因素、形态性状和生育期性状之间的关系,并得出了在蛋白质性状综合改良中最关键的8个性状。讨论了蛋白质产量作为育种材料评价和提升蛋白质生产力的重要性。
统计分析
2
2024-07-21
Matlab整合C代码预测增强剂促进剂相互作用框架PEP
Matlab整合的C代码PEP(预测增强剂促进剂相互作用)是一种用于预测远程增强子-启动子相互作用(EPI)的框架。该框架结合了两种从增强子和启动子DNA序列中提取特征的策略:PEP-Motif、PEP-Word和PEP-Integrate。每个模块都利用梯度树增强训练EPI预测器,以基于增强子-启动子对的特征表示。PEP方法主要基于E/P数据集进行训练和评估,通过搜索已知转录因子结合位点(TFBS)的模式来表征增强子或启动子的特征。
Matlab
0
2024-08-22
Matlab中OR网络嗅觉受体(OR)与增味剂的成对相互作用网络及相关分析
Matlab存档算法代码在人类嗅觉受体中揭示了模块化结构,涉及气味剂与嗅觉受体(OR)的成对相互作用网络。该存储库包含了用于模块化结构发现的Matlab实现中的分组算法。数据准备好在Cytoscape中导入,并与手稿一起审阅。系统要求:Matlab代码在Mac OS X 10.12-10.14上使用Matlab R2016b编写和测试,无需额外工具箱,仅需标准计算机和足够的RAM支持。
Matlab
2
2024-07-17