为了深入了解贝叶斯分层模型中超参数重估计技术的实施,我们在BayesPI中采用了贝叶斯模型正则化和生物物理建模,引入了拉普拉斯和柯西先验。我们还根据神经网络的结构属性将超参数(模型的正则化常数)分成多个类别。新的BayesPI模型已在合成和真实ChIP数据集上进行了测试,以识别蛋白质结合能矩阵。
BayesPI探索蛋白质-DNA相互作用的新生物物理模型
相关推荐
fastAlign: 蛋白质-蛋白质相互作用网络快速全局比对算法
fastAlign算法代码解析
本仓库包含fastAlign算法的MATLAB源代码,该算法用于蛋白质-蛋白质相互作用网络的快速全局比对。
代码结构
examples/: 包含mat3_greedy算法的运行示例,可通过运行example.m文件进行测试。
data/: 存放示例所需的数据文件。
code/: 存放算法实现的脚件,包括:
MAT3_rank.m: 根据输入网络的邻接矩阵、alpha值、迭代次数和首选项矩阵计算相似性矩阵。
greedy_match.m: 根据输入网络对的相似性矩阵计算匹配矩阵M。
align.m: 根据输入的两个邻接矩阵和匹配度计算两个网络的对齐图。
bio_components.m: 计算并输出输入网络对的对齐图中的(强连接)组件。
其他说明
大部分实验还解析了iso_greedy、iso_hungarian和mat3_auction的输出结果,并将结果保存在对应数据集文件夹中。
数值计算部分使用了MATLAB文件,并可能调用了netalign项目中的其他代码。
IsoRank计算使用了本机二进制文件,具体使用方法请参考其文档。
Matlab
3
2024-06-30
MATLAB代码-LPI_KTASLP基于半监督链接预测的lncRNA-蛋白质相互作用与核靶标比对方法
Matlab的LPI_KTASLP方法基于半监督链接预测,专注于lncRNA与蛋白质的相互作用和核靶标的比对。输入数据以矩阵形式表示lncRNA和蛋白质的相似性,其中高斯相似度矩阵由kernel_gip.m构建。核心方法代码存储在LapkronrlsMF.m文件中。所有代码和结果以.rar格式打包,方便下载和上载。要运行程序,请确保.mat和代码文件在同一目录下。使用MATLAB环境,建议4核CPU和20 GB内存,64位Windows操作系统。数据基准数据集详见[1],包括4158个lncRNA-蛋白质相互作用,990个lncRNA和27个蛋白质。结果展示包括AUC.fig、AUPR_loo.fig、AUC_loo.fig、AUPR.fig和results_TKA_LapMFsum.mat。案例研究结果存放在local_cases文件夹中。参考资料:[1]
Matlab
0
2024-09-21
欧洲国家蛋白质消费数据分析
这是一个关于欧洲国家蛋白质消费数据的txt文件,名为protein.txt。数据集采用制表符作为分隔符,包含了25个国家对9类食物的消费数据。每一行记录代表一个国家的蛋白质消费情况。
统计分析
0
2024-10-21
遗传算法MATLAB初始化种群代码——HP模型蛋白质折叠
在MAI的CI主题背景下开发的项目,解决蛋白质折叠问题,应对自回避路径约束下的优化挑战,并利用MATLAB的optimtool支持代码执行。其主要功能包括:能量函数利用构象指标测量填充正方形空间中每个H氨基酸邻居的能量;初始化阶段有两种实现方式:随机线圈和完全扩展,前者尝试从随机排序的可能方向进行选择,后者则使用所有构象的's';突变阶段随机选择可能的变异,并通过调用acceptance函数实现之前描述的决策;交叉阶段仅实施1点交叉,并要求接受。代码结构随时间演化温度,加速程序。
Matlab
0
2024-08-10
人口增长模型MATLAB代码 - 最小种间相互作用调节工具
人口增长模型MATLAB代码最小种间相互作用调整(MIIA)是用于推断微生物群落中成员依赖性相互作用的工具,深化了我们对生态群落组织原理的理解。该存储库包含MATLAB代码和数据集,适用于Windows、Mac OS和Linux中的MATLAB R2015b+。要使用不同的MIIA版本,请解压数据文件夹中的glvData.zip并参照教程运行runMiia文件。
Matlab
0
2024-08-23
ProteinContactMap.zip 蛋白质接触图的视觉化-MATLAB开发
这段代码可以用于从给定的蛋白质PDB数据计算欧几里德距离,并生成蛋白质接触图的可视化。
Matlab
3
2024-08-01
基于MATLAB的HTa蛋白DNA结合预测模型
本代码库提供基于MATLAB的非参数化模型,用于预测嗜酸嗜热菌DNA结合蛋白HTa的结合位点。该模型利用LASSO回归算法,并结合MNase-seq数据进行峰值检测和评分,进而评估HTa蛋白在不同基因组区域的结合差异。
代码使用方法:
运行LASSO_Input_file_generation.R脚本生成LASSO模型的输入文件。
使用MATLAB R2018a版本运行AH_LASSO_script.m脚本,输入步骤1生成的模型文件,得到LASSO模型系数。
运行LASSO_output_file_generation.R脚本,输入步骤2得到的模型系数以及计算得到的Kmers丰度,生成最终的预测结果。
运行Peak_detection_and_scoring_on_indep_bwFile.R脚本,利用Bioconductor NucleR包对不同MNase-seq数据进行峰值检测和评分,并计算其相对不对称性,用于评估HTa蛋白在不同基因组区域的结合差异。
依赖:
MATLAB R2018a
R
Bioconductor NucleR包
Matlab
5
2024-05-30
蛋白质组学质谱分析的基础及数据处理技术
蛋白质组学质谱分析的基本原理与方法介绍。2. 使用GPM(X!tandem)进行蛋白质组学数据库检索的技术解析。3. TPP软件在蛋白质组学数据统计分析中的应用详解。
统计分析
1
2024-07-16
Matlab整合C代码预测增强剂促进剂相互作用框架PEP
Matlab整合的C代码PEP(预测增强剂促进剂相互作用)是一种用于预测远程增强子-启动子相互作用(EPI)的框架。该框架结合了两种从增强子和启动子DNA序列中提取特征的策略:PEP-Motif、PEP-Word和PEP-Integrate。每个模块都利用梯度树增强训练EPI预测器,以基于增强子-启动子对的特征表示。PEP方法主要基于E/P数据集进行训练和评估,通过搜索已知转录因子结合位点(TFBS)的模式来表征增强子或启动子的特征。
Matlab
0
2024-08-22