购物车MATLAB使用多个高通量测序数据建立基因调控的贝叶斯CART模型。我们关注的问题如下:如果我们有大量大肠杆菌的RNASeq数据,以及与基因启动子结合的转录因子(TFs)的一些ChIPSeq数据,我们如何建模TFs及其结合的基因之间的调控关系?

有一些有用的信息和警告供我们考虑:RNASeq数据揭示了TF和其mRNA形式的基因的活性水平。这很有用,因为当TF是基因的真正调节子时,我们可能期望TF与基因之间存在一些“相关性”。例如,如果TF X是基因Y的激活剂,我们可能期望对应于高Y的高X。关于第一个要点的警告:TF以蛋白质而不是mRNA的形式调节基因,因此实际上只是使用RNASeq数据表示TF活性水平的近似值。对于需要翻译后修饰才能生效的TF,这种近似将很不利。

ChIPSeq数据告诉我们哪个TF在什么亲和力水平上绑定到哪里。这很有用,因为我们可以预料到,当TF X是基因Y的真正调节子时,X倾向于以高亲和力结合在Y附近的某个地方。关于第2点的警告:并非所有结合都是监管性的。如果我们将结合视为热力学事件,则这很容易理解。但是,当我们说调节结合是具