怎么建設自己網(wǎng)站企業(yè)宣傳推廣
大家好,這里是專注表觀組學十余年,領跑多組學科研服務的易基因。
2021年10月6日,《Nat Commun》雜志發(fā)表了題為“Pig genome functional annotation enhances the biological interpretation of complex traits and human disease”的研究論文,該研究通過對豬的腸相關組織(胃、空腸、十二指腸、回腸、結腸、盲腸)進行ChIP-seq、ATAC-seq、RRBS、RNA-seq等實驗,對豬基因組的系統(tǒng)功能注釋顯著增強了對豬復雜性狀和人類疾病遺傳控制的理解。

標題:Pig genome functional annotation enhances the biological interpretation of complex traits and human disease
時間:2021.10.06
期刊:nature communications
影響因子:IF 17.694
技術平臺:ChIP-seq、ATAC-seq、RRBS、RNA-seq等
樣本實驗:
從兩頭6月齡的同窩約克公豬身上收集五個腸相關組織(胃、空腸、十二指腸、回腸、結腸)和兩頭5月齡的雌性雜交豬(約克郡-漢普郡雜交)身上收集盲腸組織樣本。樣本采集后首先在液氮中快速冷凍,然后在–80°C下儲存直至進行ChIP-seq、ATAC-seq、RRBS、RNA-seq實驗,實驗設置兩個生物學重復。
ChIP-seq:對快速冷凍組織樣品進行ChIP-seq(H3K4me3,H3K4me1,H3K27ac和H3K27me3)實驗。
ATAC-seq:對從冷凍組織樣本中生成的和冷凍保存的細胞核進行ATAC-seq實驗。
RRBS:從冷凍組織中提取DNA進行簡化基因組甲基化測序(RRBS)。
RNA-seq:從速凍組織中分離出總RNA進行轉錄組測序(RNA-seq)。
六個腸相關組織(胃、空腸、十二指腸、回腸、結腸、盲腸)的ChIP-seq(H3K4me3,H3K4me1、H3K27ac、H3K27me3、input對照),ATAC-seq,RRBS和RNA-seq共生成95個新數(shù)據(jù)集。
另外整合了FAANG試點項目(PRJEB14330)八個組織(脂肪、小腦、腦皮層、下丘腦、肝、肺、肌肉和脾臟)現(xiàn)有ChIP-seq(H3K4me3、H3K4me1、H3K27ac、H3K27me3、CTCF,input對照)、ATAC-seq、RRBS和RNA-seq的144個豬表觀基因組數(shù)據(jù)集,以及公開數(shù)據(jù)集(PRJEB27364)的4個Hi-C豬肝數(shù)據(jù)集。
研究摘要:
牲畜基因組的功能注釋對于理解支撐具有經(jīng)濟重要性的復雜性狀、適應性進化和比較基因組學的分子機制至關重要。本研究通過整合223個表觀基因組和轉錄組數(shù)據(jù)集(共14個生物學上的重要組織),提供迄今為止最全面的豬(Sus scrofa)調(diào)控元件目錄。研究人員通過對15種不同染色質(zhì)狀態(tài)進行功能注釋并定義其組織特異性調(diào)控活性以系統(tǒng)性描述不同組織的動態(tài)表觀遺傳景觀。研究表明與豬的復雜性狀和適應性進化相關的基因組變化在活性啟動子和增強子中顯著富集。此外研究還揭示了亞洲豬和歐洲豬馴化過程之間不同的組織特異性調(diào)控選擇。與人和小鼠表觀基因組相比,豬的調(diào)控元件在快速和緩慢進化的DNA序列中比在豬、小鼠和人的中等進化中保守。最后通過整合47個人類全基因組關聯(lián)研究(GWAS)數(shù)據(jù),提供了關于組織特異性調(diào)控保守的生物學見解。證明了根據(jù)性狀,小鼠或豬可能是更適合不同復雜性狀和疾病的生物醫(yī)學模型。
結果圖形
(1)數(shù)據(jù)摘要
整合豬14個主要組織的223個全基因組測序數(shù)據(jù)集,其中通過染色質(zhì)免疫沉淀測序(ChIP-seq)檢測四種組蛋白修飾(H3K4me3、H3K4me1、H3K27ac和H3K27me3)、通過染色質(zhì)轉座酶可及性測序(ATAC-seq)檢測轉座酶可及的染色質(zhì)、通過減少代表性重亞硫酸鹽測序(RRBS)檢測DNA甲基化水平、通過RNA-seq進行基因表達。在對樣本進行比對和過濾后,共生成約9 billion的比對reads,平均比率為68.81%。在14個組織中,共獲得H3K4me3、H3K4me1、H3K27ac、H3K27me3和ATAC的平均peaks分別為32387、106849、72252、98721和122585,平均大小分別為794 bp、1894 bp、618 bp、1190 bp和653bp,分別覆蓋全基因組的1.56%、2.78%、2.37%、7.74%和3.31%(圖1b、c)。此外,利用8個組織(脂肪、小腦、腦皮層、下丘腦、肝、肺、肌肉和脾臟)的16個CTCF ChIP-seq數(shù)據(jù)集和肝臟組織的4個Hi-C數(shù)據(jù)集來鑒定CTCF和Hi-C環(huán),以將調(diào)節(jié)元件(增強子)與潛在靶基因相關聯(lián)。

圖1:不同組織和標記的表觀基因組信息數(shù)據(jù)
該研究檢測所利用的組織。
不同組織中表觀遺傳標記的平均peaks數(shù)。
不同組織中表觀遺傳標記的基因組覆蓋率。
基于全基因組1kb窗口歸一化信號的檢測、組織和生物學重復(P348和P350)間的Pearson相關性
蛋白質(zhì)編碼基因近端的平均表觀遺傳標記信號。TSS轉錄起始位點,TES轉錄終止位點。
根據(jù)不同檢測和不同組織在MYO1A位點的表觀遺傳信號。UCSC軌跡垂直比例顯示歸一化信號:RNA-seq為0-200、H3K27ac和H3K4me3為0-100、其他標記和ATAC-seq為0-50。
基于表觀遺傳標記的和基因表達譜的信號強度對樣本進行分層聚類清楚地概括了測序分析,隨后組織類型和生物學重復(圖1d)與主成分分析(PCA)結果一致。六種檢測形成三個主要簇:(1)活性調(diào)控區(qū)(H3K4me3、H3K27ac、H3K4me1和ATAC);(2)Polycomb抑制(H3K27me3)和(3)基因表達(RNA-seq)。四個活性調(diào)控標記呈正相關,但與H3K27me3(尤其是H3K27ac)呈負相關。RNA-seq(基因體內(nèi))信號強度與活性調(diào)控標記呈弱正相關,與H3K27me3呈負相關??傮w而言,三個活性調(diào)控標記(ATAC、H3K4me3、H3K27ac)在不同組織間的基因轉錄起始位點(TSS)上游顯示出peak,而H3K4me1在TSS上游1?kb范圍內(nèi)顯示出peak(圖1e)。
為闡明腸組織中大腸桿菌感染和微絨毛膜形態(tài)相關的調(diào)控元件和基因表達的復雜相互作用,研究人員進行了肌球蛋白1A(MYO1A)分析。MYO1A在腸組織中特異性高表達,并在腸組織TSS周圍顯示出H3K27ac信號特異性富集,但在其他組織中未見(圖1f)。此外MYO1A的TSS對其他活性調(diào)控標記(即H3K27ac、H3K4me3和H3K4me1)是開放且可富集的,但不適用于Polycomb抑制(H3K27me3)(圖1f)。
(2)預測和表征14種組織中的染色質(zhì)狀態(tài)

圖2:14個組織中的染色質(zhì)景觀
15種染色質(zhì)狀態(tài)的定義。
15種染色質(zhì)狀態(tài)的縮寫。
染色質(zhì)狀態(tài)的單個表觀遺傳標記的emission率,從白色到深藍色的顏色表示0-1。
染色質(zhì)狀態(tài)的基因組覆蓋率。M±SD表示平均值±標準偏差。
基因組注釋染色質(zhì)狀態(tài)的平均富集,每個組織均包括CpG島、基因、TSS/TES_1K(TSS和TES周圍±1 kb距離)、表達基因(TPM≥0.1)和抑制基因(TPM<0.1)
基因組進化率分析(GERP)的非編碼哺乳動物保守元件的染色質(zhì)狀態(tài)的倍數(shù)富集。
與基因TSS相關位點的染色質(zhì)狀態(tài)密度。
空腸染色質(zhì)狀態(tài)的平均甲基化水平。
Hi-C(250 kb分辨率)預測7號染色體上空腸的染色質(zhì)狀態(tài)、表觀遺傳信號和標準化甲基化水平。
14個組織中VIL1位點(chr15:120459825-120493312,susScr11)的染色質(zhì)狀態(tài)景觀和mRNA表達。UCSC軌跡的垂直比例顯示RNA-seq的歸一化信號為0-200。
(3)基因組和組織中染色質(zhì)狀態(tài)的動態(tài)

圖3:不同組織的全基因組染色質(zhì)狀態(tài)動態(tài)
根據(jù)不同組織中每個間隔的平均染色質(zhì)狀態(tài)頻率,將2 Mb間隔(1224列)聚類到模塊(M1-M12)中。底部顯示每個區(qū)間中的蛋白質(zhì)編碼基因、lncRNA和CpG島數(shù)目。
平均mRNA表達(log2(TPM+1)),每個模塊的基因和平均甲基化水平間隔2Mb。M1-M12模塊分別由24、100、183、167、111、139、168、41、98、33、75、85個區(qū)間組成。M3用作統(tǒng)計雙側t檢驗的參考,其中*P<0.05,**P<0.01和**P<0.001。基因表達P值(M1=0.33,M2<2.2 e-16,M4=4.8e-10,M5=0.15,M6=0.017,M7=1e-14,M8<2.2 e-16,M9=3.3e-10,M10=2.5 e-15,M11=8.6e-08,M12=0.08); 甲基化水平P值(M1=0.066,M2<2.2 e-16,M4=6.7e-09,M5=8.1e-07,M6=0.00027,M7<2.2e-16,M8=0.1,M9=0.00028,M10=0.049,M11=0.26,M12=5.5e-07)。未對多重比較進行調(diào)整。
基于累積基因組覆蓋率的染色質(zhì)狀態(tài)變化。虛線=0.75
在所有組織之間的染色質(zhì)狀態(tài)轉換。
在增強子(enhancer,EnhA)狀態(tài)下使用H3K4me1信號進行表觀基因組分層聚類。
空腸肌層特異性表達的基因啟動子中的染色質(zhì)狀態(tài)富集。
其他組織中空腸特異性基因靶向增強子(EnhA)的染色質(zhì)狀態(tài)轉換。
(4)組織特異性染色質(zhì)狀態(tài)的功能表征

圖4:組織特異性強增強子(EnhA)及其在14種組織中的潛在功能
組織中17個TSR(強增強子(EnhA))模塊的數(shù)量和富集分布。TSR組織特異性調(diào)節(jié)元件。頂部顏色代表右側圖例所指的17個強增強子模塊(列)。側面顏色代表14個組織(行)。
生物過程的每個模塊近端基因的功能富集GO分析。列表示17個強增強子模塊。行表示每個模塊中的GO富集。
每個模塊EnhAs預測靶基因的平均表達(TPM)。列表示每個模塊中的基因,行表示每個組織。
每個模塊轉錄因子motif的富集。
基于近端基因富集每個模塊中的人類表型。
(5)染色質(zhì)狀態(tài)預測增強了豬適應性進化和復雜性狀的生物學解釋

圖5:染色質(zhì)狀態(tài)在豬的馴化和復雜性狀中起著重要作用
亞洲豬和歐洲豬染色質(zhì)狀態(tài)下的馴化選擇特征富集。ASD亞洲豬馴化,EUD歐洲豬馴化。值>1(虛線)表示顯著富集。
亞洲豬和歐洲豬之間組織特異性啟動子(TssA)的馴化選擇特征富集。值>1(虛線)表示通過Fisher精確檢驗檢測的顯著富集。對角線偏差顯示了組織對亞洲豬或歐洲豬的富集趨勢。
全基因組關聯(lián)研究(GWAS)顯示在豬的14個組織和44個復雜性狀的染色質(zhì)狀態(tài)內(nèi)信號富集。比較的統(tǒng)計學顯著性以“15-Qui”為參考,采用雙側t檢驗計算。未對多重比較進行調(diào)整,***P<0.001,每組P值分別為“1 TssA”<2.2e-16、“2 TssAHet”=9.1e-09、“3 TxFlnk”<2.2e-16、“4 TxFlnkWk”=6.7e-16、“5 TxFlnkHet”=2.8e-12、“6 EnhA”<2.2e-16、“7 EnhAMe”=3.6e-16、“8 EnhAWk”=2.5e-16、“9 EnhAHet”<2.2e-16、“10 EnhPois”<2.2e-16、“11 ATAC_Is”= 0.00015、“12 TssBiv”<2.2e-16、 “13 Repr”=7.1e-15、“14 ReprWk”=3.8e-10。
在三個豬群(dd:Duroc,ll:Landrace,yy:Yorkshire)的平均日增重(ADG)中,啟動子(TssA)和強增強子(EnhA)組織特異性調(diào)節(jié)元件(TSR)的GWAS信號富集。顯著性基于基因型周期序列測試的10000次迭代。虛線設置為-log10(P=0.05)。
長白豬(Landrace)ADG的曼哈頓圖(88984)。
GWAS靶向的基因組區(qū)域中每個組織的染色質(zhì)狀態(tài)。虛線矩形框包括與GWAS靶向一致的肌肉特異性增強子。紅色箭頭表示預測的CTCF循環(huán)和H3K27ac信號,表明肌肉特異性增強子可以靶向ZNF532和ALPK2。
Hi-C loop(25kb分辨率)描述肌肉特異性增強子和推測的靶基因。
肌肉特異性增強子近端基因的表達(標準化和居中TPM)。
(6)豬、小鼠和人表觀基因組的比較分析

圖6:染色質(zhì)狀態(tài)的種間保守
在三個物種中預測了15種染色質(zhì)狀態(tài)。
六種組織中序列保守和表觀基因組保守之間的關系。在序列保守方面,從變化最快(第0個),變化中等(第20個)和變化最慢(第49個)排序了50個基因組區(qū)域。計算豬和人每個區(qū)域內(nèi)每個染色質(zhì)狀態(tài)的表觀基因組保守并作圖。
六種組織中表達保守和表觀基因組保守之間的關系。表達保守基于三個物種中14302個直系同源基因的表達。區(qū)域從最大的表達差異(第0個)到最小差異(第49個)排序。
基于(±2kb)極端序列保守(第49位)的人特異性TssA GO富集分析。計數(shù)指基因數(shù)量。
人GWAS(47個性狀)在六種組織中的15種不同染色質(zhì)狀態(tài)中信號富集。富集是遺傳力除以每個染色質(zhì)狀態(tài)下SNP的比例。大于虛線(設置為1)的值表示顯著富集。誤差線表示富集估計值周圍的標準誤差。
人GWAS(47個性狀)在六個組織中物種特異性或共享EnhA中的富集。(hpm_share表示人類-豬-鼠共享)。
豬的組織特異性增強子(EnhA)在人物種中的GWAS富集情況。
h-j. 人-豬和人-鼠之間不同GWAS富集在大腦皮層(1799 vs 61增強子)、小腸(5311 vs 2430增強子)和脂肪(2014 vs 1638增強子)中的共享強增強子(EnhA)情況。
關于易基因染色質(zhì)免疫共沉淀測序 (ChIP-seq) 技術
染色質(zhì)免疫共沉淀(Chromatin Immunoprecipitation,ChIP),是研究體內(nèi)蛋白質(zhì)與DNA相互作用的經(jīng)典方法。將ChIP與高通量測序技術相結合的ChIP-Seq技術,可在全基因組范圍對特定蛋白的DNA結合位點進行高效而準確的篩選與鑒定,為研究的深入開展打下基礎。
DNA與蛋白質(zhì)的相互作用與基因的轉錄、染色質(zhì)的空間構型和構象密切相關。運用組蛋白特定修飾的特異性抗體或DNA結合蛋白或轉錄因子特異性抗體富集與其結合的DNA片段,并進行純化和文庫構建,然后進行高通量測序,通過將獲得的數(shù)據(jù)與參考基因組精確比對,研究人員可獲得全基因組范圍內(nèi)某種修飾類型的特定組蛋白或轉錄因子與基因組DNA序列之間的關系,也可對多個樣品進行差異比較。
應用方向:
ChIP 用來在空間上和時間上不同蛋白沿基因或基因組定位
轉錄因子和輔因子結合作用
復制因子和 DNA 修復蛋白
組蛋白修飾和變異組蛋白
技術優(yōu)勢:
物種范圍廣:細胞、動物組織、植物組織、細菌微生物多物種富集經(jīng)驗;
微量建庫:只需5ng以上免疫沉淀后的DNA,即可展開測序分析;
方案靈活:根據(jù)不同的項目需求,選擇不同的組蛋白修飾特異性抗體。
關于易基因簡化基因組甲基化測序研究解決方案
簡化甲基化測序(Reduced Representation Bisulfite Sequencing,RRBS)是利用限制性內(nèi)切酶對基因組進行酶切,富集啟動子及CpG島等重要的表觀調(diào)控區(qū)域并進行重亞硫酸鹽測序。該技術顯著提高了高CpG區(qū)域的測序深度,在CpG島、啟動子區(qū)域和增強子元件區(qū)域可以獲得高精度的分辨率,是一種準確、高效、經(jīng)濟的DNA甲基化研究方法,在大規(guī)模臨床樣本的研究中具有廣泛的應用前景。
為適應科研技術的需要,易基因進一步開發(fā)了可在更大區(qū)域內(nèi)捕獲CpG位點的雙酶切RRBS(dRRBS),可研究更廣泛區(qū)域的甲基化,包括CGI shore等區(qū)域。
為助力適用低起始量DNA樣本(5ng)量多維度甲基化分析,易基因開發(fā)了富集覆蓋CpG島、啟動子、增強子、CTCF結合位點的甲基化靶向基因組測序方法:extended-representation bisulfite sequencing(XRBS),實現(xiàn)了高靈敏度和微量樣本復用檢測,使其具有高度可擴展性,并適用于有限的樣本和單個細胞基因組CG位點覆蓋高達15M以上。
技術優(yōu)勢:
起始量:100ng gDNA;
單堿基分辨率;
多樣本的覆蓋區(qū)域重復性可達到85%-95%、測序區(qū)域針對高CpG調(diào)控區(qū)域,數(shù)據(jù)利用率更高;
針對性強,成本較低;
基因組CG位點覆蓋高達10-15M,顯著優(yōu)于850K芯片。
應用方向:
RRBS/dRRBS/XRBS廣泛應用于動物,要求全基因組掃描(覆蓋關鍵調(diào)控位點)的:
隊列研究、疾病分子分型、臨床樣本的甲基化 Biomarker 篩選
復雜疾病及腫瘤發(fā)病機制等甲基化研究
模式動物發(fā)育和疾病甲基化研究

易基因科技提供全面的表觀遺傳學研究整體解決方案,技術詳情了解請致電易基因0755-28317900。

參考文獻:
Pan Z, et al. Pig genome functional annotation enhances the biological interpretation of complex traits and human disease. Nat Commun. 2021 Oct 6;12(1):5848.
相關閱讀:
表觀發(fā)育:ChIP-seq揭示精子H3K4me3可傳遞到胚胎并與代謝功能障礙遺傳有關
Nature | 易基因DNA甲基化測序助力人多能干細胞向胚胎全能8細胞的人工誘導
亮點研究|oxRRBS+RRBS揭示牦牛下丘腦在神經(jīng)調(diào)節(jié)和髓鞘形成中的表觀調(diào)控機制
PBJ文章 | 微量ChIP-seq揭示水稻減數(shù)分裂細胞的組蛋白修飾基因轉錄調(diào)控