R可視化——ggseqlogo包繪制序列分析圖
序列分析圖(sequence logo)一般指以圖形方式依次展示序列比對中各個位置上出現的殘基及其頻率,常用于描述序列特征,如DNA中的蛋白質結合位點或蛋白質中的功能單元。序列分析圖中每個殘基對應圖形字符的大小與殘基在該位置上出現的頻率是成正比的!
安裝、加載R包
數據
支持序列與矩陣兩種格式的文件,以以ggseqlogo包自帶示例數據ggseqlogo_sample為例:




ggseqlogo包繪圖參數
1、基本參數查看
2、基本序列分析圖繪制


3、方法的選擇——“bits”(默認)和“probability”

4、繪制多個圖時通過facet與ncol控制


5、序列類型的指定


6、配色方案



7、自定義配色方案——通過make_col_scheme參數實現,有離散型與連續(xù)性兩種方式


8、字體設置


9、字母寬度設置

10、注釋——與ggplot2注釋原理一致




繪圖模板代碼

參考:https://omarwagih.github.io/ggseqlogo/
標簽: