R 数据可视化 01 | 聚类热图
示例数据
链接:https://pan.baidu.com/s/13l8UtKvvDxFWL8ikzq7vJw
提取码:ttb4
文件说明
示例数据,其中数据均为虚拟数据,与实际生物学过程无关
文件名:dataset_heatmap.txt
列分别为基因,cell1的5个重复样本,cell2的5个重复样本
行代表每个基因在所有样本的FPKM值
运行环境
Rstudio:
如果系统中没有 Rstudio,先下载安装:https://www.rstudio.com/products/rstudio/download/#download
heatmaps 包:
如果没有安装该R包,执行以下代码:
if (!requireNamespace("BiocManager", quietly = TRUE)) |
绘制聚类热图
常规聚类热图绘制
# 执行前设置==================================== |
无分类信息热图
# 将绘制热图部分替换为下列代码 |
无聚类热图
# 将绘制热图部分替换为下列代码 |
分割聚类树热图
# 绘制热图===================================== |
多分组聚类热图
# 清空暂存数据 |
分组调色
# 清空暂存数据 |
显示文本
# 绘制热图===================================== |
去除描边
pheatmap(exp_ds, #表达数据 |
字体相关
pheatmap(exp_ds, #表达数据 |
调整聚类树高
pheatmap(exp_ds, |
聚类方法选择
pheatmap(exp_ds, |
保存为图片
这里可导出像素图和PDF,也可拷贝到PS调整
选择合适的文件格式,调整合适长宽,印刷或投稿选PDF,TIFF,EPS就好
文件默认存储在刚刚设置的工作目录里
详细参数设置说明
设置工作目录
setwd("E:/R/WorkSpace/baimoc/visualization" |
在R的执行过程中,为了方便,需要指定一个获取文件和输出文件所在的目录,这样就不需要每次设置全路径,只需要指定相对目录
setwd("E:/R/WorkSpace/baimoc/visualization")
的意思就是设置工作目录为E:/R/WorkSpace/baimoc/visualization
载入数据
dataset <- read.table('resource/dataset_heatmap.txt',header = TRUE, row.names = 1 |
因为工作目录已经设置,如果要获取E:/R/WorkSpace/baimoc/visualization/resource/dataset_heatmap.txt
文件,那么就只需要设置相对路径resource/dataset_heatmap.txt
对于header = TRUE, row.names = 1
代表读取文件表头,设置第一列为行名
获取数据子集
# 截取表达矩阵的一部分数据来绘制热图 |
原始数据:
如果获取前5个基因和cell1与cell2的前3个样本,只需要执行
exp_ds = dataset[c(1:5),c(1:3,6:8) |
样本分类数据
# 构建样本分类数据 |
这段代码目的是构建分类名与原始数据的列名的对应关系
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 白墨!
评论