一、写在前面 随着高通量测序技术的发展,新的数据格式为数据交互性、紧凑存储和高效数据分析提供了必要条件(毕竟买硬盘要花实打实的银子)。而目前最常用的SAM文件和VCF文件是由制表符分隔的文本文件,使用自定义脚本可以轻松处理这些文件,但解析速度慢,存储效率低下(3GB clip reads约生成34GB的sam文件,而bam仅有3GB)。因此2009年发表的samtools可以将SAM转换为二进制的BAM来应对这一问题,而在2013年3月发布0.1.19版本后,多线程的支持也大大节省了计算时间。时至今日,b...【查看原文】