k-mer
1、求基余针因组大小。
得到测妈角晚村状序深度为m的基因组的所有kmer片段,每个kmer长度为k。然后统计各kmer及其出现的次数(kmer frequnce),有多少片段只出现一次,有多少出现两次,有多少出现三次、、、,然后以出现次数(frequnce)为横坐标,以出现这么多次的片段总数(或该数占总片段数的百分比)为纵坐标作图。
每个kmer的期望(kmer深度) dk = (L妒临联-K+1)/G*N(在图上就是主峰的横坐标)
从reads得到的kmer总数 nk = (L-K+1)*N(已知)
则G=nk/dk;
2、杂合重复分析。
只有来自一个主峰,该个体为纯合体或单倍体。
在x=a处出现主峰,x=2a处有一个次峰,说明一部分片段出现的360问答期望值是大部分的2倍,这些片导者块早乎时段为重复片段,次峰为重复峰
在在x=a处出现主峰,x=0.5a处有一个次峰,说明部分片段出现的期望值是大部分的1/2,当序列有杂合时,包含杂合位点的kmer因为分成了两部分跳啊半,所以出现频率变为一半,次峰为杂合峰
出现两个主峰,峰高相差不大,两峰横坐标又是2倍关系,说明该个体高杂合或高重复
版权声明:如无特殊标注,文章均为本站原创,转载时请以链接形式注明文章出处。
评论