GenStore: A High-Performance In-Storage Processing System for Genome Sequence Analysis
作者:Nika Mansouri Ghiasi等人, lead by Onur Mutlu
@ ETH Zurich(Switzerland)
本文指出了基因序列分析的性能瓶颈为存储设备的I/O,为了解决这一问题,通过在近数据端添加两个加速器实现对数据的筛选,实现了性能的大幅提升。
基因序列分析背景知识
端到端的基因序列分析
应用场景
药物开发、病毒溯源和进化研究
主要目的
识别样本基因组和已知基因组之间的可能匹配点和差异点。
基本步骤
- 采样以及DNA样本测序:现代测序技术无法测序整个DNA,只能在这个DNA上随机采样一些短的子序列,并对他们进行测序。
- 转换:将测序到的波形图转换成碱基对(A,G,C,T等基本组成单元)的表示,这些表示被称为read(译:待匹配序列),以便存储和处理;

图1 DNA序列转换
more >>