메타유전체 데이터 무결성 보장
메타유전체 접근 방식은 기존 연구(예: PCR 및 qPCR)와 유사한 프로세스 및 워크플로우를 활용합니다. 두 경우 모두, 첫 번째 단계는 핵산 샘플(유전체 연구에는 DNA 및 전사체 연구에는 RNA)를 획득, 분리 및 정제하는 것입니다. 그런 다음 이 샘플을 증폭하고(그리고 차세대 염기서열 분석 기술의 경우 염기서열 분석) 최종 산물을 판독하고 특수 기기를 사용하여 측정합니다. 마지막으로, 소프트웨어를 사용하여 가공되지 않은 결과 데이터를 처리, 집계 및 분석합니다.
메타유전체와 기존 접근 방식의 가장 큰 차이는 규모입니다. 메타유전체 워크플로우를 설계하고 실행할 때 연구자는 증폭 전후에 핵산 수율을 최적화하는 방법뿐만 아니라 증폭 후 산물이 원래 샘플을 최대한 정확하게 대표함을 고려해야 합니다. 이를 통해 잠재적으로 메타유전체 샘플에 존재하며 각각 고유한 유전 프로필을 가진 샘플 내 수천 개의 유기체에 걸쳐 유전자 발현 규모와 비율이 작용하게 됩니다. 따라서 균유전체학(metagenomics) 연구는 기존의 단일 유기체 미생물 연구와 비교할 때 어려움이 더 많습니다.
편향(bias)이란 무엇이며 어떻게 도입되나요?
유감스럽게도, 편향(bias)(원 검체의 실제 값에서 측정된 데이터 값의 체계적인 왜곡)은 모든 실험 과정에 어느 정도 존재하며 균유전체학(metagenomics)도 예외는 아닙니다. 샘플 획득에서 염기서열 분석 및 판독 어셈블리에 이르기까지 일반적인 균유전체학(metagenomics) 워크플로우의 모든 단계에서 편향(bias)이 도입될 수 있습니다(1). 먼저, 한 샘플이 해당 샘플이 속한 더 큰 군집을 진정으로 대표하는지 여부는 샘플 채취의 위치와 빈도에 따라 다릅니다. 예를 들어, 장내 마이크로바이옴을 연구할 때 배설물 샘플은 장 점막에서 얻은 것과 다른 미생물총을 생성합니다. 또한 샘플을 보관하고 연구실로 운반하는 방법에 따라 샘플 조성의 편향(bias)이 생길 수 있습니다.
메타유전체 연구를 위해 핵산을 추출하려면 일반적으로 먼저 세포 봉입체에서 핵산을 유리해야 합니다. 세포막과 벽은 화학적, 효소적 또는 기계적 수단을 통해 분해됩니다. 그러나 미생물마다 얼마나 쉽게 용해되는지가 다르므로 핵산 수율 비율에 상당한 차이가 발생합니다. 추출 기법을 바꾸면 동일한 샘플에서 주어진 분류군의 측정 비율이 크게는 10배 차이가 날 수 있습니다(2). 따라서 연구자가 추출 프로토콜 및/또는 선택한 시약에 의해 도입된 고유한 편향(bias)을 이해하고 이를 보완하는 것이 중요합니다(3).
샷건 염기서열 분석(shotgun sequencing)에서 편향(bias)의 출처
개별 염기서열 분석 기술에도 고유한 편향(bias)이 있습니다. 프라이머 구성, 증폭 프로토콜, 유전체 크기, 심지어 핵산 샘플 단일 가닥인지 이중 가닥인지 여부가 모두 편향(bias)의 원인으로 확인되었습니다(3-5). 예를 들어, 샷건 염기서열 분석(shotgun sequencing)은 후속 판독 생성을 위해 무작위 단편을 생성하지만 무작위성은 자동적으로 균일성과 동일하지 않으므로 잠재적으로 일부 유전체 또는 전사체 영역이 다른 영역보다 우선적으로 증폭될 수 있습니다. 마찬가지로, 16S 염기서열 분석은 마이크로바이옴 조성을 결정하기 위한 계통학적 마커로서 16S 리보솜 RNA(rRNA)에 의존합니다(3).
16S rRNA 염기서열 분석에서 편향(bias)의 출처
16S rRNA 염기서열 분석은 박테리아 16S rRNA 유전자의 초가변 영역을 둘러싸는 보존 영역을 표적으로 하며 널리 사용되어 왔습니다. 16S rRNA 유전자의 분석은 수십 년 동안 시퀀스 기반 박테리아 분석의 기본이었습니다. (7) 내부 전사 스페이서(Internal Transcribed Spacer, ITS) 영역을 분석하면 곰팡이 유전체의 프로파일링이 가능합니다(8).
인식하면 대책을 세울 수 있다
편향(bias)은 누적됩니다. 샘플 준비 중에 발생된 왜곡은 염기서열 분석 중에 증폭되고 분석 중에 확연해집니다. 따라서 과학자들이 편향(bias)의 잠재적인 원인을 이해하고 이를 보완하기 위한 노력의 일환으로 철저한 통제 프로세스를 개발하는 것이 매우 중요합니다. 양성 및 음성 대조물질은 동일한 프로토콜과 동일한 샘플을 사용하여 실험 실행 간의 가변성을 식별하는 데 사용할 수 있으며 마이크로바이옴 품질 관리(Microbiome Quality Control) 프로젝트와 같은 데이터베이스는 프로토콜의 변경이 어떻게 최종 결과 변화를 가져오는지 입증하는 데 도움이 될 수 있습니다. 마지막으로, 연구자들은 관심 대상의 특정 유기체(예: 병원체)를 검출하려는 노력으로 인해 다른 많은 유기체를 가리게 되어 미생물 군집의 편향된 결과를 생성할 수 있음을 인식해야 합니다(1). 편향(bias)을 완전히 제거하는 것은 불가능할 수 있지만 균유전체학(metagenomics)이 임상 진단 도구가 되기 위해서는 편향(bias)을 이해하고 완화하는 것이 필수입니다(1, 6).