Phương pháp và ứng dụng của giải trình tự đơn tế bào và không gian trong nghiên cứu đa omics (phần 1/3)
Những cải tiến trong công nghệ đa omics đơn tế bào và không gian, và các phương pháp tính toán cần thiết để kết nối và hiểu được thông tin trên từng lớp dữ liệu phân tử. Phần 1 xoay quanh bốn nguyên lý chung để có được dữ liệu multi-omics từ một tế bào.
Người dịch và tổng hợp: CVYT Võ Hằng Mai Anh, Khối Di truyền Y học, Trung tâm Công nghệ cao Vinmec
Sự kết hợp phân tích dữ liệu hệ gen, hệ di truyền biểu sinh (epigenome), hệ phiên mã (transcriptome), hệ protein (proteome), và hệ các chất chuyển hóa (metabolome) từ dữ liệu giải trình tự đơn tế bào (single cells) đã nâng cao hiểu biết của chúng ta về sinh học tế bào trong sức khỏe và bệnh tật. Trong chưa đầy một thập kỉ, lĩnh vực này đã chứng kiến đến nhiều bước đột phá công nghệ cho phép con người có thêm những hiểu biết sâu sắc và quan trọng mới về sự tương tác giữa các cơ chế phân tử nội bào (intracellular) và giữa các tế bào (intercellular) chi phối sự phát triển, sinh lý học và sinh bệnh học. Trong bài báo Review, nhóm tác giả nhấn mạnh những tiến bộ trong lĩnh vực đang chuyển mình rất nhanh của công nghệ đa omics không gian và đơn tế bào (hay còn được gọi là phương pháp tiếp cận omics đa phương thức), và các phương pháp tính toán máy tính để kết nối và hiểu được thông tin trên các lớp dữ liệu phân tử này. Bài viết xuất bản ngày 02 tháng 03 năm 2023, trình bày tầm ảnh hưởng của công nghệ này với các nghiên cứu cơ bản và ứng dụng về sinh học tế bào, đồng thời thảo luận về các thách thức trong thời điểm hiện tại và triển vọng tương lai.
*Thứ tự hình ảnh sẽ được giữ nguyên theo bài báo gốc của nhóm tác giả Katy Vandereyken, Alejandro Sifrim, Bernard Thienpont & Thierry Voet để tiện tra cứu.
1. Mở đầu
Nội dung bài viết
Con người và các sinh vật nhân thực khác được cấu thành từ hàng tỉ tế bào, các tế bào này thuộc về các dòng tế bào khác nhau rất đa dạng và trạng thái biểu hiện của tế bào được quyết định bởi cả yếu tố nội bào lẫn ngoại bào. Từ bên trong tế bào, có một hệ thống phân tầng phức tạp các phân tử tương tác với nhau, thuộc về các tầng omics khác nhau của cùng một tế bào: từ gen và yếu tố di truyền ngoại gen, tới hệ phiên mã, hệ protein, hệ các chất chuyển hóa và đi ngược lại. Từ bên ngoài, trạng thái chức năng của một tế bào có thể được điều hòa qua các tế bào lân cận thông qua tương tác vật lý trực tiếp (chẳng hạn như tương tác phối tử-thụ thể), thông qua các phân tử tín hiệu được tiết ra bởi một tế bào có thể hoạt động thông qua các thụ thể trên các tế bào ở xa (chẳng hạn như các con đường truyền tín hiệu morphogen – tạm dịch là con đường truyền tín hiệu hình thái học), hoặc bởi các yếu tố môi trường vi mô khác (chẳng hạn như gradient hóa học). Vì vậy, để hiểu được và nắm bắt được cách sinh vật đa bào phát triển từ một tế bào toàn năng đơn lẻ, và các chức năng sống, quá trình lão hóa và quá trình hình thành bệnh tật sau đó, những các tiếp cận đa omics ở cấp độ tế bào đơn lẻ và không gian là rất cần thiết (hay còn được gọi là phương pháp tiếp cận omics đa phương thức). Trong những năm gần đây, lĩnh vực này đã phát triển một cách phi thường và đang trưởng thành nhanh chóng cả về mặt công nghệ và tính toán, cho phép các ứng dụng rộng rãi để hiểu về sinh học tế bào.
2. Các phương pháp multi-omics đơn tế bào
Để có thể định lượng các thành phần multi-omics từ một tế bào, có nhiều phương pháp tiếp cận khác nhau được phân thành từng nhóm dựa trên việc các phân tử cần phân tích riêng biệt (DNA, RNA, …) có được phân tách trước, trong hoặc sau khi chuẩn bị thư viện giải trình tự hay không. Như được mô tả trong Hình 2 và nội dung cụ thể hơn về từng phương pháp nêu ở dưới, mỗi nhóm nguyên lý khác nhau này đều có những ưu điểm và hạn chế cụ thể.
Bốn nguyên lý chung để định lượng các thành phần multi-omics từ một tế bào
Tất cả các nguyên lý được vẽ minh họa với DNA và RNA làm ví dụ cho các phân tử cần phân tích.
Nguyên lý 1: Phân tách vật lý
Một số phương pháp điển hình:
- G&T-seq; transcriptogenomics; scChaRM-seg; scNMT-seq
- SIDR-seq; DNTR-seq; scat-seq
Nguyên lý 1 dựa trên cơ sở sự phân tách về khía cạnh vật lý của các phân tử cần phân tích (hình 2a, 2b).
Sau khi ly giải hoàn toàn một tế bào riêng lẻ, RNA có đuôi poly(A) được lai với các hạt thuận từ (paramagnetic) gắn các đoạn oligo-dT, và sau khi các hạt từ được kéo xuống đáy ống tube bằng từ trường, phần dung dịch nổi chứa DNA được chuyển sang ống mới. Ngoài ra, các nucleotide đánh dấu biotin được tích hợp vào cDNA có nguồn gốc từ RNA, cho phép các cDNA này có thể được bắt giữ bằng các hạt từ gắn streptavidin (không có trong hình vẽ).
- Ưu điểm: Đem lại sự linh hoạt trong quá trình xử lý DNA, RNA xuôi dòng (downstream); có thể áp dụng được với các tế bào và nhân nguyên vẹn từ mô tươi và mô đông lạnh.
- Nhược điểm: Bị thất thoát một lượng RNA hoặc DNA trong quá trình phân tách vật lý.
Hướng tiếp cận khác là ly giải màng tế bào nhưng không phá vỡ màng nhân, từ đó cho phép tách nhân tế bào khỏi các phân tử trong tế bào chất, có thể bằng cách làm kết tủa nhân tế bào qua việc ly tâm hoặc dùng hạt từ kéo xuống, sau đó hút dịch nổi chứa các thành phần trong tế bào chất, hoặc bằng cách kiểm soát bằng kênh dẫn vi lưu (microfluidic) phân tách nhân khỏi dịch tế bào chất.
- Ưu điểm: Đem lại sự linh hoạt trong quá trình xử lý DNA, RNA xuôi dòng (downstream) và có được RNA nguyên vẹn không phải gắn thêm đuôi poly(A).
- Nhược điểm: Bị thất thoát RNA nhân và một lượng RNA trong tế bào chất trong quá trình phân tách nhân khỏi dịch tế bào chất, mất DNA ty thể nằm trong tế bào chất; cần các các tế bào đơn lẻ nguyên vẹn; không thích hợp với mô đông lạnh và có khả năng không tương thích với các tế bào đang phân chia (khi đó màng nhân không còn toàn vẹn).
Nguyên lý 2: Tiền khuếch đại và phân tách
Một số phương pháp điển hình: DR-seq; SNARE-seq; DOGMA-seq
Nguyên lý 2 (hình 2c) được đặt tên là tiền khuếch đại và phân tách vì các phân tử cần phân tích được gắn các trình tự đánh dấu khác nhau và cùng được cho vào trong phản ứng tiền khuếch đại, sau đó mới được phân tách riêng để chuẩn bị thư viện tương ứng với từng loại phân tử.
- Ưu điểm: Giảm nguy cơ thất thoát phân tử cần phân tích tới mức tối thiểu, thích hợp với tế bào nguyên vẹn từ mô tươi và mô đông lạnh.
- Nhược điểm: Tính linh hoạt hạn chế, vì bước tiền khuếch đại cần có protocol tương thích với tất cả các chất cần phân tích quan tâm (VD: tương thích với cả RNA lẫn DNA), và có nguy cơ nhiễm chéo các loại phân tử.
Nguyên lý 3: Phân tách sau giải trình tự (seq-split)
Một số phương pháp điển hình: scONE-seq; scDam&T
Ở nguyên lý 3 (hình 2d), được đặt tên là seq-split, bao gồm bước gắn trình tự barcode đặc hiệu cho từng loại phân tử và chuẩn bị thư viện giải trình tự trong cùng một phản ứng. Dữ liệu multiomic được phân tách trên máy tính sau khi giải trình tự hoàn thành.
- Ưu điểm: Giảm nguy cơ thất thoát phân tử cần phân tích tới mức tối thiểu, thích hợp với tế bào nguyên vẹn từ mô tươi và mô đông lạnh.
- Nhược điểm: Không thể giải trình tự riêng cho từng loại phân tử để tối ưu độ sâu của dữ liệu tương ứng từng loại và tiềm ẩn nguy cơ nhiễm chéo các loại phân tử.
Nguyên lý 4: Kết hợp index đánh dấu tế bào
Một số phương pháp điển hình: sci-L3 DNA RNA co-assay; sci-CAR-seq; SNARE-seq2
Ở nguyên lý 4 (hình 2e), được đặt tên là kết hợp index đánh dấu tế bào (combinatorial indexing), các phân tử cần phân tích của cùng một tế bào được đánh dấu bằng trình tự nhận biết riêng, và không cần phải phân tách thành các tế bào đơn lẻ. Nhiều tế bào hoặc nhân được đưa vào cùng một đĩa gồm nhiều giếng, trong đó mỗi tế bào hoặc nhân đóng vai trò là vật chứa phản ứng. Mỗi tế bào có trình tự đánh dấu riêng cho loại phân tử phân tích và barcode đặc hiệu cho từng giếng. Bằng cách dồn lại, trộn đều và tái phân bố ngẫu nhiên các tế bào hoặc nhân một lần nữa cùng với các barcode đặc trưng cho từng giếng, ta thu được các phân tử cần phân tích được đánh dấu mang trình tự đánh dấu đặc trưng của riêng từng tế bào. Kết hợp với phương pháp dựa trên nguyên lý 2 hoặc 3, ta có được dữ liệu đa omics đơn tế bào hoặc đơn nhân.
- Ưu điểm: Không cần phân tách để thu lấy tế bào đơn lẻ, có khả năng đem lại thông lượng dữ liệu cực lớn, thích hợp với tế bào nguyên vẹn từ mô tươi hoặc mô đông lạnh.
- Nhược điểm: Độ nhạy thường thấp hơn, nguy cơ thất thoát phân tử phân tích và tính linh hoạt hạn chế đối với các protocol khuếch đại toàn bộ hệ gen hoặc toàn bộ hệ phiên mã.
Các từ viết tắt trong hình và trong nội dung:
- dsDNA: double-stranded DNA, DNA sợi đôi.
- NGS: next generation sequencing, giải trình tự gen thế hệ mới.
- poly(A): polyadenylated, trình tự adenine kéo dài – chính là trình tự thường thấy ở đuôi của phân tử mRNA sau cải biến.
Tiềm năng và ứng dụng lâm sàng của multi-omics đơn tế bào
Đây là phần mở rộng, được viết bổ sung từ gợi ý của reviewer và ban biên tập.
Hiện tại, single-cell multiomics là một hướng nghiên cứu khá mới mẻ và tiên tiến, đang bước đầu được sử dụng trong nghiên cứu y sinh học. Vì vậy, là một công nghệ mới nổi, single cell multiomics chưa có ứng dụng lâm sàng nào được tìm thấy trên cơ sở dữ liệu của FDA [1].
Tuy nhiên, vai trò nghiên cứu và ứng dụng của single-cell multiomics đã và đang được sử dụng để thẩm định và tái thẩm định các liệu pháp đã được FDA phê duyệt [2], [3]. FDA cũng xúc tiến phát triển và đề xuất các biện pháp và dự án nhằm đảm bảo tính toàn vẹn và chính xác của thông tin single-cell multiomics như NCI-CPTAC [4], cùng viện nhiều viện nghiên cứu xây dựng tiêu chuẩn chất lượng chung (benchmark) về quy trình và dữ liệu cho single-cell RNA sequencing [5], [6], nhằm đảm bảo chất lượng dữ liệu và hạn chế việc dán nhãn sai mẫu (nhầm lẫn các mẫu bệnh phẩm) hoặc dán nhãn sai dữ liệu (vô tình hoán đổi dữ liệu omics của bệnh nhân). Sắp tới vào ngày 30/05/2023, FDA cùng American Society for Clinical Pharmacology and Therapeutics (ASCPT) sẽ có buổi trao đổi khoa học về ứng dụng của single-cell multiomics trong dược lâm sàng, nhằm hiểu về quá trình chuyển hóa thuốc nội tại biến đổi trên từng cá thể. [7]
Trước mắt, ở thời điểm hiện tại, công nghệ single-cell multiomics chưa có ứng dụng được FDA phê duyệt trong lâm sàng. Tuy nhiên, với những nghiên cứu có chiều sâu mang tính nền tảng được mở ra nhờ sức mạnh của công nghệ này từ cơ chế sinh bệnh học tới chuyển hóa phân tử ở cấp độ tế bào, công nghệ single-cell multiomics có vai trò đòn bẩy để phát triển thành những ứng dụng lâm sàng mang tính hướng đích, cá thể hóa, cũng như là phương tiện để thúc đẩy và nâng tầm các liệu pháp y học.
Các hướng đi tương lai cho các ứng dụng lâm sàng của single-cell và spatial transcriptomics trong lâm sàng. [8]
Dưới đây là một số khía cạnh chính ứng dụng trong lâm sàng mà single-cell multiomics có thể đóng góp đáng kể:
- Hiểu về tính không đồng nhất của tế bào: Single-cell multiomics cho phép phân tích các tế bào riêng lẻ, từ đó cung cấp thông tin chi tiết về tính không đồng nhất ở các mô và hệ thống sinh học. Cách tiếp cận này giúp ta phát hiện ra các quần thể tế bào, xác định các loại tế bào hiếm và tiết lộ các trạng thái và quá trình chuyển đổi của tế bào. Hiểu được tính không đồng nhất của tế bào là rất quan trọng để giải mã các cơ chế gây bệnh, xác định các dấu ấn sinh học và phát triển các liệu pháp hướng đích.
- Nghiên cứu bệnh lý và tìm kiếm thuốc mới: Single-cell multiomics cho phép nghiên cứu những thay đổi phân tử xảy ra trong các tế bào bị bệnh, chẳng hạn như tế bào ung thư. Bằng cách mô tả cấu hình bộ gen, phiên mã và biểu sinh của từng tế bào riêng lẻ, ta có thể xác định các đột biến gen quan trọng, kiểu biểu hiện gen và thay đổi biểu sinh liên quan đến các bệnh cụ thể. Thông tin này có thể hướng dẫn phát triển các mục tiêu điều trị mới và các chiến lược điều trị được cá nhân hóa.
- Phát hiện và chẩn đoán bệnh sớm: Single-cell multiomics có thể hỗ trợ phát hiện và chẩn đoán sớm bệnh bằng cách xác định các dấu hiệu phân tử có trong các tế bào riêng lẻ. Cách tiếp cận này có thể cung cấp một đánh giá toàn diện và chính xác hơn về tình trạng bệnh so với các phân tích trộn lẫn các tế bào (bulk analysis) như ở phương pháp truyền thống. Bằng cách phát hiện những thay đổi tinh vi trong quần thể tế bào và cấu hình phân tử, single-cell multiomics có thể cho phép can thiệp sớm hơn và cải thiện kết quả của bệnh nhân.
- Y học chính xác và liệu pháp cá nhân hóa: Single-cell multiomics có khả năng thúc đẩy y học chính xác bằng cách cung cấp thông tin phân tử chi tiết về từng bệnh nhân. Công nghệ này có thể hỗ trợ trong việc lựa chọn các chiến lược điều trị phù hợp nhất dựa trên các đặc điểm phân tử duy nhất của tế bào bệnh nhân; cũng có thể giúp theo dõi phản ứng điều trị, xác định cơ chế kháng thuốc và hướng dẫn phát triển các liệu pháp nhắm mục tiêu phù hợp với từng bệnh nhân.
- Phát hiện và thẩm định dấu ấn sinh học: Single-cell multiomics có thể tạo điều kiện thuận lợi cho việc xác định và xác nhận dấu ấn sinh học dùng trong mục đích chẩn đoán bệnh, tiên lượng bệnh và đánh giá đáp ứng với điều trị. Bằng cách phân tích các tế bào riêng lẻ, ta có thể xác định các dấu hiệu phân tử cụ thể tương quan với sự tiến triển của bệnh, đánh giá khả năng đáp ứng với điều trị và kết quả điều trị của bệnh nhân. Những dấu ấn sinh học này có thể được sử dụng để phát triển các xét nghiệm chẩn đoán, theo dõi tiến triển của bệnh và định hướng các quyết định điều trị.
- Y học tái tạo và liệu pháp tế bào: Single-cell multiomics có thể cung cấp những hiểu biết có giá trị về tái lập trình tế bào (cellular reprogramming), biệt hóa và số phận của tế bào. Công nghệ này giúp xác định các yếu tố then chốt và con đường phân tử liên quan đến việc tái lập trình tế bào, từ đó giúp tạo ra các loại tế bào cụ thể cho mục đích y học tái tạo. Ngoài ra, single-cell multiomics có thể hỗ trợ mô tả đặc điểm những tế bào được sử dụng trong các liệu pháp dựa trên tế bào, giúp đảm bảo chất lượng, an toàn và hiệu quả.
Tài liệu nguồn
Nội dung chính (Phần 0-5) được dịch lại và tóm tắt từ bài báo của Nature
- Vandereyken, K., Sifrim, A., Thienpont, B., & Voet, T. Methods and applications for single-cell and spatial multi-omics. Nature Reviews Genetics, 1-22. 2023. https://doi.org/10.1038/s41576-023-00580-2
Tác giả gồm:
- Katy Vandereyken, Alejandro Sifrim, Bernard Thienpont & Thierry Voet
Thuộc các viện nghiên cứu:
- KU Leuven Institute for Single Cell Omics (LISCO), University of Leuven, KU Leuven, Leuven, Belgium
- Department of Human Genetics, University of Leuven, KU Leuven, Leuven, Belgium
- Aligning Science Across Parkinson’s (ASAP) Collaborative Research Network, Chevy Chase, MD, USA
Các tác giả có đóng góp bình đẳng với nhau cho các khía cạnh của bài báo.
Tài liệu tham khảo phần mở rộng (*)
- US Food and Drug Administration. “Medical device databases.” MAUDE-manufacturer and user facility device experience https://www. accessdata. fda. gov/scripts/cdrh/cfdocs/cfMAUDE/search. CFM (2020). https://www.fda.gov/medical-devices/device-advice-comprehensive-regulatory-assistance/medical-device-databases
- He, Bing, Yao Xiao, Haodong Liang, Qianhui Huang, Yuheng Du, Yijun Li, David Garmire, Duxin Sun, and Lana X. Garmire. “ASGARD is A Single-cell Guided Pipeline to Aid Repurposing of Drugs.” Nature Communications 14, no. 1 (2023): 993.
- Hafner, Marc, Caitlin E. Mills, Kartik Subramanian, Chen Chen, Mirra Chung, Sarah A. Boswell, Robert A. Everley et al. “Multiomics profiling establishes the polypharmacology of FDA-approved CDK4/6 inhibitors and the potential for differential clinical activity.” Cell chemical biology 26, no. 8 (2019): 1067-1080.
- Boja, Emily, et al. “Right data for right patient—A precisionFDA NCI–CPTAC multi-omics mislabeling challenge.” Nature medicine 24.9 (2018): 1301-1302.
- Karolina, Wilk. FNL Collaborates With FDA To Establish Best Practices For Single-Cell RNA Sequencing. Frederick National Laboratory for Cancer Research. (2021). https://frederick.cancer.gov/news/fnl-collaborates-fda-establish-best-practices-single-cell-rna-sequencing
- Chen, Wanqiu, Yongmei Zhao, Xin Chen, Zhaowei Yang, Xiaojiang Xu, Yingtao Bi, Vicky Chen et al. “A multicenter study benchmarking single-cell RNA sequencing technologies using reference samples.” Nature Biotechnology 39, no. 9 (2021): 1103-1114.
- 2023 FDA & ASCPT Annual William B. Abrams Lecture: Mechanistic Studies in Drug Metabolism and Single Cell Biology to Advance Clinical Pharmacology. (2023 May 30) https://www.fda.gov/news-events/fda-meetings-conferences-and-workshops/2023-fda-ascpt-annual-william-b-abrams-lecture-mechanistic-studies-drug-metabolism-and-single-cell
- Piwecka, Monika, Nikolaus Rajewsky, and Agnieszka Rybak-Wolf. “Single-cell and spatial transcriptomics: deciphering brain complexity in health and disease.” Nature Reviews Neurology (2023): 1-17.
Từ khóa: chromatin, gene expression, fluorescence in situ hybridization, genomics, transcriptomics, genomic DNA, next-generation sequencing, cell type, spatial transcriptomics, CRISPR, reverse transcription, post-translational modifications, mRNA, Mass spectrometry imaging