Chú thích các bệnh bằng cách sử dụng bản thể kiểu hình của con người để cải thiện khả năng dự đoán các RNA không mã hóa dài liên quan đến bệnh
Gần đây, nhiều RNA không mã hóa dài (lncRNA) đã được xác định và chức năng sinh học của chúng đã được mô tả; tuy nhiên, sự hiểu biết của chúng ta về các cơ chế phân tử cơ bản liên quan đến bệnh tật của chúng vẫn còn hạn chế. Để khắc phục hạn chế trong việc xác định bằng thực nghiệm các mối liên hệ giữa bệnh-lncRNA, các phương pháp tính toán đã được đề xuất như một công cụ mạnh mẽ để dự đoán các mối liên hệ đó. Thông qua nghiên cứu, chúng tôi chú thích các bệnh bằng cách sử dụng bản thể kiểu hình của con nguời để cải thiện khả năng dự đoán các RNA dài không mã hóa liên quan đến bệnh.
Nhóm Tác giả: Duc Hau Le (1) (2), Lan T M Dao (2)
Đơn vị công tác:
- Khoa Khoa học và Kỹ thuật Máy tính, Đại học Thủy lợi, Hà Nội, Việt Nam
- Viện Nghiên cứu Tế bào gốc và Công nghệ gen Vinmec, Hai Bà Trưng, Hà Nội, Việt Nam.
Tổng quan
Nội dung bài viết
Gần đây, nhiều RNA không mã hóa dài (lncRNA) đã được xác định và chức năng sinh học của chúng đã được mô tả; tuy nhiên, sự hiểu biết của chúng ta về các cơ chế phân tử cơ bản liên quan đến bệnh tật của chúng vẫn còn hạn chế. Để khắc phục hạn chế trong việc xác định bằng thực nghiệm các mối liên hệ giữa bệnh-lncRNA, các phương pháp tính toán đã được đề xuất như một công cụ mạnh mẽ để dự đoán các mối liên hệ đó.
Các phương pháp này thường dựa trên sự tương đồng giữa các bệnh hoặc RNA không mã hóa dài vì đã có báo cáo rằng các bệnh tương tự có liên quan đến các RNA không mã hóa dài tương tự về chức năng. Do đó, hiệu suất dự đoán phụ thuộc nhiều vào mức độ tương đồng có thể được nắm bắt. Các nghiên cứu trước đây đã tính toán mức độ giống nhau giữa hai bệnh bằng cách ánh xạ chính xác từng bệnh với một thuật ngữ Bản thể học bệnh (DO) duy nhất, sau đó sử dụng thước đo mức độ tương đồng ngữ nghĩa để tính toán mức độ tương đồng giữa chúng.
Tuy nhiên, vấn đề của phương pháp này là một bệnh có thể được mô tả bằng nhiều thuật ngữ DO. Cho đến nay, không có cơ sở dữ liệu chú thích các thuật ngữ DO cho các bệnh ngoại trừ gen. Ngược lại, Bản thể học kiểu hình người (HPO) được thiết kế để chú thích đầy đủ các kiểu hình bệnh ở người. Do đó, trong nghiên cứu này, chúng tôi đã xây dựng các mạng/ma trận tương tự về bệnh bằng cách sử dụng HPO thay vì DO. Sau đó, chúng tôi đã sử dụng các mạng/ma trận này làm đầu vào của hai thuật toán xếp hạng dựa trên mạng và dựa trên máy học đại diện, nghĩa là, suy luận dựa trên biểu đồ không đồng nhất và bình phương nhỏ nhất tương ứng.
Kết quả cho thấy hiệu suất dự đoán của hai thuật toán trên nền HPO tốt hơn so với mạng/ma trận dựa trên DO. Ngoài ra, phương pháp của chúng tôi có thể dự đoán 11 RNA không mã hóa dài mới liên quan đến ung thư, được hỗ trợ bởi các bằng chứng tài liệu.
PMID: 29758261 DOI: 10.1016/j.jmb.2018.05.006
Tài liệu tham khảo
Để đọc chi tiết bài nghiên cứu, vui lòng truy cập Tại đây
Nguồn tra cứu: Theo https://pubmed.ncbi.nlm.nih.gov/
Abstract
Recently, many long non-coding RNAs (lncRNAs) have been identified and their biological function has been characterized; however, our understanding of their underlying molecular mechanisms related to disease is still limited. To overcome the limitation in experimentally identifying disease-lncRNA associations, computational methods have been proposed as a powerful tool to predict such associations. These methods are usually based on the similarities between diseases or lncRNAs since it was reported that similar diseases are associated with functionally similar lncRNAs.
Therefore, prediction performance is highly dependent on how well the similarities can be captured. Previous studies have calculated the similarity between two diseases by mapping exactly each disease to a single Disease Ontology (DO) term, and then use a semantic similarity measure to calculate the similarity between them. However, the problem of this approach is that a disease can be described by more than one DO terms. Until now, there is no annotation database of DO terms for diseases except for genes. In contrast, Human Phenotype Ontology (HPO) is designed to fully annotate human disease phenotypes.
Therefore, in this study, we constructed disease similarity networks/matrices using HPO instead of DO. Then, we used these networks/matrices as inputs of two representative machine learning-based and network-based ranking algorithms, that is, regularized least square and heterogeneous graph-based inference, respectively. The results showed that the prediction performance of the two algorithms on HPO-based is better than that on DO-based networks/matrices. In addition, our method can predict 11 novel cancer-associated lncRNAs, which are supported by literature evidence.
Keywords: Disease Ontology; Human Phenotype Ontology; disease-associated lncRNA; ranking algorithms; semantic similarity.
Có thể bạn quan tâm: Ức chế SGLT2 và sắt tĩnh mạch trong suy tim – có tương tác ?
Bình luận0
Bài viết cùng chuyên gia
