클러스터링
Scientific Reports 13권, 기사 번호: 12701(2023) 이 기사 인용
측정항목 세부정보
디지털 병리학에 적용되는 기계 학습은 신장 기능을 평가하고 만성 신장 질환(CKD)의 근본 원인을 진단하는 데 점점 더 많이 사용되고 있습니다. 우리는 비지도 학습을 활용하여 신장 조직의 국소 시각적 패턴 간의 공간 관계를 학습하는 새로운 계산 프레임워크인 클러스터링 기반 공간 분석(CluSA)을 개발했습니다. 이 프레임워크는 시간이 많이 걸리고 실용적이지 않은 전문가 주석의 필요성을 최소화합니다. 172개의 생검 코어에서 얻은 107,471개의 조직병리학 이미지가 클러스터링 및 딥러닝 모델에 사용되었습니다. 생검 샘플의 클러스터링된 이미지 패턴에 대한 공간 정보를 통합하기 위해 클러스터링된 패턴을 색상으로 공간적으로 인코딩하고 그래프 신경망을 통해 공간 분석을 수행했습니다. 다양한 특징 그룹을 갖춘 Random Forest 분류기를 사용하여 CKD를 예측했습니다. 생검에서 eGFR을 예측하기 위해 민감도 0.97, 특이도 0.90, 정확도 0.95를 달성했습니다. AUC는 0.96이었습니다. 1년 후 eGFR 변화를 예측하기 위해 민감도 0.83, 특이도 0.85, 정확도 0.84를 달성했습니다. AUC는 0.85였습니다. 본 연구는 비지도 머신러닝 알고리즘을 기반으로 한 최초의 공간 분석을 제시합니다. 전문가의 주석 없이 CluSA 프레임워크는 생검 및 1년 후 신장 기능의 정도를 정확하게 분류하고 예측할 수 있을 뿐만 아니라 신장 기능 및 신장 예후에 대한 새로운 예측 변수를 식별할 수도 있습니다.
만성신장질환(CKD)은 신장 기능의 점진적인 상실을 수반하며 상태가 진행될 때까지 초기 단계에서 쉽게 발견되지 않습니다. 질병 통제 예방 센터(CDC)에 따르면 3,700만 명이 넘는 사람들(미국 성인의 15%)이 만성 신장 질환(CKD)을 앓고 있는 것으로 추정되며, CKD를 앓고 있는 성인 10명 중 9명은 자신이 CKD1에 걸렸다는 사실을 모릅니다. 당뇨병, 고혈압, 심장병, 신부전의 가족력은 신장 질환의 가장 흔한 원인입니다. 현재 유방암이나 전립선암보다 더 많은 사망을 초래하는 CKD는 미국에서 사망 원인 9위를 차지하고 있습니다1.
신장 기능 장애의 정도는 사망률 증가 및 심장 질환 위험 증가와 연관되어 있으므로2,3 신부전으로의 진행을 늦추려면 정확한 조기 진단이 중요합니다4. 혈액 내 크레아티닌 수치, 소변 내 단백질과 같은 신장 기능 및 진행 위험에 대한 현재 일반적인 측정법은 몇 가지 제한 사항이 있으며 더 높은 수준의 신장 기능에서는 정확하지 않습니다7. 신장 생검 검체는 사구체 경화증 및 간질성 섬유증의 정도와 같은 추가 예후 정보를 제공할 수 있지만8 종종 시각적으로 추정되며 해석은 병리학자마다 다를 수 있습니다. 컴퓨터 지원 알고리즘은 보다 객관적인 신장 평가를 제공하고 관찰자 간 상당한 변동성을 극복하는 데 도움이 될 수 있습니다.
전체 슬라이드 디지털 스캐너의 가용성이 높아짐에 따라 조직병리학적 이미지 분석에 대한 여러 딥 러닝 및 기계 학습 접근 방식이 점점 일반화되었습니다. Coudrayet al. 전체 슬라이드 이미지(WSI)에 컨볼루션 신경망(CNN)을 사용하여 폐 선암종(LUAD), 폐 편평 세포 암종(LUSC) 또는 정상 폐 조직으로 분류했습니다10. 또한 경화된 사구체와 경화되지 않은 사구체를 분류하기 위해 CNN이 WSI에 적용되었습니다11,12. Kolachalamaet al. CNN 딥 러닝 모델이 분류 작업 전반에 걸쳐 병리학자가 추정한 섬유증 점수를 능가할 수 있으며 일상적인 신장 생검 이미지에 적용될 수 있음을 입증했습니다13.
현재까지 조직병리학 영상에 적용되는 대부분의 머신러닝 및 딥러닝 알고리즘은 감독(훈련) 접근 방식을 기반으로 했습니다. 그러나 지도 알고리즘을 사용하려면 대량의 레이블이 지정된 훈련 데이터를 사용해야 하며 이는 시간이 많이 걸리고 종종 비실용적이며 비용이 많이 드는 작업입니다. 이 문제를 극복하기 위해 여러 연구에서 상대적으로 높은 성능을 제공하는 약한 지도 학습(Weakly-supervised Learning) 및 다중 인스턴스 학습(MIL)과 같은 방법을 제안했습니다. 그러나 이는 여전히 환자 수준 라벨이 필요한 감독 방법입니다.