- Категорія
- Новини
Штучний інтелект розпізнає рак, але водночас «бачить» демографію пацієнта — і це проблема
- Дата публікації
ШІ, який аналізує зрізки тканин при діагностиці пухлин, вміє визначати расу, стать і вік пацієнта — тоді як лікар цього зробити не може. Саме тому точність діагностики ШІ відрізняється для різних груп пацієнтів.
Патологія залишається основою діагностики раку десятиліттями. Лікар- патоморфолог вивчає під мікроскопом тонкий зріз тканини, відшукуючи візуальні ознаки хвороби. Для спеціаліста такий зразок містить життєво важливу інформацію про захворювання, але нічого не говорить про те, хто саме пацієнт. А от при застосуванні систем штучного інтелекту це працює інакше.
Дослідники Гарвардської медичної школи перевірили чотири широко вживані моделі глибокого навчання, призначені для діагностики раку. Аналіз охопив патологічні зразки тканин з 20 різними типами раку.
Результати виявили системні відмінності в точності штучного інтелекту: ШІ-моделі гірше працювали в певних демографічних групах, визначених за расою, статтю та віком. Наприклад, ШІ важче розрізняв підтипи раку легені у чоловіків й афроамериканців. Точність машини також знижувалася при класифікації підтипів раку молочної залози в пацієнтів молодшого віку. Загалом такі розбіжності виявлялися приблизно в 29% діагностичних завдань.
Дослідники визначили три основні причини проблем з точністю ШІ-діагностики.
Нерівномірність навчальних даних: зразки тканин простіше отримати від одних демографічних груп, ніж від інших, тому набори даних незбалансовані. Це ускладнює діагностику для недостатньо представлених груп. Хоча, зі слів авторів, «проблема виявилася значно глибшою»: в окремих випадках ШІ-моделі псували діагностику для певних груп навіть при однаковому розмірі вибірки.
Відмінності в захворюваності: певні типи пухлин більш поширені певних популяціях, і ШІ-моделі особливо точні в діагностиці саме для цих груп. Відповідно, для популяцій, яким ці захворювання мало притаманні, точність падає.
Здатність ШІ виявляти мінімальні молекулярні відмінності між демографічними групами. Наприклад, ШІ розпізнає мутації в генах-драйверах раку і використовує їх як «короткий шлях» для класифікації типу пухлини. Це знижує точність для популяцій, де такі мутації поширені менше.
«Ми виявили, що через свою потужність ШІ може розрізняти багато неочевидних біологічних сигналів, недоступних людському оку. Це змушує моделі фокусуватися на сигналах, повʼязаних радше з демографією, ніж із самою хворобою», — пояснили автори.
Щоб вирішити цю проблему, вони розробили підхід під назвою FAIR-Path, який модифікує тренування ШІ так, щоб моделі більше зосереджувалися на критичних відмінностях — наприклад, між типами раку — і менше звертали увагу на демографічні характеристики. Перевірка показала, що після застосування FAIR-Path діагностичні розбіжності зменшилися приблизно на 88%. Суттєве зменшення упередженості виявилося можливим навіть у випадках відсутності ідеально збалансованих навчальних наборів даних.
Наразі команда дослідників працює з медзакладами по всьому світу, вивчаючи упередженість ШІ в регіонах із різною демографією й клінічними практиками та адаптуючи FAIR-Path для ситуацій з обмеженими даними.