БЕЙЕСА ПРАВИЛО
БЕЙЕСА ПРАВИЛО (Т. Bayes, шотландский математик 18 века) — теорема теории вероятностей, позволяющая уточнить вероятность наступления некоторых событий на основании дополнительной информации о проявлении характеризующих их признаков. Вероятности, подлежащие уточнению, называются априорными; вероятности, определяемые с помощью Бейеса правила после получения дополнительной информации, — апостериорными. Бейеса правило применяется с целью выяснения максимальной вероятности осуществления ряда взаимоисключающих событий. Теорема доказана Т. Бейесом.
На основе Бейеса правила может осуществляться конструирование диагностических систем, дающих возможность определить вероятность того или иного заболевания у конкретного больного.
Хотя в традиционной статистике Бейеса правило не получило распространения, опубликованы работы, демонстрирующие перспективность использования Бейеса правила для принятия решения в процессе диагностики, при выборе наиболее подходящего метода лечения для конкретного больного, а также для оценки данных, полученных в результате обследований с целью максимально возможного исключения субъективных ошибок.
Для решения диагностических задач с применением Бейеса правила необходимо знать количественные значения вероятностей проявления признака или комплекса признаков при данном диагнозе и априорной вероятности самого диагноза (то есть первоначальной вероятности, что у поступившего больного имеется некоторое заболевание, хотя характерный для этого заболевания комплекс признаков еще не выявлен).
Математически вероятность диагноза при наличии комплекса признаков P (Di|K) определяется на основе формулы Бейеса, которая принимает вид:
где P (Di) — априорная вероятность диагноза Di (частота встречаемости больных с диагнозом Di) в общей структуре заболеваемости или в материалах, которыми располагает исследователь на момент постановки эксперимента; P (K|Di) — вероятность проявления комплекса признаков К при диагнозе Di; P(К) — вероятность того, что у больного имеется данный комплекс симптомов К.
Вероятность симптома kj при данном заболевании определяется по формуле:
где nij — количество больных с диагнозом Di, имеющих симптом kj; ni — общее количество больных с диагнозом Di, обследованных по данному признаку.
Величина P (kj|Di) выражает вероятность того, что симптом kj будет обнаружен, если заболевание Di имеет место.
Значения вероятностей отдельных признаков лежат в пределах от 0 до
1. Признак kj будет абсолютно достоверным, если при данном заболевании он встречается в 100% случаев (например, белок в моче при остром нефрите и т. п.). Вероятность такого признака принимается за единицу.
Значения P (kj|Di) могут быть получены из данных медицинской статистики, литературных источников, результатов обработки архивных материалов или собственных наблюдений, а также при помощи вычислений на так называемой статистической модели.
При этом в ряде случаев выборка может быть не репрезентативной и оценка значения P (kj|Di) разными специалистами не одинакова, так как не имеется данных относительно значений P (kj|Di) для большинства заболеваний. Эдвардс, Линдман и Саведж (W. Edwards, H. Lindman, L. Savage, 1963) показали возможность использования заключений квалифицированных специалистов для оценки значений P (kj|Di) при отсутствии документированных статистически достоверных данных.
Величина P (Di) — априорная вероятность диагноза до того, как собраны сведения о клинических проявлениях заболевания. Значение величины P (Di), как и P (kj|Di), в большинстве случаев определяется на основании оценки имеющегося документированного опыта; в отдельных случаях могут использоваться клинические суждения компетентных специалистов. В отличие от значений P (kj|Di), эмпирически или статистически определяемые значения P (Di), полученные для одних и тех же диагнозов в зависимости от использованных материалов различных клинических учреждений или суждений специалистов, могут значительно разниться. Поэтому необходимость оценки величины P (Di) может явиться источником противоречий и трудностей при применении Бейеса правила в медицинской диагностике. Ледли и Ластед (R. Ledlay, L. Lusted, 1961) видят причину относительного постоянства величины P (kj|Di) для каждого конкретного диагноза в том, что эта условная вероятность в известной степени независима (по терминологии Ледли и Ластеда) от «местных окружающих факторов» (географический район, время года и т. п.) и в первую очередь выражает «физиолого-патологические аспекты самого заболевания». На формирование значений величины P (Di), напротив, в значительной степени влияют «местные факторы». Вместе с тем Мостеллер и Уоллес (F. Mosteller, D. Wallace, 1964) установили, что нек-рая неопределенность значений величины P (Di) не оказывает существенного влияния на конечный результат.
Практическое применение Бейеса правила в диагностике требует составления диагностических таблиц (или так называемой медицинской памяти диагностических систем), содержащих значение вероятностей проявления признаков для данной группы заболеваний (табл. 1).
При применении Бейеса правила в медицинской диагностике необходимо, чтобы заболевания были взаимоисключающими; различные признаки (симптомы) рассматриваются как независимые при условии заболевания Di (так называемый принцип условной независимости признаков), так как невозможно вычислить вероятность комбинаций заболеваний по данным о частотах симптомов для каждого из заболеваний в отдельности. Хотя симптомы любого заболевания находятся в прямой или опосредованной причинно-следственной зависимости, принцип условной независимости признаков, обеспечивающий возможность использования Бейеса правила, в большинстве случаев не вносит существенного искажения в конечный результат. Это, в частности, подтверждается исследованиями Уорнера (H. Warner, 1961), Лодвика (G. Lodwick, 1965) и математически доказано М. Л. Быховским (1967). Если обратиться к примеру, приведенному в таблице 1, то в соответствии с принципом условной независимости признаков
Принцип расчета не меняется при отсутствии одного из признаков.
Результаты расчета примера, рассмотренного в таблице 1, при наличии
Подставляя в приведенные формулы численные значения из таблицы 1, получаем значения P(KiDi) и
P (К) при наличии всех признаков:
Далее определяем вероятность диагнозов D1, D2, D3 по формуле Бейеса
всех признаков и при отсутствии одного из них приведены в таблицы 2. Сумма всех вероятностей равна единице.
Для диагностики по Бейеса правилу используются не только простые, но и сложные (многоразрядные) признаки (например, систолическое артериальное давление: нормальное, повышенное, пониженное).
На основе Бейеса правила в СССР и за рубежом разработаны диагностические системы, в частности в СССР — диагностическая система Института сердечно-сосудистой хирургии АМН СССР им. А. Н. Бакулева. Бейеса правило может использоваться при диагностике с помощью цифровых и электронных вычислительных машин (см. Диагностика машинная).
См. также Вероятностей теория.
Таблица 1. СХЕМА ДИАГНОСТИЧЕСКОЙ ТАБЛИЦЫ (по Т. Б. Постновой, 1972)
Диагноз |
Априорная вероятность диагноза |
Вероятности признаков |
|||
цианоз |
усиление легочного рисунка |
акцент II тона |
право- грамма |
||
Di |
P (Di) |
P (Κ1|Di) |
P (K2|Di) |
P (K3|Di) |
P(K4|Di) |
D1 — тетрада Фалло |
0,35 |
0,9 |
0 |
0,05 |
0,6 |
D2— дефект межпредсердной перегородки |
0,15 |
0,15 |
0,8 |
0,8 |
0,8 |
D3 — незаращение артериального протока |
0,5 |
0,1 |
0,95 |
0,9 |
0,1 |
Таблица 2. ВЕРОЯТНОСТИ ДИАГНОЗА ПРИ РАЗЛИЧНЫХ КОМБИНАЦИЯХ ПРИЗНАКОВ
Диагноз |
При наличии всех четырех признаков |
При отсутствии одного из признаков |
|||
цианоз (К J |
усиление легочного рисунка (К2) |
акцент II тона (К3) |
правограмма (К4) |
||
D1 — тетрада Фалло |
0 |
0 |
0,75 |
0 |
0 |
D2— дефект межпредсердной перегородки |
о -J СМ |
0,63 |
0,23 |
0,36 |
0,07 |
D3 — незаращение артериального протока |
0,25 |
0,37 |
0,02 |
0,64 |
0,93 |
Библиогр.: Ластед Л. Б. Введение в проблему принятия решений в медицине, пер. с англ., М., 1971, библиогр.; Лед-ли Р. М. и Ластед Л. Медицинская диагностика и современные методы выбора решения, в кн.: Математические пробл. в биол., под ред. Р. Беллмана, пер. с англ., с. 141, М., 1966, библиогр.; Постно-в а Т. Б. Информационно-диагностические системы в медицине, М., 1972, библиогр.
Я. А. Коган, А. М. Сточик.