Немного расскажу предыстории, а потом плавно перейду к сути.
Тема диссертации исследование степени информативности медицинских показаний пациентов при заболевании ТЭЛА при помощи нейронных сетей.
От медиков нам поступил массив данных, а именно список различных медицинских показателей, по каждому больному, и для диагностики заболевания, нам нужно определить какие параметры имеют наибольшую информативность.
База данных от врачей:
[

Значения параметров нас не интересует
Отсеив лишние (не информативные) параметры, например (койка день), мы создаём файл размером 162х1 с рисками(весами), каждого из параметров, по 5ти бальной шкале, эти оценки расставлялись при консультации с врачами, с их точки зрения, какой параметр на сколько важен для определения заболевания ТЭЛА:

ДАлее запустив метод кластеризации, получили следующие результаты, которые показывают принадлежность параметров, к определённым кластерам:





НА последнем рисунке чётко видно, что имеем 5 явных кластеров.
А теперь ряд вопросов которые стоят на повестке:
1) как нам определить какой параметр в какой кластер входит?
2) Как нам определить, как параметры влияют друг на друга, то есть как определить базовый набор параметров, которые предоставляют наибольшую важность(информативность) для диагностики заболевания, а какие нет?
P.S так же была проведена классификация, по принадлежности параметров, к оному из 5-ти классов.
Если необходимо результаты и процесс могу описать и показать тут же.