ГлавнаяКаталог работМедицина и физкультура → Экспертные оценки.doc
5ка.РФ

Не забывайте помогать другим, кто возможно помог Вам! Это просто, достаточно добавить одну из своих работ на сайт!


Список категорий Поиск по работам Добавить работу
Подробности закачки

Экспертные оценки.doc

Содержание


Введение……………………………………………………………………..3
1. Основные проблемы экспертных оценок……………………………….4
2. Цели и стадии экспертных оценок………………………………………9
3. Математические методы анализа экспертных оценок………………...14
Заключение………………………………………………………………….18
Список литературы…………………………………………………………19
Приложение…………………………………………………………………20



Введение

Современные математические методы экспертных оценок - это в основном методы статистики объектов нечисловой природы. В настоящее время обсуждаются догмы в области экспертных оценок и современные рекомендации, применение статистики объектов нечисловой природы в экспертных оценках, вопросы построения интегральных показателей качества, эффективности и пр., т.е. рейтингов, а также перспективы создания и применения гаммы современных методик экспертных оценок на основе подходов и результатов указанного научного коллектива.
Для принятия обоснованных решений необходимо опираться на опыт, знания и интуицию специалистов. Методы экспертных оценок - это методы организации работы со специалистами-экспертами и обработки мнений экспертов, выраженных в количественной и/или качественной форме с целью подготовки информации для принятия решений ЛПР - лицами, принимающими решения.
Существует масса методов получения экспертных оценок. В одних с каждым экспертом работают отдельно, он даже не знает, кто еще является экспертом, а потому высказывает свое мнение независимо от авторитетов. В других экспертов собирают вместе для подготовки материалов для ЛПР, при этом эксперты обсуждают проблему друг с другом, учатся друг у друга, и неверные мнения отбрасываются. В одних методах число экспертов фиксировано и таково, чтобы статистические методы проверки согласованности мнений и затем их усреднения позволяли принимать обоснованные решения. В других - число экспертов растет в процессе проведения экспертизы, например, при использовании метода "снежного кома".
В настоящее время не существует научно обоснованной классификации методов экспертных оценок и тем более - однозначных рекомендаций по их применению. Вполне естественно, что сначала в нашей стране появились публикации о простейших методах экспертных оценок. Как обычно бывает, тривиальные соображения широко распространились, вошли в массовое сознание инженеров и управленцев (менеджеров) и стали тормозом на пути внедрения современных результатов в области экспертных оценок, описанных, например, в работах.
В рамках настоящей работы выделим основные проблемы в рассматриваемой области, что можно рассматривать как экспертный анализ состояния дел в научно-практической дисциплине "Экспертные оценки".



1.Основные проблемы экспертных оценок

В наши дни качество медицинской помощи (КМП) находится в центре внимания всех субъектов обязательного медицинского страхования и других участников медико-санитарного обслуживания, поскольку население и работники системы здравоохранения, страховых медицинских организаций и др. обеспокоены тем, что тенденции по сокращению расходов могут привести к снижению КМП.
На первый взгляд может показаться непозволительной роскошью высококачественное медицинское обслуживание, выходящее за рамки возможностей бюджета и страховых фондов. Однако опыт многих развивающихся стран показывает, что часто для повышения КМП не требуется значительного увеличения финансовых средств. Необходимо иметь хорошо отлаженную систему оценки, контроля и обеспечения КМП.
Была поставлена задача создать комплексную интегрированную систему оценки, контроля и обеспечения КМП, которая бы охватывала основные уровни оказания медицинской помощи: лечащий врач, бригада, отделение, учреждение, профиль службы, здравоохранение района, города. Однако методические вопросы организации медицинской экспертизы, обеспечения систематического контроля за качеством МП и системой защиты прав пациентов полностью не решены. До настоящего времени нет единого представления у медицинских работников и пациентов о понятиях "качество МП", "обеспечение качества". Прежде чем говорить об "обеспечении качества", следует определиться с понятием "качество", с аспектами, раскрывающими это понятие.
Американские исследователи (Лори Дипрет Браун, Линн Миллер Франко и др.) в работе из серии "Усовершенствование методологии обеспечения качества" выделяют следующие аспекты качества:
- профессиональная компетентность;
- доступность услуг;
- медицинская эффективность;
- хорошие межличностные отношения;
- экономическая эффективность;
- удобства.
Представленные авторами аспекты достаточно полно раскрывают понятие "качество". В то же время каждый из перечисленных аспектов требует формализации, разработки стандартов, измерителей. Таким образом, качество представляет собой сложное и многогранное понятие. Мероприятия по обеспечению качества могут быть направлены на улучшение всей совокупности аспектов, нескольких, одного. С целью организации оценки, контроля качества медицинской помощи необходимо создание медицинских стандартов.
Медицинский стандарт – это комплекс мероприятий, норм, правил и требований, предъявляемых при оказании медицинской помощи при различных ситуациях, разработанных на основе достижений науки, техники и передового опыта и оформленных в виде нормативно-технологического документа, утвержденного компетентным органом.
Объектом стандартизации являются медицинская технология в процессе оказания медицинской помощи по достижению поставленной цели и результат деятельности. При этом функционирование системы оценивается как достаточно "качественное", если результаты деятельности и технологии соответствуют стандартам.
Экспертная комиссия в результате своей работы, достигает две цели - информацию для принятия решения ЛПР и проект самого решения.
Цель - сбор информации для ЛПР.
Тогда Рабочая группа должна собрать возможно больше относящейся к делу информации, аргументов "за" и "против" определенных вариантов решений.
Сначала первый эксперт приводит свои соображения по рассматриваемому вопросу. Составленный им материал передается второму эксперту, который добавляет свои аргументы. Накопленный материал поступает к следующему - третьему - эксперту... Процедура заканчивается, когда иссякает поток новых соображений.
Отметим, что эксперты в рассматриваемом методе только поставляют информацию, аргументы "за" и "против", но не вырабатывают согласованного проекта решения. Нет никакой необходимости стремиться к тому, чтобы экспертные мнения были согласованы между собой. Более того, наибольшую пользу приносят эксперты с мышлением, отклоняющимся от массового, поскольку именно от них следует ожидать наиболее оригинальных аргументов.
Цель - подготовка проекта решения для ЛПР
Математические методы в экспертных оценках применяются обычно именно для решения задач подготовки проекта решения. При этом зачастую некритически принимают догмы согласованности и одномерности. Эти догмы "кочуют" из одной публикации в другую, поэтому целесообразно их обсудить.
Догма согласованности.
Считается, что решение может быть принято лишь на основе согласованных мнений экспертов. Поэтому исключают из экспертной группы тех, чье мнение отличается от мнения большинства. При этом отсеиваются как неквалифицированные лица, попавшие в состав экспертной комиссии по недоразумению или по соображениям, не имеющим отношения к их профессиональному уровню, так и наиболее оригинальные мыслители, глубже проникшие в проблему, чем большинство. Следовало бы выяснить их аргументы, предоставить им возможность для обоснования их точек зрения. Вместо этого их мнением пренебрегают. Бывает и так, что эксперты делятся на две или более групп, имеющих единые групповые точки зрения. Так, в приведен пример деления специалистов при оценке результатов научно-исследовательских работ на две группы: "теоретиков", явно предпочитающих НИР, в которых получены теоретические результаты, и "практиков", выбирающих те НИР, которые позволяют получать непосредственные прикладные результаты (речь идет о конкурсе НИР в Институте проблем управления (автоматики и телемеханики)).
Иногда заявляют, что в случае обнаружения двух или нескольких групп экспертов (вместо одной согласованной во мнениях) опрос не достиг цели. Это не так! Цель достигнута - установлено, что единого мнения нет. И ЛПР должен это учитывать. Стремление обеспечить согласованность мнений экспертов любой целой может приводить к сознательному одностороннему подбору экспертов, игнорированию всех точек зрения, кроме одной, наиболее полюбившейся Рабочей группе (или даже "подсказанной" ЛПР).
Поскольку число экспертов обычно не превышает 20-30, то формальная статистическая согласованность мнений экспертов может сочетаться с реально имеющимся разделением на группы, что делает дальнейшие расчеты не имеющими отношения к действительности. Если же обратиться к конкретным методам расчетов, например, с помощью коэффициентов конкордации на основе коэффициентов ранговой корреляции Кендалла или Спирмена, то необходимо помнить, что на самом деле положительный результат проверки согласованности таким способом означает ни больше, ни меньше, как отклонение гипотезы о независимости и равномерной распределенности мнений экспертов на множестве всех ранжировок. Другими словами, мы падаем жертвой заблуждений, вытекающих из своеобразного толкования слов: проверка согласованности в указанном статистическом смысле вовсе не является проверкой согласованности в смысле практики экспертных оценок. (Именно ущербность рассматриваемых математико-статистических методов анализа ранжировок привела нас к разработке нового математического аппарата для проверки согласованности - непараметрических методов, основанных на люсианах)
С целью искусственно добиться согласованности стараются уменьшить влияние мнений экспертов-диссидентов. Жесткий способ борьбы с диссидентами состоит в их исключении из состава экспертной комиссии. Отбраковка экспертов, как и отбраковка резко выделяющихся результатов наблюдений, приводит к процедурам, имеющим плохие или неизвестные статистические свойства.
Мягкий способ борьбы с диссидентами состоит в применении робастных (устойчивых) статистических процедур. Простейший пример: если ответ эксперта - действительное число, то резко выделяющееся мнение диссидента сильно влияет на среднее арифметическое ответов экспертов и не влияет на их медиану. Поэтому разумно в качестве согласованного мнения рассматривать медиану. Однако при этом игнорируются (не достигают ЛПР) аргументы диссидентов.
В любом из двух способов борьбы с диссидентами ЛПР лишается информации, идущей от диссидентов, а потому может принять необоснованное решение, которое приведет к отрицательным последствиям. С другой стороны, представление ЛПР всего набора мнений снимает часть ответственности и труда по подготовке окончательного решения с комиссии экспертов и рабочей группы по проведению экспертного опроса и перекладывает ее на плечи ЛПР.
Догма одномерности.
Распространен довольно примитивный подход так называемой "квалиметрии", согласно которому объект всегда можно оценить одним числом Каждый объект можно оценивать по многим показателям качества. Например, легковой автомобиль можно оценивать по таким показателям:
• расход бензина на 100 км пути (в среднем);
• надежность (средняя стоимость ремонта за год);
• быстрота набора скорости 100 км/час после начала движения;
• максимальная достигаемая скорость;
• длительность сохранения в салоне положительной температуры при наружной температуре (50 градусов) при выключенном двигателе;
• вес, и т.д.
Можно ли свести оценки по этим показателям вместе? Определяющей является конкретная ситуация, для которой выбирается автомашина. Максимально достигаемая скорость важна для гонщика, но, как нам представляется, не имеет большого практического значения для водителя рядовой частной машины. Для такого водителя важнее расход бензина и надежность. Для машин различных служб государственного управления надежность важнее, чем для частника, а расход бензина - наоборот. Для районов Крайнего Севера важна теплоизоляция салона, а для южных районов страны - нет.
Таким образом, важна конкретная (узкая) постановка задачи перед экспертами. Но такой постановки зачастую нет. А тогда "игры" по разработке обобщенного показателя качества не имеют объективного характера. В недавние времена они использовались для создания впечатления о высоком качестве отечественной продукции. Ведь западные машины не морозоустойчивые, не так ли? Значит, подбирая нужным образом коэффициенты в линейной функции от показателей качества, а именно, занижая те, по которым западные машины лучше (вес и др.) и завышая те, по которым лучше отечественные (морозоустойчивость), можно добиться поставленной цели. Почему-то рыночные отношения не считаются с подобными выводами. (С этим, правда, можно бороться, выбирая другие коэффициенты - те, что вытекают из реального сравнения изделий по конкурентоспособности).
Альтернативой единственному обобщенному показателю является математический аппарат типа многокритериальной оптимизации - множества Парето и т.д.
В некоторых случаях все-таки можно глобально сравнить объекты - например, с помощью тех же экспертов получить упорядочение рассматриваемых объектов - изделий или проектов. Тогда можно ПОДОБРАТЬ коэффициенты при отдельных показателях так, чтобы упорядочение с помощью линейной функции возможно точнее соответствовало глобальному упорядочению. Наоборот, в подобных случаях НЕ СЛЕДУЕТ оценивать указанные коэффициенты с помощью экспертов. Эта простая идея до сих пор не стала очевидной для отдельных составителей методик по проведению экспертных опросов и анализу их результатов. Они упорно стараются заставить экспертов делать то, что они выполнить не в состоянии - указывать веса, с которыми отдельные показатели качества должны входить в итоговый обобщенный показатель. Эксперты обычно могут сравнить объекты и эти ответы не несут в себе надежной информации о реальности.


2. Цели и стадии экспертных оценок

Цель экспертных оценок: повышение качества и результативности медицинской помощи на основе совершенствования процессов управления качеством медицинской помощи, внедрения прогрессивных медико-организационных технологий, повышение уровня квалификации медицинских кадров, интенсификации использования имеющихся ресурсов. Для реализации цели в системе решены следующие комплексы задач:
1) стандартизация:
- создание стандартов результативности, специфичных для каждого уровня и этапа оказания медицинской помощи;
- создание медико-экономических стандартов на каждый случай заболевания;
- создание оценочных шкал;
2) создание информационных моделей взаимодействия участков лечебно-диагностического процесса;
3) создание персонифицированных баз на обслуживаемый контингент;
4) создание банков управляющих воздействий;
5) разработка методов количественной оценки уровня качества;
6) выдача рекомендаций об управляющих воздействиях, основанных на поведении объектов.
Раскроем содержание каждого комплекса задач.
Стандарт результативности - формулировка ожидаемого результата по перечисленным аспектам качества. Набор показателей, их нормированное значение, весовые коэффициенты показателей, желательная тенденция показателей (снижение, увеличение, оптимальное значение) определяют стандарт на результат деятельности. Процесс построения стандарта предусматривает несколько этапов.
Первый и наиболее важный этап построения стандарта, способного обеспечить правильное решение управленческой проблемы, состоит в выборе показателей, включенных в стандарт. При этом нужно дать экспертную оценку значимости показателей. Оцениваем показатели десятибалльной шкалой. Например, показатель «расхождение диагноза поликлиники и стационара» имеет значимость при определении уровня качества в 8 баллов, а показатель «смертность в трудоспособном возрасте» - 5 баллов. Затем нужно пронормировать значения показателей. Для этого в системе предусмотрено два пути: анализ временных рядов и метод экспертных оценок. Анализ основан на допущении, согласно которому случившееся в прошлом даст достаточно хорошее приближение в оценке будущего. Метод экспертных оценок является формальным вариантом метода коллективного мнения.
Необходимо проверить стандарт на достоверность, т.е. определить степень соответствия стандарта реальному миру. Аспект проверки стандарта связан с установлением степени, в которой информация, получаемая с его помощью, действительно помогает руководству решить проблему. Хороший способ проверки стандарта заключается в опробовании его на ситуации из прошлого. После проверки на достоверность стандарт готов к использованию. Основная причина неиспользования стандартов в том, что их опасаются или не понимают их значения. Следует научить использовать стандарт. Лица, для которых предназначены стандарты, должны принимать участие в процессе их построения.
Количественным выражением КМП является коэффициент соответствия достигнутых результатов объекта стандарту. Назовем этот коэффициент уровнем качества медицинской помощи (УКМП). Эталонным коэффициентом считается коэффициент, равный единице. Методика оценки КМП предполагает оценку значений каждого показателя согласно нормативной таблице - стандарту.
Создание оценочных шкал необходимо для фильтрации объектов на последующие этапы контроля. Оценочные шкалы устанавливают масштабы допустимых отклонений. Одной из оценочных шкал является планируемый интервал значений уровня качества медицинской помощи. Например, полученный УКМП 0,98 характеризует благополучную ситуацию, приемлемое поведение объекта. А объект, имеющий УКМП 0,95 - подлежит экспертизе на следующем этапе контроля. Нормирование оценочных шкал базируется на анализе временных рядов.
Выделяют следующие стадии проведения экспертного опроса:
1) формулировка Лицом, Принимающим Решения, цели экспертного опроса;
2) подбор ЛПР основного состава Рабочей группы;
3) разработка РГ и утверждение у ЛПР технического задания на проведение экспертного опроса;
4) разработка РГ подробного сценария проведения сбора и анализа экспертных мнений (оценок), включая как конкретный вид экспертной информации ( слова, условные градации, числа, ранжировки, разбиения или иные виды объектов нечисловой природы) и конкретные методы анализа этой информации (вычисление медианы Кемени, статистический анализ люсианов и иные методы статистики объектов нечисловой природы и других разделов прикладной статистики);
5) подбор экспертов в соответствии с их компетентностью;
6) формирование экспертной комиссии (целесообразно заключение договоров с экспертами об условиях их работы и ее оплаты, утверждение ЛПР состава экспертной комиссии);
7) проведение сбора экспертной информации;
8) анализ экспертной информации;
9) при наличии нескольких туров - повторение двух предыдущих этапов;
10) интерпретация полученных результатов и подготовка заключения для ЛПР;
11) официальное окончание деятельности РГ.
Подбор экспертов
Проблема подбора экспертов является одной из наиболее сложных. Очевидно, в качестве экспертов необходимо использовать тех людей, чьи суждения наиболее помогут принятию адекватного решения. Но как выделить, найти, подобрать таких людей? Надо прямо сказать, что нет методов подбора экспертов, наверняка обеспечивающих успех экспертизы. Сейчас мы не будем возвращаться к обсуждению проблемы существования различных "партий" среди экспертов и обратим внимание на различные иные стороны подбора экспертов.
Часто предлагают использовать методы взаимооценки и самооценки компетентности экспертов. С одной стороны, кто лучше может знать возможности эксперта, чем он сам? С другой стороны, при самооценке компетентности скорее оценивается степень самоуверенности эксперта, чем его реальная компетентность. Тем более, что само понятие "компетентность" строго не определено. Можно его уточнять, выделяя составляющие, но при этом усложняется предварительная часть деятельности экспертной комиссии.
При использовании метода взаимооценки, помимо возможности проявления личностных и групповых симпатий и антипатий, играет роль неосведомленность экспертов о возможностях друг друга. В современных условиях достаточно хорошее знакомство с работами и возможностями друг друга может быть лишь у специалистов, много лет работающих совместно. Однако привлечение таких пар специалистов не очень-то целесообразно, поскольку они слишком похожи друг на друга.
Использование формальных показателей (должность, ученые степень и звание, стаж, число публикаций...), очевидно, может носить вспомогательный характер. Успешность участия в предыдущих экспертизах - хороший критерий для деятельности дегустатора, врача, судьи в спортивных соревнованиях, т.е. таких экспертов, которые участвуют в длинных сериях однотипных экспертиз. Однако, увы, наиболее интересны и важны уникальные экспертизы больших проектов, не имеющих аналогов.
В случае, если процедура экспертного опроса предполагает совместную работу экспертов, большое значение имеют их личностные качества. Один "говорун" может парализовать деятельность всей комиссии. В подобных случаях важно соблюдение регламента работы, разработанного РГ.
Есть полезный метод "снежного кома", при котором от каждого специалиста, привлекаемого в качестве эксперта, получают несколько фамилий тех, кто может быть экспертом по рассматриваемой тематике. Очевидно, некоторые из этих фамилий встречались ранее в деятельности РГ, а некоторые - новые. Процесс расширения списка останавливается, когда новые фамилии перестают встречаться. В результате получается достаточно обширный список возможных экспертов. Ясно, что если на первом этапе все эксперты были из одного "клана", то и метод "снежного кома" даст, скорее всего, лиц из этого "клана", мнения и аргументы других "кланов" будут упущены.
Необходимо подчеркнуть, что подбор экспертов в конечном счете - функция Рабочей группы, и никакие методики подбора не снимают с нее ответственности. Другими словами, именно на Рабочей группе лежит ответственность за компетентность экспертов, за их принципиальную способность решить поставленную задачу.
Математические модели поведения экспертов
Теория и практика экспертных оценок весьма математизированы.
Можно выделить две взаимосвязанные ветви - математические модели поведения экспертов и математико-статистические методы анализа экспертных оценок.
Модели поведения экспертов обычно основаны на предположении, что эксперты оценивают интересующий ЛПР параметр (например, ранжировку образцов изделий по конкурентоспособности) с некоторыми ошибками, т.е. эксперта рассматривают как особого рода прибор с присущими ему метрологическими характеристиками. Оценки группы экспертов рассматривают как совокупность независимых одинаково распределенных случайных величин со значениями в соответствующем пространстве объектов числовой или нечисловой природы. Обычно предполагается, что эксперт чаще выбирает правильное решение (т.е. адекватное реальности), чем неправильное. В математических моделях это выражается в том, что плотность распределения случайной величины - ответа эксперта монотонно убывает с увеличением расстояния от центра распределения - истинного значения параметра.
На математических моделях поведения экспертов основаны методы планирования экспертного опроса, сбора и анализа ответов экспертов. Очевидно, чем больше предположений заложено в модель, тем больше выводов можно сделать на основе экспертных оценок, рассматриваемых как статистические данные - и тем менее обоснованными являются эти выводы, если нет оснований для принятия используемой модели. Рассмотрим триаду моделей поведения экспертов:
Параметрическая модель - непараметрическая модель - модель анализа данных.
Параметрическим моделям соответствуют наиболее сильные предположения, проверить которые обычно не удается. Так, следует обратить внимание на то, что обычно невозможно обосновать нормальность распределения ответов экспертов.
Дополнительным фактором является ограниченность числа экспертов - обычно не более 10 - 30, что делает невозможным надежную проверку нормальности даже с помощью такого эффективного по отношению к обычно встречающимся альтернативам критерия, как критерий Шапиро-Уилка.
В начале семидесятых годов был проведен обширный эксперимент (на стыке с психофизиологией) по изучению поведения экспертов. Каждому из них было предъявлено пять образцов. Эксперты рассматривались как "приборы", которые сравнивали образцы по весу. Оказалось, что ответы экспертов одинаково хорошо соответствуют как модели Терстоуна, так и модели Бредли-Терри-Льюса. А ведь эти модели принципиально различны, выводы на их основе существенно отличаются!
На наш взгляд, сказанного достаточно, чтобы относиться с сомнением к обоснованности применения параметрических моделей экспертных оценок.
Непараметрические модели экспертных оценок опираются лишь на предположения общего характера о возможности вероятностно-статистического описания поведения экспертов с помощью непрерывных функций распрекделения или люсианов, параметрами для которых служат нечеткие множества - вектор вероятностей ответов "да". Поэтому во многих ситуациях такие модели представляются адекватными.
Под моделями анализа данных понимаем здесь модели, не использующие вероятностные соображения. Очевидно, они наиболее адекватны и защищены от критики, поскольку не претендуют на выход на пределы имеющихся данных, не предполагают построения и обоснования какой-либо вероятностно-статистической модели реального явления или процесса. Однако с их помощью, очевидно, нельзя сделать никаких заключений о будущих аналогичных ситуациях.























3. Математические методы анализа экспертных оценок

При анализе мнений экспертов можно применять самые разнообразные статистические методы, описывать их - значит описывать всю прикладную статистику (по нашей оценке, к прикладной статистике относится не менее 1 000 000 статей и книг, а из них не менее 100 000 являются актуальными в настоящее время). В этом утверждении нет ничего нового: поскольку одно из научных направлений желает рассматривать эксперта как прибор, измеряющий интересующий ЛПР параметр - номер лучшего по конкурентоспособности изделия, ранжировку проектов и т.д. - то и экспертные оценки оно сопоставляет с результатами измерений - традиционным видом данных, обрабатываемых с помощью методов прикладной статистики.
Тем не менее можно выделить основные широко используемые в настоящее время методы математической обработки экспертных оценок - это проверка согласованности мнений экспертов (или классификация экспертов, если нет согласованности) и усреднение мнений экспертов внутри согласованной группы.
Поскольку ответы экспертов во многих процедурах экспертного опроса - не числа, а такие объекты нечисловой природы, как градации качественных признаков, ранжировки, разбиения, результаты парных сравнений, нечеткие предпочтения и т.д., то для их анализа оказываются полезными методы статистики объектов нечисловой природы.
Почему ответы экспертов носят нечисловой характер? Наиболее общий ответ состоит в том, что люди не мыслят числами. В мышлении человека используются образы, слова, но не числа. Поэтому требовать от эксперта ответа в форме числа - значит насиловать его разум. Даже в экономике предприниматели, принимая решения, лишь частично опираются на численные расчеты. Это видно из условного (т.е.определяемого произвольно принятыми соглашениями) характера балансовой прибыли, амортизационных отчислений и других экономических показателей. Поэтому фраза типа "фирма стремится к максимизации прибыли" не может иметь строго определенного смысла. Достаточно спросить: "Максимизация прибыли - за какой период?"
Эксперт может сравнить два объекта, дать им оценки типа "хороший", "приемлемый", "плохой", упорядочить несколько объектов по привлекательности, но обычно не может сказать, во сколько раз или на сколько один объект лучше другого. Другими словами, ответы эксперта обычно измерены в порядковой шкале, являются ранжировками, результатами парных сравнений и другими объектами нечисловой природы, но не числами. Распространенное заблуждение состоит в том, что ответы экспертов стараются рассматривать как числа, занимаются "оцифровкой" их мнений, приписывая этим мнениям численные значения - баллы, которые потом обрабатывают с помощью методов прикладной статистики как результаты обычных физических измерений. В случае произвольности оцифровки выводы, полученные в результате обработки данных, могут не иметь отношения к реальности. С позиций репрезентативной теории измерений следует применять алгоритмы анализа данных, результаты работы которых не меняются при допустимом преобразовании шкалы.
Настоящая глава раздела отчета соответствует другой парадигме по сравнению с многими публикациями по вопросам статистики объектов нечисловой природы, например, статьями. Здесь мы рассматриваем конкретную научно-практическую дисциплину, в которой постоянно используются методы статистического анализа нечисловых данных, в то время как работы посвящены одному из разделов прикладной математической статистики.
Сначала мы развивали тематику экспертных оценок, изучая возможность использования в этой области методов репрезентативной теории измерений нечетких множеств, аксиоматического введения метрик и т.д. Разработанные подходы, методы, результаты рассматривались как часть математической теории экспертного оценивания. Соответствующие статьи публиковались в сборниках по экспертным оценкам и были написаны на языке экспертных оценок. И лишь затем, после десятилетней работы, было осознано, что разработана новая область прикладной математической статистики, которая может применяться не только в экспертных оценках, но и в технических науках, медицине, социально-экономических исследованиях, практически во всех напрвлениях научных и практических исследований. С другой стороны, для конкретной работы в области экспертных оценок, возможно, более полезны практические рекомендации, чем упомянутые математические результаты и содержащие их публикации. Однако сейчас пришло время вернуться к прежней парадигме, разработанный математический аппарат статистики объектов нечисловой природы использовать для решения конкретных задач практики экспертных исследований.
Тесная связь между экспертными оценками и статистикой объектов нечисловой природы позволяет опустить здесь описание математического аппарата экспертных оценок, отослав читателя к обзорам.
Проверка согласованности и классификация экспертов
Статистические методы проверки согласованности зависят от математической природы ответов экспертов. Соответствующие статистические теории весьма трудны, если эти ответы - ранжировки или разбиения, и достаточно просты, если ответы - результаты парных сравнений. Отсюда вытекает рекомендация по организации экспертного опроса: не старайтесь получить от эксперта ранжировку или разбиение, ему трудно это сделать, да и имеющиеся математические методы не позволяют далеко продвинуться.
Эксперту гораздо легче на каждом шагу сравнивать только два объекта. Пусть он занимается парными сравнениями. Непараметрическая теория парных сравнений (теория люсианов) (основные результаты теории люсианов описаны в работах) позволяет решать более сложные задачи, чем статистика ранжировок или разбиений. В частности, вместо гипотезы равномерного распределения можно рассматривать гипотезу однородности, т.е. вместо совпадения всех распределений с одним фиксированным (равномерным) можно проверять лишь совпадение распределений мнений экспертов между собой, что естественно трактовать как согласованность их мнений. Таким образом, удается избавиться от неестественного предположения равномерности.
При отсутствии согласованности экспертов естественно разбить их на группы сходных по мнению. Это можно сделать методами кластер-анализа, предварительно введя метрику в пространство мнений экспертов. Идея Кемени об аксиоматическом введении метрик нашла в СССР многочисленных продолжателей. Однако методы кластер-анализа обычно являются эвристическими, в частности, невозможно с позиций статистической теории обосновать "законность" объединения двух кластеров в один. Имеется важное исключение - для независимых парных сравнений (люсианов) разработаны методы, позволяющие проверять возможность объединения кластеров как статистическую гипотезу - Это - еще один аргумент за то, чтобы рассматривать теорию люсианов как ядро математических методов экспертных оценок.
Нахождение итогового мнения комиссии экспертов
Пусть мнения комиссии экспертов или какой-то ее части признаны согласованными. Каково же итоговое (среднее, общее) мнение комиссии? Согласно идее Кемени, описанной в монографии, следует найти среднее мнение как решение оптимизационной задачи - минимизировать суммарное расстояние от кандидата в средние до мнений экспертов. В так найденное среднее мнение названо "медианой Кемени".
Математическая сложность состоит в том, что мнения экспертов лежат в некотором пространстве объектов нечисловой природы. Общая теория подобного усреднения построена в работах, в частности, показано, что в силу сформулированного и доказанного А.И.Орловым обобщения закона больших чисел среднее мнение при увеличении числа экспертов (чьи мнения независимы и одинаково распределены) приближается к некоторому пределу, который естественно назвать математическим ожиданием (случайного элемента, имеющего то же распределение, что и ответы экспертов).
В конкретных пространствах нечисловых мнений экспертов вычисление медианы Кемени может быть достаточно сложным делом. Кроме свойств пространства, велика роль конкретных метрик. Так, в пространстве ранжировок при использовании метрики, связанной с коэффициентом ранговой корреляции Кендалла, необходимо проводить достаточно сложные расчеты, в то время как применение метрики на основе коэффициента ранговой корреляции Спирмена приводит к упорядочению по средним рангам, т.е. вычисляется элементарно.


Интервальные экспертные оценки
С начала 80-х годов активно развивается интервальная математика, как наиболее практически важная часть е› - интервальная статистика. В разрабатываемом нами подходе основное внимание уделяется расчетам максимально возможного отклонения значения рассматриваемой статистики, вызванного погрешностями в исходных данных (т.н.нотны), и "рационального объема выборки", превышение которого не может привести к существенному повышению точности оценивания. Основные идеи и результаты статистики интервальных данных опубликованы в статьях.
Перспективным является использование интервальных экспертных оценок: эксперт называет не число, а интервал в качестве оценки рассматриваемого параметра. Такие процедуры удачно сочетают в себе количественный и качественный подходы в экспертных оценках. В качестве примера можно назвать процедуру регрессионного анализа, применяемую в экспертно-статистическом методе для получения коэффициентов весомости признаков, позволяющих наиболее точно восстановить глобальное заключение об объекте по результатам оценок отдельных параметров. Интервальность необходимо учитывать, если результаты оценок параметров экспертами, как и глобальные оценки, задаются интервалами, а не числами. Интервальные экспертные оценки - новое перспективное направление в области экспертных оценок, которое только начинает развиваться.
При использовании метода интервальных экспертных оценок вместо оценивания показателя или характеристики объекта числом эксперт указывает интервал, в котором он (или она) содержится. Во многих случаях оценивание интервалом более естественно для эксперта, чем оценивание числом. Например, капитану рыболовецкого сейнера естественнее указать квадрат морской поверхности (т.е. интервал по каждой координате), в котором вероятность хорошего улова, по его мнению, максимальна, чем указать точные координаты точки максимального улова. Интервальные экспертные оценки успешно использовались с целью увеличения улова сельди-иваси в Охотском море и атлантической сельди в Баренцевом море, соответствуюшая система поддержки принятия решений была разработана в Институте автоматики Дальневосточного отделения АН СССР
Другой пример связан с оцениванием качества продукции. Оценку показателя, да и глобальную оценку эксперту естественнее дать не в виде действительного числа, а в виде значения качественного признака - "отлично", "хорошо", "удовлетворительно" и т.д. При формализации каждый такой ответ целесообразно описывать интервалом. Например, оценка "отлично" описывается интервалом (0,8; 1,0), оценка "удовлетворительно" - интервалом (0,4; 0,6) и т.д. Этот подход можно сопоставить с использованием нечетких чисел в качестве ответов экспертов, поскольку интервалы - частные случаи нечетких множеств.



Заключение

В настоящее время все шире применяются различные методы экспертных оценок. Они незаменимы при решении сложных задач оценивания и выбора технических объектов, в том числе специального назначения, при анализе и прогнозировании ситуаций с большим числом значимых факторов - всюду, когда необходимо привлечение знаний, интуиции и опыта многих высококвалифицированных специалистов-экспертов.
Проведение экспертных исследований основано на использовании современных методов прикладной математической статистики, прежде всего статистики объектов нечисловой природы, и современной компьютерной техники. Наиболее продвинутые результаты в области экспертных оценок получены в СССР в 70-90-х годах в рамках комиссии "Экспертные оценки и нечисловая статистика" Научного Совета АН СССР по комплексной проблеме "Кибернетика".
Таким образом, важна конкретная (узкая) постановка задачи перед экспертами. Но такой постановки зачастую нет. А тогда "игры" по разработке обобщенного показателя качества не имеют объективного характера. В недавние времена они использовались для создания впечатления о высоком качестве отечественной продукции. Ведь западные машины не морозоустойчивые, не так ли? Значит, подбирая нужным образом коэффициенты в линейной функции от показателей качества, а именно, занижая те, по которым западные машины лучше (вес и др.) и завышая те, по которым лучше отечественные (морозоустойчивость), можно добиться поставленной цели. Почему-то рыночные отношения не считаются с подобными выводами. (С этим, правда, можно бороться, выбирая другие коэффициенты - те, что вытекают из реального сравнения изделий по конкурентоспособности).
















Литература
1. Орлов А.И. Допустимые средние в некоторых задачах экспертных оценок и агрегирования показателей качества. - В сб."Многомерный статистический анализ в социально-экономических исследованиях", М.: Наука, 1974, с.388-393.
2. Панкова Л.А., Петровский А.М., Шнейдерман М.В. Организация экспертиз и анализ экспертной информации. - М.:Наука, 1984. - 120 с.
3. Бешелев С.Д., Гурвич Ф.Г. Экспертные оценки. - М.: Наука, 1973. - 79 с.
4. Райхман Э.П., Азгальдов Г.Г. Экспертные методы в оценке качества товаров. - М.: Экономика, 1974. - 151 с.
5. Бурков В.Н. Большие системы: моделирование организационных механизмов. - М.: Наука, 1989. - 354 с.
6. Китаев Н.Н. Групповые экспертные оценки. - М.: Знание, 1975. - 64 с.
7. Ларичев О.И. Объективные модели и субъективные решения. - М.: Наука, 1987. - 143 с.
8. Моисеев Н.Н. Неформальные процедуры и автоматизация проектирования. - М.: Знание, 1979. - 64 с.
9. Моисеев Н.Н. Математические задачи системного анализа. - М.: Наука, 1981. - 487 с.
10. Статистические методы анализа экспертных оценок. - М.: Наука, 1977. - 384 с.
11. Экспертные оценки/Вопросы кибернетики. - Вып.58. - М.: Научный совет АН СССР по комплексной проблеме "Кибернетика", 1979. - 200 с.
12. Экспертные оценки в системных исследованиях/Сборник трудов. - Вып.4. - М.: ВНИИСИ, 1979. - 120 с.


















Приложение


Стандарт результативности по хирургическому профилю

Наименование показателей Интегр. балльная оценка Весовой коэффи-циент Нормативное значение Тен-ден-ция
Начальное Конечное
1 2 3 4 5 6
Общая послеоперационная летальность экстренных больных 8.60 0.1274 2.00 5.00 -
Расхождение клинического и патологоанатомического диагнозов 8.10 0.1197 4.00 7.00 -
Оперативная активность 7.90 0.1095 40.00 50.00 +
Средняя длительность лечения 6.70 0.0959 10.00 11.50 -
Количество операций на одну койку 6.22 0.0805 4.00 5.00 +
Повторная госпитализация 6.11 0.0792 5.00 7.00 -
Койко-день до операции у плановых больных 5.90 0.0668 1.50 3.00 -
Летальность 4.67 0.0509 1.30 4.80 -












Стандарт результативности по хирургическому профилю


Наименование показателей Интегр. балльная оценка Весовой коэффи-циент Нормативное значение Тен-ден-ция
Начальное Конечное
1 2 3 4 5 6
* Процент врачей первой и высшей категорий 10.00 0.1133 80.00 100.00 +
Общая послеоперационная летальность экстренных больных 8.60 0.0974 2.00 5.00 -
+ Расхождение клинического и патологоанатомического диагнозов 8.10 0.0917 3.00 5.00 -
* Процент операций II-IV категорий сложности 8.00 0.0906 70.00 75.00 +
+ Оперативная активность 7.90 0.0895 65.00 70.00 +
Средняя длительность лечения 6.70 0.0759 10.00 11.50 -
* Процент повторных операций на одного оперированного 6.43 0.0728 10.00 20.00 -
Количество операций на одну койку 6.22 0.0705 4.00 5.00 +
+ Повторная госпитализация (%) 6.11 0.0692 1.00 2.00 -
Койко-день до операции у плановых больных 5.90 0.0668 1.50 3.00 -
* Выполнение плана пролеченных больных 5.00 0.0566 95.00 100.00 +
Летальность 4.67 0.0529 1.30 4.80 -
* Досуточная летальность 4.67 0.0529 20.80 35.00 -



Так, на примере хирургической службы, показатели которой приведены на графике, видны периоды снижения уровня качества, что говорит об ужесточении стандарта. Дальнейшее увеличение уровня качества происходит за счет достижения поставленной руководителем цели по улучшению КМП.







Данные о файле

Размер 30.43 KB
Скачиваний 21

Скачать



* Все работы проверены антивирусом и отсортированы. Если работа плохо отображается на сайте, скачивайте архив. Требуется WinZip, WinRar