Документ взят из кэша поисковой машины. Адрес оригинального документа : http://geophys.geol.msu.ru/STUDY/4KURS/STAT/Stat_.htm
Дата изменения: Wed Oct 1 13:16:51 2003
Дата индексирования: Mon Oct 1 20:21:16 2012
Кодировка: Windows-1251
ОЦЕНКА ЗАКОНА РАСПРЕДЕЛЕНИЯ ГЕОФИЗИЧЕСКИХ ДАННЫХ,
ВЫЯВЛЕНИЕ ФОНОВЫХ И АНОМАЛЬНЫХ УЧАСТКОВ
ПО ДАННЫМ КОМПЛЕКСА МЕТОДОВ
Теоретические основы
    Закон распределения физической величины
    Выделение аномальных зон по комплексу методов
    Определение закона распределения величины
    Практические приемы определения закона распределения
Пример обнаружения мест рудопроявления по данным комплекса методов
Порядок выполнения работы

ТЕОРЕТИЧЕСКИЕ ОСНОВЫ

Закон распределения физической величины    [В начало]    [След. пункт]
Площадные и профильные геофизические наблюдения используют для выявления различных локальных объектов в разрезе. Объектам поиска соответствуют аномалии геофизических полей. Для определения понятия аномалии можно использовать вероятностный подход (чаще всего он применяется для слабодифференцированных полей). Совокупность данных на участке съемки рассматривается как выборка (набор значений) случайной величины. Под аномалией в этом случае понимается фрагмент участка съемки, на котором закономерно сосредоточены значения величины, маловероятные для данной выборки.
Случайная величина X, реализованная выборкой из N значений {x1, :, xN}, характеризуется законом (функцией) распределения вероятности Ф(x)=p| xi<x - вероятность того, что значение xi  меньше х. Эта величина монотонно возрастает от 0 при x R--?  до 1 при xR+-? . На практике также используется более удобная для визуального представления величина - плотность распределения вероятности p(x)=Ф/х = p| xi =x - вероятность того, что значение xi равно х. Важным свойством плотности распределения является соотношение 
Рассматривать физическую величину как случайную, вполне возможно, поскольку их значения становятся известными в результате измерений, которые неизбежно содержат некоторую неконтролируемую, то есть случайную погрешность. Кроме того (и это, может быть, более важно), при истолковании результатов собственно геофизических измерений пользуются модельными представлениями, заведомо упрощающими фактическое строение среды. Отклонения от модели являются неконтролируемыми (случайными) факторами.
Для физических величин одни значения более вероятны чем другие, причем обычно наиболее вероятное значение единственно, и ему соответствует единственный максимум плотности распределения. Такое наивероятнейшее значение случайной величины называется модальным или модой Мо. Чтобы определить, является ли данное значение аномальным (маловероятным), нужно оценить, насколько оно далеко от модального. В общем случае произвольного распределения вероятностей эта задача может быть сложна.
Для многих величин закон распределения хорошо приближается нормальным распределением со средним М и стандартным отклонением s - N(M,s) с плотностью  - распределением Гаусса.
Величина М (математическое ожидание) для нормально распределенной величины X, реализованной выборкой из N значений {x1, :, xN}, оценивается как их среднее арифметическое  и совпадает с модальным. Величина s2 (дисперсия), характеризующая вероятный разброс значений в выборке, оценивается как среднее значение квадрата отклонения значений величины X от их среднего: .
Для выборок нормально распределенной величины с большой дисперсией более достоверной оценкой наивероятнейшего значения может оказаться медиана Ме (p| xi <Ме = 0.5 - вероятность того, что значение xi меньше медианы равно 0.5). На практике за медиану принимают Ме=x(N-1)/2+1 при нечетном N или Ме=(xN/2+xN/2+1)/2 при четном N после упорядочения выборки по возрастанию или по убыванию.
Для больших выборок нормально распределенных величин мода, среднее арифметическое и медиана совпадают. Это свойство нормального закона распределения наряду с его большим распространением делает нормальный закон основным законом, применяемым в статистическом анализе (из-за удобства вычислений).
Стандартное отклонение s может служить мерой удаления данного значения нормально распределенной величины от наивероятнейшего. Для результатов площадной съемки по регулярной сети эмпирически установлено, что аномалию можно считать обнаруженной, если на двух или более соседних профилях в их соответствующих частях следует подряд по три или более точки, значения в которых выходят за пределы интервала (М-3s, М+3s) - минимально-аномальные пределы. Коротко говорят что 'аномалия выделяется по правилу 'трех сигм' двумя профилями, тремя точками'. В этом случае вероятность ошибочного выделения аномалии не превосходит 2%. Для минимально-аномальных пределов (М-2s, М+2s) вероятность такой ошибки составляет более 5%, а для (М-s, М+s) превышает 30%. Фрагменты участка, где значения величины лежат в пределах (М-s, М+s), относят к фоновым.
Нормальный закон распределения - не единственный, встречающийся у физических величин. В частности, для величин, используемых в электроразведке -удельного сопротивления, поляризуемости, кажущегося сопротивления, кажущейся поляризуемости и др. - характерен логнормальный закон распределения (по нормальному закону логарифмы значений). Этому же закону подчиняются значения магнитной восприимчивости пород. Для логнормально распределенных величин вместо среднего М и стандартного отклонения s вычисляют среднее значение логарифмов Мlog и стандартное отклонение логарифмов slog. Мlog и slogсуть логарифмы некоторых величин, поэтому при указании минимально-аномальных пределов в этом случае используется интервал (exp(Мlog-mslog), exp(Мlog+mslog)), то есть (Мгеом/em,em Мгеом), где Мгеом - среднее геометрическое значений , а e=exp(slog) - стандартный множитель (аналог стандартного отклонения).
[В начало пункта]
 
Выделение аномальных зон по комплексу методов    [В начало]    [След. пункт]    [Предыд. пункт]
Довольно часто набор данных таков, что по нему невозможно четко выделить аномалии по правилу 'трех сигм'. Если на участке работ имеются данные по нескольким геофизическим методам, совместные анализ слабых аномалий разных методов может повысить достоверность выводов (прежде чем делать такое сопоставление, данные разных методов следует свести к единой сети наблюдения). Поскольку данные разных методов имеют различные размерности и масштабы (диапазоны изменения) величин, перед сопоставлением их следует представить в безразмерном виде и в едином масштабе величин.

Для данных, отвечающих нормальному закону распределения N(M, s), это делается с помощью процедуры нормализации (стандартизации) - приведение к закону N(0,1). Для каждого набора данных {x1, :, xN} вычисляются его среднее значение М и стандартное отклонение s, после чего вычисляют нормализованные (стандартизованные) значения {, :, }:  (предполагается, что для всех методов наборы данных упорядочены одинаково). Для логнормально распределенных величин та же процедура производится с их логарифмами. Так для каждого метода получают набор данных, отвечающий закону распределения N(0,1); такие наборы безразмерных величин с одинаковым законом распределения можно сопоставлять количественно.

Стандартизованное значение величины - отклонение от среднего, выраженное в стандартных отклонениях - выражает ее удаление от среднего, то есть позволяет судить о наличии аномалии в точке, где эта величина измерена. Изолиния стандартизованной величины по уровню b>0 оконтуривает положительную (а по уровню -b - отрицательную) аномалию при минимально-аномальных пределах (М-bs, М+bs). Наличие в одной области участка работ слабых аномалий по разным методам позволяет с уверенностью говорить о наличии в этой области объекта, порождающего такое сочетание аномалий. Для количественной характеристики аномальности точки с учетом представлений о природе объекта поиска по комплексу из К методов, давших одинаково упорядоченные наборы данных {x11, :, x1N}, :, {xК1, :, xКN}, введена функция кОмплексного показателя (ФКП) .

Веса qj вводятся интерпретатором для выражения представлений (априорной информации) о том, какими аномалиями должен выражаться объект поиска в полях методов, входящих в примененный комплекс. В простейшем случае веса берут равными по модулю, а знак веса - соответствующим ожидаемому знаку аномалии. В таком случае максимумы ФКП соответствуют местам наиболее вероятного положения объекта.
[В начало пункта]

Определение закона распределения величины    [В начало]    [След. пункт]    [Предыд. пункт]

Прежде чем применять правила выделения аномалий, сформулированные для того или иного закона распределения, к конкретному набору данных, следует удостовериться, что набор данных действительно имеет именно этот закон распределения.
Имеется ряд критериев, позволяющих установить совпадение или несовпадение законов распределения двух выборок. Все они основаны на сравнении значений функции распределения. Сравнение выборок по критерию состоит в вычислении некоторой величины (критерия) по значениям сравниваемых функций распределения и в сопоставлении вычисленной величины с критическим значением критерия. Если значение критерия превосходит критическое, законы распределения выборок не совпадают. Критические значения для каждого критерия, зависящие от количества значений в выборках, требуемой достоверности сравнения и других факторов, установлены отдельными статистическими исследованиями и определяются по таблицам или вычисляются по формулам. Известно много критериев сравнения законов распределения выборок, в частности критерий c2 (среднеквадратическое отклонение функций распределения выборок), критерий Колмогорова - Смирнова (максимальное отклонение функций распределения выборок) и ряд иных. Если в качестве одной из функций распределения для вычисления критерия взять теоретическую функцию распределения для того или иного закона, устанавливается совпадение закона распределения выборки с этим теоретическим законом распределения.
Чтобы установить закон распределения для данной выборки, следует:
1) вычислить значения функции распределения для выборки в ряде точек;
2) предположить, что выборка имеет тот или иной теоретический закон распределения, вычислить значения функции распределения для выбранного закона в тех точках, в которых вычислена функции распределения для выборки;
3) выбрать критерий для сравнения законов, вычислить его значение;
4) определить критическое значение выбранного критерия, сравнить его в вычисленным значением критерия;
5) принять решение о совпадении/несовпадении закона распределения выборки и выбранного теоретического закона распределения.
[В начало пункта]

Практические приемы определения закона распределения    [В начало]    [Предыд. пункт]

Определение закона распределения выборки начинается с визуального анализа графика плотности распределения (вариограммы) выборки. Для построения графика диапазон изменения значений выборки разбивают на несколько (А) равных интервалов ширины Dх=(xmax - xmin)/A, xmin и xmax- соответственно минимальное и максимальное значения в выборке {x1, :, xN}. За количество интервалов А принимают величину . Если нужно сократить количество интервалов, можно воспользоваться графиком-номограммой, предложенной Е. М. Квятковским.
Далее для каждого интервала подсчитывается nj  - количество значений, в него попадающих (количество значений, удовлетворяющих соотношению xmin+(j-1)Dх?xi<xmin+jDх, 1?j?A; nА после подсчета увеличивают на 1), а затем вычисляют для каждого интервала долю значений, попавших в него, от общего числа значений в выборке (частость): pj= nj /N.
Величина pj является вероятностью (по определению последней) того, что значение из выборки находится в j-ом интервале; ее относят к середине этого интервала xmin+(j - 0.5)Dх. Далее в координатах р(х) строится гистограмма или график частости; они аппроксимируют график плотности распределения выборки.
Наряду с вариограммой выборки обычно строится график накопленных частостей (ГНЧ). Накопленные частости вычисляют как , значения jj относят к левым границам интервалов xmin+jDх. ГНЧ выборки, очевидно, приближает функцию распределения для выборки.
 
По форме вариограммы делаются предположения от законах распределения, которым могут подчиняются значения выборки. Если вариограмма имеет единственный выраженный максимум и примерно симметрична, всегда предполагают нормальный закон распределения (как весьма распространенный). Кроме того, при выдвижении гипотезы о законе распределения также учитываются априорные сведения о законах распределения характерных для рассматриваемой физической величины. В частности, для данных электроразведки обязательно рассматривается возможность логнормального распределения.
Простейшим качественным способом проверки на соответствие выборки нормальному закону является построение функции распределения выборки на вероятностном бланке. На вероятностном бланке изображена прямоугольная система координат, у которой масштаб по оси ординат искажен (меняется) так, что график функции нормального распределения прямолинеен. На вероятностном бланке строят ГНЧ для выборки. Если построенный ГНЧ хорошо аппроксимируется прямой, считают, что значения в выборке распределены по нормальному закону. Такая проверка на соответствие нормальному закону называется проверкой по критерию Анри.
Для выборок малого размера (десятки и первые сотни значений) надежен двусторонний критерий Колмогорова-Смирнова (КС-критерий). Для двух выборок {x11, :, x1N}, {x21, :, x2N} его значение определяется соотношением , j1j, j2j - накопленные частости для рассматриваемых выборок. Критические значения КС-критерия для выборок из более чем 40 значений при заданной вероятности ошибочного решения 5% оценивают по формуле  (при D, выраженном в процентах). Если значение КС-критерия не превышает критического, законы распределения выборок считаются совпадающими.
Чтобы установить совпадение закона распределения выборки с нормальным законом, за один из наборов накопленных частостей следует принять значения нормального распределения N(M, s) на концах интервалов, использованных при вычислении накопленных частостей выборки. Значения M и s формально вычисляются по значениям выборки соответственно как среднее арифметическое и стандартное отклонение. Кроме этого, значение D можно снять с ГНЧ выборки на вероятностном бланке, как наибольшее расстояние (вдоль оси ординат) между ГНЧ и аппроксимирующей его прямой.
Для установления совпадения закона распределения выборки с логнормальным законом такие же действия проводятся с логарифмами значений.
Многие статистические процедуры автоматизированы в прикладных программах. График на вероятностном бланке можно построить в программе Golden Software Grapher. Построение вариограмм (гистограмм) и ГНЧ, вычисление значений различных функций распределения и ряд других операций реализованы в наборе статистических процедур электронных таблиц Microsoft Excel. Имеется также ряд специализированных пакетов статистической обработки данных.
[В начало пункта]

ПРИМЕР ОБНАРУЖЕНИЯ МЕСТ РУДОПРОЯВЛЕНИЯ ПО ДАННЫМ КОМПЛЕКСА МЕТОДОВ    [В начало]    [След. раздел]    [Предыд. раздел]

Для обнаружения потенциальных мест рудопроявлений полиметаллических руд на участке размером 40 х 190 по сети 10 х 10 (координаты 'профиль-пикет') выполнены профилирование методом вызванной поляризации по способу СГ и съемка вертикальной компоненты магнитного поля. Результаты работ представлены в виде карт кажущейся поляризуемости, кажущегося сопротивления, и вертикальной компоненты аномального магнитного поля. Выраженных аномалий, характерных для объектов поиска, на картах не отмечается.
Для комплексной интерпретации данных принято решение рассчитать функцию комплексного показателя, исходя из того, что над объектами поиска должны наблюдаться положительные аномалии ВП и магнитного поля и отрицательные аномалии кажущегося сопротивления.
Для выбора параметров, по которым рассчитывается ФКП, определены законы распределения наборов данных. Форма вариограмм величин (один выраженный максимум плотности распределения вероятности) позволяет предположить, что они могут отвечать нормальному закону распределения. Асимметричность вариограмм кажущегося сопротивления и кажущейся поляризуемости и бОльшая симметричность вариограмм логарифмов этих величин, наряду с практикой, которая показывает, что для данных электроразведки характерен логнормальный закон распределения, позволяют также предположить возможность логнормального распределения кажущегося сопротивления и кажущейся поляризуемости.
На вероятностном бланке ГНЧ логарифмов кажущихся сопротивления и поляризуемости, а также данных магниторазведки хорошо приближаются прямой линией. ГНЧ кажущихся сопротивления и поляризуемости значительно отклоняются от прямой. По критерию Анри это значит, что логарифмы кажущихся сопротивления и поляризуемости, а также данные магниторазведки, вероятно, подчиняются нормальному закону распределения, то есть для кажущихся сопротивления и поляризуемости выполняется логнормальный закон распределения, а для данных магниторазведки - нормальный.
Полевые материалы [В начало пункта] Гистограммы и графики накопленных частостей  [В начало пункта]

Для уточнения вывода о законах распределения гипотезы о соответствии законов распределения кажущихся поляризуемости и сопротивления, их логарифмов и аномального магнитного поля нормальному закону проверены с использованием КС-критерия. На границах интервалов ГНЧ каждой величины вычислены значения нормального распределения для соответствующих среднего арифметического и стандартного отклонения. Установленные далее значения КС-критерия сопоставлены с его критическим значением для выборки данного размера (100 значений) при вероятности ошибки 5%. Значение КС-критерия для кажущейся поляризуемости практически совпадает с критическим и близко к последнему для кажущегося сопротивления. Для логарифмов кажущихся сопротивления и поляризуемости, а также данных магниторазведки значения КС-критерия в 3-4 раза меньше критического. Значения КС-критерия для логарифмов кажущихся сопротивления и поляризуемости также в 3-4 раза меньше, чем для самих кажущихся сопротивления и поляризуемости.

Таким образом, для кажущихся сопротивления и поляризуемости следует принять гипотезу о логнормальном законе распределения, а для данных магниторазведки - о нормальном. Фоновые значения полей приведены в таблице.
 
hк,
%
rк,
Омћм
DZa,
нТл
Закон распредeления
логнорм
логнорм
норм
Наивероятнейшее значение.
0.84
93
-0.5
Стандартное отклонение/множитель
1.52
1.84
6.9
Минимальное фоновое значение.
0.55
51
-7.3
Максимальное фоновое значение.
1.28
172
6.4
Исходя из этого, для расчета ФКП используются логарифмы значений кажущихся сопротивления и поляризуемости и значения вертикальной компоненты аномального магнитного поля. Исходя из представлений о природе аномалий используемых полей над объектом поиска, для весов магнитного поля и логарифма кажущейся поляризуемости принят знак '+', а для логарифма кажущегося сопротивления - знак '-'. По абсолютной величине веса приняты равными, так как нет оснований считать различной достоверность значений, полученных разными методами.
Карты стандартизованных величин [к месту вызова] Прогноз мест рудопроявления по функции комплексного показателя [к месту вызова]
 
Сопоставление карт стандартизованных значений величин, выбранных для расчета ФКП показывает, что аномалий, выделяемых по правилу 'трех сигм' не наблюдается. На ПК40-100 ПР0-20 отмечаются слабые положительные аномалии кажущейся поляризуемости и магнитного поля и слабые отрицательные аномалии кажущегося сопротивления, то есть отмечается набор признаков, характерный для объекта поиска. На карте ФКП максимум отмечается на ПК50-90 ПР10. Этот участок является наиболее вероятным местом рудопроявления.
[В начало раздела]
 
ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ    [В начало]    [Предыд. раздел]
Задание
Для обнаружения потенциальных мест рудопроявлений полиметалличес-ких руд на участке размером 40 х 190 по сети 10 х 10 (координаты 'профиль-пикет') выполнены: профилирование методом вызванной поляризации по способу СГ и съемка вертикальной компоненты магнитного поля. Координаты точек наблюдения и измеренные значения приведены в предложенном варианте. Над объектами поиска предполагаются положительные аномалии ВП и магнитного поля и отрицательные аномалии кажущегося сопротивления.
По предложенным данным:
построить карты измеренных полей (точность съемки ВП считать 5%, точность магнитной съемки - 2 нТл), оценить наличие целевых аномалий в полевых данных;
установить законы распределения измеренных величин, используя визуальный анализ вариограмм, критерий Анри и критерий Колмогорова - Смирнова для вероятности ошибки 5% (проверку производить на нормальный и логнормальный закон);
выбрать параметры для расчета ФКП);
стандартизовать выбранные параметры, построить совмещенные карты целевых аномалий;
простейшим образом выбрать веса для расчета ФКП, рассчитать ФКП, построить карту целевых аномалий ФКП;
установить вероятные места рудопроялений на участке.
Отчетный материал
Графика - карты измеренных полей, вариограммы и ГНЧ, использованные для установления законов распределения, совмещенные карты целевых аномалий, карта целевых аномалий ФКП.
Таблица результатов установления законов распределения и фоновых значений полей.
Пояснительная записка.
Образцы оформления графики и таблиц и содержания пояснительной записки приведены в разделе 'Пример обнаружения мест рудопроявления по данным комплекса методов'.
[В начало раздела]