Определение параметров нормального распределения

Автор темы kavasaky 
ОбъявленияПоследний пост
ОбъявлениеРаботодателям и кадровым агентствам: Размещение вакансий и рекламы в форуме26.03.2008 03:07
ОбъявлениеРекомендации по использованию теха в нашем форуме15.04.2017 21:40
ОбъявлениеПравила и принципы форума «Высшая математика»28.10.2009 15:17
07.02.2019 09:52
Определение параметров нормального распределения
Добрый всем день!

Меня давно смущал вопрос о правильном сочетании статистических и приборных отклонений. В конечном счёте я сформулировал его так.
Есть некоторая измеряемая величина $t$, которая предполагается случайной, имеющей гауссово распределение $Г_t(\mu_t, \sigma_t)$.
Поскольку величина сама по себе случайная, то наша задача заключается в определении её распределения - т.е. параметров $\mu_t$ и $\sigma_t$.
Для этого проводится серия измерений и получается ряд значений $n_i$. Беда в том, что прибор у нас тоже не идеальный, а потому даёт собственные случайные добавки (допустим, гауссовы).
Запишем всё символьно:
$t~Г_t(\mu_t, \sigma_t), g~Г_g(0, \sigma_g)$
$n_i = t_i + g_i \Rightarrow t ~ Г_n(\mu_t, \sigma_n), \sigma_n^2 = \sigma_t^2 + \sigma_g^2$
$\mu_t, \sigma_t-?$
Лучшей оценкой для матожидания (срднего значения) $\mu_t$ является среднее арифметическое по экспериментальной выборке $\mu_t^{exp} =( \sum_{i=1}^{N} n_i )/N$.
Лучшей несмещённой оценкой для среднеквадратичного отклонения (СКО) (корня из дисперсии) $\sigma_n$ является определённое по экспериментальной выборке значение $\sigma_n^{exp} =\sqrt {\frac{\sum_{i=1}^{N} \left(n_i - \mu_t^{exp}\right)^2}{N-1}} $.
Вопрос №1. Теперь, зная приборную погрешность (т.е. $\sigma_g$) и имея оценку $\sigma_n^{exp}$, можно ли оценить искомый параметр $\sigma_t$ по экспериментально определённым величинам согласно выражению $\sigma_t^{exp} = \sqrt {(\sigma_n^{exp})^2 - (\sigma_g)^2}$?
Понятно при этом, что от выборки к выборке вычисленные значения $\mu_t^{exp}$ и $\sigma_n^{exp}$ будут варьироваться. Для $\mu_t^{exp}$ эти вариации характеризуются величиной среднеквадратичного отклонения среднего (СКОС) $\sigma_{\mu}^{exp} = \sigma_n^{exp}/\sqrt{N}$. Т.е. $(\sigma_{\mu}^{exp})^2$ - оценка по данной экспериментальной выборке дисперсии $(\sigma_{\mu})^2$ для величины $\mu_t^{exp}$, определяемой по множеству таких выборок. В конечном счёте это позволяет нам написать, что искомый параметр $\mu_t$ определён по данной экспериментальной выборке равным $\mu_t^{exp}$ с точностью, характеризуемой величиной $\sigma_{\mu}^{exp}$, являющейся корнем из дисперсии.
Вопрос №2. Второй искомый параметр распределения $\sigma_t$ был определён по данной экспериментальной выборке равным $\sigma_t^{exp}$ - а чем характеризуется точность определения этого второго параметра?
Вопрос №3. А как быть в том случае, если приборная погрешность в каждом измерении известна, но различна - т.е. для каждого измеренного значения $n_i$ случайная приборная добавка $g_i$ определялась по распределению с собственным значением дисперсии $Г_{g_i}(0, \sigma_{g_i})$? Это вполне возможно, если приборная погрешность, например, различна в различных измерительных интервалах. Другой пример - объединение нескольких линеек измерений, проведённых приборами с различной погрешностью. Моё предложение - вычислять средние значения с весами, обратно пропорциональными приборным погрешностям. Но правильно ли это?
Вопрос №4. Модель $t~Г_t(\mu_t, \sigma_t), g~Г_g(0, \sigma_g)$ призвана раздельно учесть влияние известной приборной погрешности и прочих неизвестных случайных факторов. При этом целью измерений является определение собственно значения величины $t$. Среднее её значение мы определили из экспериментальных данных, как $\mu_t^{exp}$. Я правильно понимаю, что погрешность определения этой величины характеризуется величиной СКОС $\sigma_{\mu}^{exp}$ (которую для вычисления уже именно погрешности надлежит умножить на коэффициент Стьюдента $S_{\alpha,N}$) именно потому, что она подразумевает учёт как приборной погрешности $\sigma_g$, так и случайной $\sigma_t$? Т.е. погрешность $Δt = S_{\alpha,N}\sigma_{\mu}^{exp}$. Для чего же тогда в методичках всяких часто пишут про отдельный расчёт случайной погрешности через умножение СКОС на коэффициент Стьюдента, определение приборной погрешности, а затем общую погрешность рассчитывают как корень из суммы квадратов? Т.е. согласно методичкам погрешность $Δt = \sqrt{(S_{\alpha,N}\sigma_{\mu}^{exp})^2 + (A)^2}$, где можно соотнести приборную погрешность с используемыми выше обозначениями, например, так $ A = 3\sigma_g}$. Мне кажется, что такой вариант из методичек не вполне правильный. Характеризующий приборную погрешность параметр $\sigma_g$ уже учтён при вычислении $\sigma_{\mu}^{exp}$. А по "формуле из методичек" мы его ещё раз учитываем.



Редактировалось 2 раз(а). Последний 07.02.2019 10:08.
07.02.2019 12:25
Не все ответы
Отвечу с ходу сам себе на Вопрос 1 и 4.
Рассуждения мои не вполне верные. И вот грубые, но паказательные, рассуждения.

Когда мы плохим прибором мерим и записываем цифру "3", подразумеваются значения от 2,5 до 3,5. Поэтому одно дело - статистическое - для ряда значений 3-5-7 среднее - 5, среднеквадратичное отклонение (СКО) - 2, а среднеквадратичное отклонение среднего (СКОС) - 1,15. Другое дело, что это не 3, не 5 и не 7, а "интервалы" [2.5-3.5], [4.5-5.5], [6.5-7.5]. Среднее по "интервалам" значение, конечно, остаётся тем же - 5. Но всё таки погрешность среднего для интервалов - совсем другая. Так что всё верно в методичках пишут. Общая погрешность определения среднего действительно должна рассчитываться, как $Δt = \sqrt{(S_{\alpha,N}\sigma_{\mu}^{exp})^2 + (A)^2}$.

Вопрос 2 переформулирую так.
Когда мы ходим определить среднее (С), то в итоге получается так: $С = С_{exp} \pm S_{\alpha,N}СКОС_{exp}$ - так определяется параметр распределения - матожидание - и его погрешность.
У нас есть формула для определения среднеквадратичного (СКО) значения по экспериментальным данным, которое соответствует дисперсии распределения случайной величины. По аналогии со средним, необходимо бы найти среднеквадратичное отклонение среднеквадратичного отклонения (СКОСКО), которое бы характеризовало погрешность определения СКО по экспериментальным данным, а также некий новый коэффициент, аналогичный коэффициенту Стьюдента: $СКО = СКО_{exp} \pm A_{\alpha,N}СКОСКО_{exp}$.
Как рассчитать СКОСКО из экспериментальных данных и что это за новый коэффициент $A_{\alpha,N}$?
В более широком смысле это относится к моментам распределения. Лучшей оценкой любого момента случайного распределения является вычисления его аналога по экспериментальным данным. А как же вычисляется точность вычисления этих моментов по экспериментальным данным?

Вопрос 3 актуальности не потерял - как быть в случае с разноточными измерениями?



Редактировалось 3 раз(а). Последний 07.02.2019 12:37.
07.02.2019 13:46
Продолжение
Раздаточные измерения подвержены определению... которое Вы не дали.... Раздатка работает на сопряжении 1 в 1...
Точечность распределения чисел - это открытая задача... пока не возможно вот так без постановки задачи определить, что Вы хотите... (1-7-17-1) подойдёт.... - Вы скажете - нет..
07.02.2019 13:57
Я физик...
... и привык к более простым словам. Вообще вас не понял )
07.02.2019 15:32
Продолжение
Вы не понимаете меня, потому что у Вас не хватает образования... Вы занимаетесь вопросами, которые давно пройдены в математическом образовании... Вы хоть понимаете с кем Вы связались ..Ваши 2,3 и 3,5 - это начало ряда простых чисел, который ничего пока не означает... дайте системно ряд обозначений своих действий?
07.02.2019 16:24
Э...
Я вообще не о простых числах спрашиваю. Я о погрешностях говорю.
07.02.2019 16:53
Продолжение
Цитата
kavasaky
Я вообще не о простых числах спрашиваю. Я о погрешностях говорю.
А тогда о чём речь? Вам кто нибудь сказал, что у простых чисел существует погрешность?



Редактировалось 1 раз(а). Последний 08.02.2019 10:14.
08.02.2019 09:28
kavasaky, не удивляйтесь.
Вам отвечает либо отлаживаемый на форуме чат-бот, имитирующий шизофрению и предназначенный для продажи на кафедры психиатрии мед.вузов, либо реальный псих artefact. В последние несколько месяцев данный форум захвачен психами или чат-ботами, имитирующими психические расстройства. Так что сохранившие рассудок участники стараются здесь не появляться.
08.02.2019 10:04
У вас профессиональная деформация...
Давайте я ещё раз опишу о чём речь.

Дано:

Случайная величина $t$ с гауссовым распределением $Г_t(\mu_t, \sigma_t)$ с неизвестными параметрами.
Ряд экспериментальных значений этой величины $n_i, i=1,2,...,N$.

Задача:
Определить параметры гауссова распределения случайной величины $\mu_t$ и $\sigma_t$.

В кратце - матожидание рассчитывается как среднее арифметическое (С), а $\sigma_t$ - корень из дисперсии - как среднеквадратичное отклонение (СКО).
Статистическая точность определения матожидания опирается на среднеквадратичное отклонение среднего (СКОС) $СКОС = СКО/\sqrt{N}$. Погрешность для матожидания записывается с поправкой в виде коэффициента Стьюдента. В итоге: $\mu_t = С\pmS_{\alpha,N}СКОС$.

А вот как определяется статистическая точность $\sigma_t$? По аналогии с матожиданием, нужно бы вычислить среднеквадратичное отклонение среднеквадратичного отклонения (СКОСКО). По какой формуле? А чтобу непосредственно рассчитать погрешность нужен также какой-нибудь множитель в духе коэффициента Стьюдента, но какой? В итоге должно получиться так: $\sigma_t = СКО\pmA_{\alpha,N}СКОСКО$. Так вот: как рассчитать СКОСКО и что из себя представлять и как вычисляется $A_{\alpha,N}$?

Другой вопрос - сочетание этих статистических вопросов с ограниченной точностью измерения. Как на погрешность $\mu_t$ и $\sigma_t$ влияет погрешность измерений, особенно в том случае, когда значения ряда $n_i, i=1,2,...,N$ измерены с различной погрешностью?

Как вы в этом всём увидели простые числа - для меня загадка... Последовательность 3-5-7 тригернула? Ну извиняйте, кроме неё там много чего ещё понаписано, а конкретные значения взяты "с потолка" для примера.
08.02.2019 10:47
Продолжение
Цитата
brukvalub
Вам отвечает либо отлаживаемый на форуме чат-бот, имитирующий шизофрению и предназначенный для продажи на кафедры психиатрии мед.вузов, либо реальный псих artefact. В последние несколько месяцев данный форум захвачен психами или чат-ботами, имитирующими психические расстройства. Так что сохранившие рассудок участники стараются здесь не появляться.
Имитирую шизофрению. Чат-бот у меня пока в коробочке спит.
Вы сознались, что не принадлежите к числу сохранивших рассудок участников.
Что Вы можете сказать о распределении Гаусса? И какая погрешность рассчитывается через о-малое в предложенном автором темы вопросе?
Какое значение полуширины гауссианы (графический колокол с дифференциальными лепестками) учитывается в приведение погрешности в физическом эксперименте при дифференциальном сглаживании шумовых лепестков для получения правильной полуширины графика по распределению Гаусса?
08.02.2019 11:39
Про него понял
А у вас нет ли ответов на мои вопросы? Как рассчитывать среднеквадратичное отклонение среднеквадратичного отклонения? И с каким коэффициентом типа Стьюдента (а может и со Стьюдентом?) оно должно учитываться для вычисления погрешности?
08.02.2019 12:18
Продолжение
Хороший вопрос.
Распределение Стьюдента сопрягается с уравнением Бесселя (методы математической физики). На мой не проверенный взгляд - коэффициент Бесселя даёт иррациональный коэффициент.... нормальное распределение не получается... чтобы связать нормальное распределение с другими распределениями - нужны гиперболические функции... а зачем Вам это надо?
08.02.2019 12:45
Продолжение
По поводу среднеквадратичного отклонения.
Решает МНК (метод наименьших квадратов)... разбрасываете точки измерения и строите параболу... ещё раз хочу спросить - зачем Вам это надо?
Если Вам это надо по серьёзному, то проблема состоит в следующем - Вы не видите, что погрешность тут не причём...
08.02.2019 14:07
При чём тут МНК?
Когда у меня есть только экспериментальная выборка конкретных значений, то прежде, чем использовать МНК, надо построить то, на что натягивать гауссов колокол. Т.е. гистаграмму построить. Но это всё уже совсем другая история. Тут задача иначе стоит.

Есть непрерывная случайная величина с гауссовым распределением и дискретный ограниченный ряд её конкретных экспериментальных реализаций. Как по этому конкретному дискретному ограниченному ряду определить параметры распределения непрерывной случайной величины и на сколько хорошо это можно сделать?

Повторюсь, матожидание оценивается как среднее арифметическое С. Далее рассчитывается среднеквадратичное отклонение среднего - СКОС. После чего задаётся некоторый уровень доверительной вероятности для расчёта коэффициента Стьюдента и записывают так: $\mu = С\pmS_{\alpha,N}СКОС$. Смысл всё это имеет примерно следующий - по данной выборке N значений можно сказать, что матожидание можно оценить как C, а его истинное значение с вероятностью $100-\alpha%$ лежит в пределах $\pmS_{\alpha,N}СКОС$. Иначе говоря, так указывается интервал, в который будут попадать с заданным уровнем вероятности средние значения таких выборок N значений этой случайной величины.

Корень из дисперсии - $\sigma$ - оценивает по выборке как СКО. А как задать тот диапазон, соответствующий задаваемому уровню доверительной вероятности, в котором лежит истинное значение $\sigma$?
08.02.2019 15:22
Продолжение
Понял Вас... оставим гауссиану -отвлекает...
Если, как Вы спросили - надо сделать опыт, то на мой плохой взгляд - подходит распределение Маклорена... посмотрите...
08.02.2019 22:53
kavasaky
Цитата
kavasaky
В кратце - матожидание рассчитывается как среднее арифметическое (С), а $\sigma_t$ - корень из дисперсии - как среднеквадратичное отклонение (СКО).
Статистическая точность определения матожидания опирается на среднеквадратичное отклонение среднего (СКОС) $СКОС = СКО/\sqrt{N}$. Погрешность для матожидания записывается с поправкой в виде коэффициента Стьюдента. В итоге: $\mu_t = С\pmS_{\alpha,N}СКОС$.

А вот как определяется статистическая точность $\sigma_t$? По аналогии с матожиданием, нужно бы вычислить среднеквадратичное отклонение среднеквадратичного отклонения (СКОСКО). По какой формуле? А чтобу непосредственно рассчитать погрешность нужен также какой-нибудь множитель в духе коэффициента Стьюдента, но какой? В итоге должно получиться так: $\sigma_t = СКО\pmA_{\alpha,N}СКОСКО$. Так вот: как рассчитать СКОСКО и что из себя представлять и как вычисляется $A_{\alpha,N}$?

Доверительный интервал для дисперсии находится через квантили распределения хи-квадрат.
09.02.2019 04:31
Первый вразумительный ответ!
А нельзя ли подробнее? Или ссылку, где показано как через распределение хи-квадрат рассчитывать доверительный интервал для дисперсии?
09.02.2019 06:59
Вот так, например
В поисковике вбивается: "доверительный интервал для дисперсии" и берётся первая ссылка:

https://ru.wikipedia.org/wiki/%D0%94%D0%BE%D0%B2%D0%B5%D1%80%D0%B8%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D1%80%D0%B2%D0%B0%D0%BB_%D0%B4%D0%BB%D1%8F_%D0%B4%D0%B8%D1%81%D0%BF%D0%B5%D1%80%D1%81%D0%B8%D0%B8_%D0%BD%D0%BE%D1%80%D0%BC%D0%B0%D0%BB%D1%8C%D0%BD%D0%BE%D0%B9_%D0%B2%D1%8B%D0%B1%D0%BE%D1%80%D0%BA%D0%B8
09.02.2019 07:27
Присвятой Интернет!
Извините, только зарегистрированные пользователи могут публиковать сообщения в этом форуме.

Кликните здесь, чтобы войти