Всем известно понятие "среднее арифметическое". Формула для его вычисления проста и очевидна. Но не все знают о среднем арифметическом тот факт, что оно является приближением в смысле наименьших квадратов.

Что это значит? Возьмем группу из n чисел Y[i], где i=1..n, и попытаемся найти такое число A, что сумма квадратов разностей каждого числа (Y[i]-A)^2 будет минимальной.

Сначала запишем эту сумму квадратов разностей в виде функции: D(A)=sum((Y[i]-A)^2). Нас интересует такое число A, при котором функция D(A) имеет минимум. Для этого ее надо продифференцировать и приравнять производную к нулю. Производная равна:
D'(A) = -2*sum(Y[i]-A)
Приравняем ее к нулю и получим:
sum(Y[i]-A) = 0
sum(Y[i]) = sum(A)
sum(Y[i]) = n*A
A = sum(Y[i])/n
В результате получается, что число A равно сумме чисел Y[i], деленной на количество этих чисел n. То есть A является средним арифметическим этих чисел. Именно и только при таком значении A сумма квадратов разностей этих чисел и A является минимальной.

Не слишком очевидно, не правда ли?

Попытаемся найти другое число B, при котором минимизируется не сумма квадратов отклонений Y[i] от B, а сумма абсолютных величин этих отклонений (сумма модулей). Получится похожая формула:
D(B) = sum(abs(Y[i]-B))
Продифференцируем ее. Производная от модуля abs(x) равна x/abs(x), так что получится:
D'(B) = -sum((Y[i]-B)/abs(Y[i]-B))
Это выражение уже невозможно так просто преобразовать, чтобы найти B, однако заметим, что x/abs(x) = sgn(x), функция знака. Если x>0, то sgn(x)=1, если x<0, то sgn(x)=-1, а при x=0 sgn(x)=0. Поэтому получается уравнение:
sum(sgn(Y[i]-B))=0
sgn(Y[i]-B) является как бы логической величиной, которая определяет, какое из чисел больше: Y[i] или B. Неважно даже, насколько одно из чисел больше других.
Если равняется нулю сумма чисел, каждое из которых может быть равно -1 либо 1, либо 0, то получается, что количество единиц в этой сумме должно быть равно количеству минус единиц в ней. Количество нулей может быть любым. Однако нули получаются только тогда, когда Y[i]=B. Если среди Y[i] нет равных, то такой нуль в сумме может быть только один. А количество чисел Y[i], которые больше B и которые меньше B, во всем множестве Y[i] должно быть равным.

Но вышесказанное является определением известной статистической меры, которая называется медианой. Определение можно посмотреть в Википедии: http://ru.wikipedia.org/wiki/%D0%9C...B8%D0%BA%D0%B0)

Поэтому величиной B, для которой сумма модулей ее разности с числами рассматриваемого множества Y[i] минимальна, является медиана этого множества чисел.

Любопытно, что хоть в исходной задаче и фигурирует некая разность, но для получения ответа численное значение этой разности не играет никакой роли, а играет роль только количество чисел Y[i], больших либо меньших B.

  • Чому конституція Пилипа Орлика 1710 р. НЕ Є першою і останньою конституцією України???

  • Ваш комментарий


    Вы должны войти в систему, чтобы оставить комментарий.