Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Коэффициент линейной корреляции R выдачи и релевантности документов представляет собой корреляционный момент двух случайных величин:
С – «быть выданным документом» (формально релевантным с точки зрения системы);
И – «быть релевантным» (истинно релевантным с точки зрения пользователя).
Каждая из велечин может иметь значения 0 и 1 в зависимости от конкретного документа.
Математические ожидания С и И:
M [C] = P(C=1) = | a + b | ; M[И] = | a + c |
a + b + с + d | a + b + с + d |
Дисперсии определяются:
σ²с = | (a + b) · (с + d) | ;σ²и = | (a + c) · (b + d) | ;covси = M[C x И] – M[C] x M[И]= | ad – bc |
(a + b + с + d) ² | (a + b + с + d) ² | (a + b + с + d) ² |
Окончательно:
R = | COVси | = | ad - bc |
√σ²с σ²и | √ (a + b)(a + c)(b + d)(c + d) |
В различных точках координат <n,x> значения (знаки) R следующие:
R(0) = 0, R(p 0) = 0, R(И) = +1, R(Д) = -1, R(1) > 0, R(2) > 0, R(3) < 0
R = 0 повсюду на линии 0 – p0
Для этого достаточно показать, что: ad – bc = n0(x - n p 0)
На линии 0 p 0 справедливо: x = n·(X0/ n0) = n p 0 => ad – bc = 0
Обозначая: |L ∩ L© | = L, |Lи| = Lи, |Lc| = Lc, |L0| = L0
Перепишем R в координатах <L>:
R = | LL0 – LиLc |
√LиLc(L0 – Lи)(L0 – Lc) |
Дата публикования: 2015-01-26; Прочитано: 191 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!