Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Описание языка запросов



В описанных в лабораторной работе №1 информационных системах доступа к базам данных используется булевская логика, основанная на операциях And, Not, Or. Рассматриваемая ниже информационно-поисковая система рентгенофазового анализа (ИПС РФА) вместо операций булевской логики использует операторы, основанные на математической теории исчисления предикатов и включающие кванторы ALL - «для всех» и ONE - «существует». Это обеспечивает более высокие поисковые возможности по сравнению с традиционными поисковыми системами и программами ФИ.

Базовым элементом ИПС РФА является проблемно-ориентированный язык фазовой идентификации интерпретирующего типа (подобно языку программирования Бэйсик), состоящий из операторов и предназначенный для программирования запросов на ФИ. Программы-запросы позволяют описывать априори известную информацию о возможном фазовом составе в терминах задания допустимых комбинаций химического состава и формировать спектральные критерии соответствия эталонных и экспериментальных спектров для селективного поиска и отбора адекватных фазовых эталонов.

Конструкции языка ФИ задаются следующими определениями.

Фазовая идентификация рассматривается как последовательность выполнения элементарных шагов – идентификационных запросов. В результате каждого запроса создается выборка номеров спектров из базы данных эталонных спектров, обозначаемая идентификатором выборки. Задачей ФИ является создание такой выборки, в которую включены номера спектров всех истинных фаз идентифицируемого образца и нет никаких посторонних спектров. Запрос состоит из последовательности операторов. Для сжатого и точного описания конструкций языка ФИ используются следующие мнемонические обозначения:

«…» - скобки для содержательного описания элементов языка;

[…] - скобки для не обязательных языковых конструкций;

{… | …} - скобки для альтернативных языковых конструкций.

Другие мнемонические обозначения вводятся далее по тексту.

Формат запроса:

IN = «Идентификатор входного объекта»;

[ «Последовательность операторов языка ФИ» ]

OUT = «Идентификатор выходного объекта»;

где:

«Объект» есть {«Спектр» | «Выборка номеров спектров из БД» | TV}.

«Спектр» есть {«Идентифицируемый» | «Эталонный» } спектр.

«Идентификатор выборки» есть S«число от 1 до 99», т.е. S1, S2, …, S99.

«Идентификатор всей БД» есть SS.

«Идентификатор множества всех экспериментальных спектров» есть S0.

«Идентификатор спектра» есть номер { «спектра PDF2» | «экспериментального спектра»}.

«Номер спектра PDF2» – двойные номера спектров PDF2 описаны выше.

«Номер экспериментального спектра» есть 0-«число от 1 до 999»,

т.е. 0-1, 0-2, …, 0-999.

TV есть «идентификатор монитора».

Операторы отбора по хим. составу:

{YES | NOT} = IF {ONE | ALL} (F<L);

{YES | NOT} = IF {ONE | ALL} (F#<L);

{YES | NOT} = IF {ONE | ALL} (L<F);

{YES | NOT} = IF {ONE | ALL} (L#<F);

LIST = «список {«химических элементов» | “«фрагментов химических формул»”}»;

Использованные мнемонические обозначения:

YES | NOT – отбор или отбраковка спектра из IN,

если выполнено условие IF;

F - хим. состав химической формулы спектра из IN;

L - хим. состав из списка LIST;

"<" - знак «содержится»;

"#<" - знак «не содержится»;

ONE | ALL - «содержится хотя бы один» или «содержатся все»;

Операторы отбора по указанным линиям:

[{D2Т | Dd | DH} = «допустимая погрешность соответствия

линий в шкале {2Q | d/n | H=цел(10000/d)}»;]

{YES | NOT} = IF {ONE | ALL} (L<S) [FOR {(I>=Imin) | (C*I>=Imin)}];

{YES | NOT} = IF {ONE | ALL} (L#<S) [FOR {(I>=Imin) | (C*I>=Imin)}];

{YES | NOT} = IF {ONE | ALL} (S<L) [FOR {(I>=Imin) | (C*I>=Imin)}];

{YES | NOT} = IF {ONE | ALL} (S#<L) [FOR {(I>=Imin) | (C*I>=Imin)}];

LIST = «список положения линий в шкале {2Q | d | H}»;

Использованные мнемонические обозначения:

S – очередной эталонный спектр из IN, сопоставляемый с идентифицируемым спектром IS;

L - список позиций линий IS, указываемых в LIST для проверки соответствия им линий из S;

FOR(I>=Imin) – проверка осуществляется только для линий S, имеющих интенсивность I>=Imin; Imin может быть числом или функцией фона;

FOR(С*I>=Imin) – проверка осуществляется для линий S после его приведения к IS, т.е. только для линий S имеющих интенсивность С*I>=Imin, где С – коэффициент приведения интенсивности линий спектра S к IS.

Операторы отбора по спектральным критериям:

[{D2Т | Dd | DH} = «допустимая погрешность соответствия

линий в шкале {2Q | d/n | H=цел(10000/d)}»;]

{YES | NOT} = IF (Rs {>= | <} Ro) [FOR {(I>=Imin) | (C*I>=Imin)}];

Использованные мнемонические обозначения:

Rs – идентификатор вероятностного критерия парного соответствия спектров, рассчитываемого для очередного спектра из IN и спектра IS;

Ro - пороговое значение критерия Rs (в процентах);

Вероятностные критерии парного соответствия спектров рассчитываются в виде отношения интеграла перекрытия аппроксимированных линий штрих-спектров S и IS к интегральной интенсивности (т.е. площади) аппроксимированных линий штрих-спектра S. Аппроксимация распределения интенсивности каждой линии производится в интервале +/- DH от ее центра. Интегрирование проводится в интервале съемки рентгенограммы для линий, удовлетворяющих условию FOR. В критериях могут использоваться различные формы аппроксимации распределения интенсивности линий, например, треугольное (критерий RTC), или прямоугольное (критерий RHC). Аппроксимация проводится в 2 шага: (1) интенсивности линий эталонного штрих-спектра S умножаются на масштабный коэффициент для их приведения к интенсивности линий идентифицируемого экспериментального спектра IS; (2) каждая линия обоих штрих-спектров умножается на треугольную или прямоугольную функцию с шириной 2DH и высотой 1, т.е. преобразуется в треугольник или прямоугольник той же высоты, что и линия штрих-спектра. Кроме того, используется частотный критерий, показывающий процент совпадения линий:

RN = Nсовп. / Nсрав.*100%

где: Nсовп. - число совпавших линий эталонного и экспериментального спектра;

Nсрав. - число сравниваемых линий эталонного спектра; линии считаются совпавшими, если их позиции в шкале Н отличаются не более, чем на величину DH (H= целая часть от 10000/d).

Очевидно, при полном совпадении всех линий эталонного и экспериментального спектров по положению и интенсивности каждый из критериев равен 100%, а при полном несовпадении – равен 0.

Свойства и правила взаимодействия операторов:

Важнейшим свойством индивидуальных операторов является их двойственность: эквивалентность действия при замене входящих в оператор операций на противоположные. Например, эквивалентны следующие пары операторов:

YES = IF ONE (F<L) и NOT = IF ALL (F#<L);

YES = IF ALL (L<S) FOR {(I>=50) и NOT = IF ONE (L#<S) FOR {(I>=50)

YES = IF (Rs >=20) FOR (C*I>=10) и NOT = IF (Rs <20) FOR (C*I>=10)

Двойственность позволяет ввести определенные правила для конструирования запросов из последовательностей операторов. Взаимодействие совокупности операторов запроса производится согласно следующим правилам.

1) Объекты, содержащиеся в IN, обрабатываются операторами запроса последовательно;

2) Объект из IN отбирается в OUT тогда и только тогда, когда одновременно:

- не выполняется ни один из операторов NOT;

- выполняется хотя бы один из операторов YES;

3) Отсутствие оператора YES эквивалентно его выполнению.





Дата публикования: 2015-04-07; Прочитано: 235 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...