Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Введение в SQL 3 страница



3. ИСПОЛЬЗОВАНИЕ SQL ДЛЯ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ТАБЛИЦ. В ЭТОЙ ГЛАВЕ МЫ ПОКАЖЕМ ВАМ КАК ИЗВЛЕКАТЬ информацию из таблиц. Вы узнаете как опускать или переупорядочивать столбцы и как автоматически устранять избыточность данных из вашего вывода. В заключение, вы узна- ете как устанавливать условие(проверку) которую вы можете использо- вать чтобы определить какие строки таблицы используются в выводе. Эта последняя особенность, будет далее описана в более поздних главах и является одной из наиболее изящных и мощных в SQL. ========= СОЗДАНИЕ ЗАПРОСА =========== Как мы подчеркивали ранее, SQL символизирует собой Структурированный Язык Запросов. Запросы - вероятно наиболее часто используемый аспект SQL. Фактически, для категории SQL пользователей, маловероятно чтобы кто-либо использовал этот язык для чего-то друго. По этой причине, мы будем начинать наше обсуждение SQL с обсуждения запроса и как он вы- полняется на этом языке. ЧТО ТАКОЕ ЗАПРОС? Запрос - команда которую вы даете вашей программе базы данных, и ко- торая сообщает ей чтобы она вывела определенную информацию из таблиц в память. Эта информация обычно посылается непосредственно на экран компьютера или терминала которым вы пользуетесь, хотя, в большинстве случаев, ее можно также послать принтеру, сохранить в файле (как объ- ект в памяти компьютера), или представить как вводную информацию для другой команды или процесса. ГДЕ ПРИМЕНЯЮТСЯ ЗАПРОСЫ? Запросы обычно рассматриваются как часть языка DML. Однако, так как запрос не меняет информацию в таблицах, а просто показывает ее пользо- вателю, мы будем рассматривать запросы как самостоятельную категорию среди команд DML которые производят действие, а не просто показывают содержание базы данных. Все запросы в SQL состоят из одиночной команды. Структура этой ко- манды обманчиво проста, потому что вы должны расширять ее так чтобы выполнить высоко сложные оценки и обработки данных. Эта команда назы- вается - SELECT(ВЫБОР). КОМАНДА SELECT В самой простой форме, команда SELECT просто инструктирует базу дан- ных чтобы извлечь информацию из таблицы. Например, вы могли бы вывести таблицу Продавцов напечатав следующее: SELECT snum, sname, sity, comm FROM Salespeople; Вывод для этого запроса показывается в Рисунке 3.1. =============== SQL Execution Log ============ | | | SELECT snum, sname, sity, comm | | FROM Salespeople; | | | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1002 Serres San Jose 0.13 | | 1004 Motika London 0.11 | | 1007 Rifkin Barcelona 0.15 | | 1003 Axelrod New York 0.10 | =============================================== Рисунок 3.1: команда SELECT Другими словами, эта команда просто выводит все данные из таблицы. Большинство программ будут также давать заголовки столбца как выше, а некоторые позволяют детальное форматирование вывода, но это уже вне стандартной спецификации. Имеется объяснение каждой части этой команды: SELECT Ключевое слово которое сообщает базе данных что эта команда - запрос. Все запросы начинаются этим словом, сопровождаемым пробелом. snum, sname Это - список столбцов из таблицы которые выбираются запросом. Любые столбцы не перечисленные здесь не будут включены в вывод команды. Это, конечно, не значит что они будут удалены или их информация будет стерта из таблиц, потому что запрос не воздействует на информацию в таблицах; он только показывает данные. FROM FROM - ключевое слово, подобно SELECT, которое должно Salespeople быть представлено в каждом запросе. Оно сопровожда- ется пробелом и затем именем таблицы используемой в качестве источника информации. В данном случае - это таблица Продавцов(Salespeople).; Точка с запятой используется во всех интерактивных командах SQL чтобы сообщать базе данных что команда заполнена и готова выполниться. В некоторых системах наклонная черта влево (\) в строке, является индикатором конца команды. Естественно, запрос такого характера не обязательно будет упорядочи- вать вывод любым указаным способом. Та же самая команда выполненная с теми же самыми данными но в разное время не сможет вывести тот же са- мый порядок. Обычно, строки обнаруживаются в том порядке в котором они найдены в таблице, поскольку как мы установили в предыдущей главе - этот порядок произволен. Это не обязательно будет тот порядок в кото- ром данные вводились или сохранялись. Вы можете упорядочивать вывод командами SQL непосредственно: с помощью специального предложения. Позже, мы покажем как это делается. А сейчас, просто усвойте, что в отсутствии явного упорядочения, нет никакого определенного порядка в вашем выводе. Наше использование возврата (Клавиша ENTER) является произвольным. Мы должны точно установить как удобнее составить запрос, в несколько строк или в одну строку, следующим образом: SELECT snum, sname, city, comm FROM Salespeople; С тех пор как SQL использует точку с запятой чтобы указывать конец команды, большинство программ SQL обрабатывают возврат (через нажим Возврат или клавишу ENTER) как пробел. Это - хорошая идея чтобы ис- пользовать возвраты и выравнивание что мы делали это ранее, чтобы сде- лать ваши команды более легкими для чтения и более правильными. ВЫБИРАЙТЕ ВСЕГДА САМЫЙ ПРОСТОЙ СПОСОБ Если вы хотите видеть каждый столбец таблицы, имеется необязательное сокращение которое вы можете использовать. Звездочка (*) может приме- няться для вывода полного списка столбцов следующим образом: SELECT * FROM Salespeople; Это привыведет к тому же результату что и наша предыдущая команда. ОПИСАНИЕ SELECT В общем случае, команда SELECT начинается с ключевого слова SELECT, сопровождаемого пробелом. После этого должен следовать список имен столбцов которые вы хотите видеть, отделяемые запятыми. Если вы хотите видеть все столбцы таблицы, вы можете заменить этот список звездочкой (*). Ключевое слово FROM следующее далее, сопровождается пробелом и именем таблицы запрос к которой делается. В заключение, точка с запя- той (;) должна использоваться чтобы закончить запрос и указать что команда готова к выполнению. ПРОСМОТР ТОЛЬКО ОПРЕДЕЛЕННОГО СТОЛБЦА ТАБЛИЦЫ Команда SELECT способна извлечь строго определенную информацию из таблицы. Сначала, мы можем предоставить возможность увидеть только оп- ределенные столбцы таблицы. Это выполняется легко, простым исключением столбцов которые вы не хотите видеть, из части команды SELECT. Напри- мер, запрос SELECT sname, comm FROM Salespeople; будет производить вывод показанный на Рисунке 3.2. =============== SQL Execution Log ============ | | | SELECT snum, comm | | FROM Salespeople; | | | | ==============================================| | sname comm | | ------------- --------- | | Peel 0.12 | | Serres 0.13 | | Motika 0.11 | | Rifkin 0.15 | | Axelrod 0.10 | =============================================== Рисунок 3.2: Выбор определенных столбцов Могут иметься таблицы которые имеют большое количество столбцов со- держащих данные, не все из которых являются относящимися к поставленой задаче. Следовательно, вы можете найти способ подбора и выбора только полезных для Вас столбцов. ПЕРЕУПОРЯДОЧЕНИЕ СТОЛБЦА Даже если столбцы таблицы, по определению, упорядоченны, это не оз- начает что вы будете восстанавливать их в том же порядке. Конечно, звездочка (*) покажет все столбцы в их естественном порядке, но если вы укажете столбцы отдельно, вы можете получить их в том порядке кото- ром хотите. Давайте рассмотрим таблицу Порядков, содержащую дату при- обретения(odate), номер продавца(snum), номер порядка(onum), и суммы приобретения(amt): SELECT odate, snum, onum, amt FROM Orders; Вывод этого запроса показан на Рисунке 3.3. ============= SQL Execution Log =============== | | | SELECT odate, snum, onum, amt | | FROM Orders; | | | | ------------------------------------------------| | odate snum onum amt | | ----------- ------- ------ --------- | | 10/03/1990 1007 3001 18.69 | | 10/03/1990 1001 3003 767.19 | | 10/03/1990 1004 3002 1900.10 | | 10/03/1990 1002 3005 5160.45 | | 10/03/1990 1007 3006 1098.16 | | 10/04/1990 1003 3009 1713.23 | | 10/04/1990 1002 3007 75.75 | | 10/05/1990 1001 3008 4723.00 | | 10/06/1990 1002 3010 1309.95 | | 10/06/1990 1001 3011 9891.88 | | | =============================================== Рисунок 3.3: Реконструкция столбцов Как вы можете видеть, структура информации в таблицах - это просто основа для активной перестройки структуры в SQL. УДАЛЕНИЕ ИЗБЫТОЧНЫХ ДАННЫХ DISTINCT (ОТЛИЧИЕ) - аргумент который обеспечивает Вас способом уст- ранять двойные значения из вашего предложения SELECT. Предположим что вы хотите знать какие продавцы в настоящее время имеют свои порядки в таблице Порядков. Под порядком (здесь и далее) будет пониматься запись в таблицу Порядков, регистрирующую приобретения сделанные в определен- ный день определенным заказчиком у определенного продавца на опреде- ленную сумму). Вам не нужно знать, сколько порядков имеет каждый; вам нужен только список номеров продавцов (snum). Поэтому Вы можете ввес- ти: SELECT snum FROM Orders; для получения вывода показанного в Рисунке 3.4 =============== SQL Execution Log ============ | | | SELECT snum | | FROM Orders; | | | | ============================================= | | snum | | ------- | | 1007 | | 1001 | | 1004 | | 1002 | | 1007 | | 1003 | | 1002 | | 1001 | | 1002 | | 1001 | ============================================= Рисунок 3. 4: SELECT с дублированием номеров продавцов. Для получения списка без дубликатов, для удобочитаемости, вы можете ввести следующее: SELECT DISTINCT snum FROM Orders; Вывод для этого запроса показан в Рисунке 3.5. Другими словами, DISTINCT следит за тем, какие значения были ранее, так что бы они не были продублированы в списке. Это - полезный способ избежать избыточности данных, но важно что бы при этом вы понимали что вы делаете. Если вы не хотите потерять некоторые данные, вы не должны безоглядно использовать DISTINCT, потому что это может скрыть какую-то проблему или какие-то важные данные. Например, вы могли бы предполо- жить что имена всех ваших заказчиков различны. Если кто-то помещает второго Clemens в таблицу Заказчиков, а вы используете SELECT DISTINCT cname, вы не будете даже знать о существовании двойника. Вы можете по- лучить не того Clemens и даже не знать об этом. Так как вы не ожидаете избыточности, в этом случае вы не должны использовать DISTINCT. ПАРАМЕТРЫ DISTINCT DISTINCT может указываться только один раз в данном предложении SE- LECT. Если предложение выбирает многочисленные поля, =============== SQL Execution Log ============ | | | SELECT DISTINCT snum | | FROM Orders; | | | | ============================================= | | snum | | ------- | | 1001 | | 1002 | | 1003 | | 1004 | | 1007 | ============================================= Рисунок 3.5: SELECT без дублирования DISTINCT опускает строки где все выбранные поля идентичны. Строки в которых некоторые значения одинаковы а некоторые различны - будут сох- ранены. DISTINCT, фактически, приводит к показу всей строки вывода, не указывая полей (за исключением когда он используется внутри агрегат- ных функций, как описано в Главе 6), так что нет никакого смысла что- бы его повторять. DISTINCT ВМЕСТО ALL Вместо DISTINCT, вы можете указать - ALL. Это будет иметь противопо- ложный эффект, дублирование строк вывода сохранится. Так как это - тот же самый случай когда вы не указываете ни DISTINCT ни ALL, то ALL - по существу скорее пояснительный, а не действующий аргумент. КВАЛИФИЦИРОВАННЫЙ ВЫБОР ПРИ ======= ИСПОЛЬЗОВАНИИ ПРЕДЛОЖЕНИЙ ======== Таблицы имеют тенденцию становиться очень большими, поскольку с те- чением времени, все большее и большее количество строк в нее добавля- ется. Поскольку обычно из них только определенные строки интересуют вас в данное время, SQL дает возможность вам устанавливать критерии чтобы определить какие строки будут выбраны для вывода. WHERE - предложение команды SELECT, которое позволяет вам устанавли- вать предикаты, условие которых может быть или верным или неверным для любой строки таблицы. Команда извлекает только те строки из таблицы для которой такое утверждение верно. Например, предположим вы хотите видеть имена и комиссионные всех продавцов в Лондоне. Вы можете ввести такую команду: SELECT sname, city FROM Salespeople; WHERE city = "LONDON"; Когда предложение WHERE представлено, программа базы данных просмат- ривает всю таблицу по одной строке и исследует каждую строку чтобы оп- ределить верно ли утверждение. Следовательно, для записи Peel, прог- рамма рассмотрит текущее значение столбца city, определит что оно рав- но "London", и включит эту строку в вывод. Запись для Serres не будет включена, и так далее. Вывод для вышеупомянутого запроса показан в Ри- сунке 3.6. =============== SQL Execution Log ============ | | | SELECT sname, city | | FROM Salespeople | | WHERE city = 'London' | | ============================================= | | sname city | | ------- ---------- | | Peel London | | Motika London | ============================================= Рисунок 3.6: SELECT c предложением WHERE Давайте попробуем пример с числовым полем в предложении WHERE. Поле rating таблицы Заказчиков предназначено чтобы разделять заказчиков на группы основанные на некоторых критериях которые могут быть получены в итоге через этот номер. Возможно это - форма оценки кредита или оценки основанной на томе предыдущих приобретений. Такие числовые коды могут быть полезны в реляционных базах данных как способ подведения итогов сложной информации. Мы можем выбрать всех заказчиков с рейтингом 100, следующим образом: SELECT * FROM Customers WHERE rating = 100; Одиночные кавычки не используются здесь потому, что оценка - это числовое поле. Результаты запроса показаны в Рисунке 3. 7. Предложение WHERE совместимо с предыдущим материалом в этой главе. Другими словами, вы можете использовать номера столбцов, устранять дубликаты, или переупорядочивать столбцы в команде SELECT которая ис- пользует WHERE. Однако, вы можете изменять порядок столбцов для имен только в предложении SELECT, но не в предложении WHERE. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE rating = 100; | | ============================================= | | сnum cname city rating snum | | ------ -------- ------ ---- ------ | | 2001 Hoffman London 100 1001 | | 2006 Clemens London 100 1001 | | 2007 Pereira Rome 100 1001 | ============================================= Рисунок 3.7: SELECT с числовым полем в предикате =============== РЕЗЮМЕ =============== Теперь вы знаете несколько способов заставить таблицу давать вам ту информацию какую вы хотите, а не просто выбрасывать наружу все ее со- держание. Вы можете переупорядочивать столбцы таблицы или устранять любую из них. Вы можете решать, хотите вы видеть дублированные значе- ния или нет. Наиболее важно то, что вы можете устанавливать условие называемое предикатом которое определяет или не определяет указанную строку таб- лицы из тысяч таких же строк, будет ли она выбрана для вывода. Предикаты могут становиться очень сложными, предоставляя вам высокую точность в решении, какие строки вам выбирать с помощью запроса. Имен- но эта способность решать точно, что вы хотите видеть, делает запросы SQL такими мощными. Следующие несколько глав будут посвещены, в боль- шей мере, особенностям которые расширяют мощность предикатов. В Главе 4, вам будут представлены операторы иные чем те которые используются в условиях предиката, а также способы объединения многочисленых условий в единый предикат. ************* РАБОТА С SQL *************** 1. Напишите команду SELECT которая бы вывела номер порядка, сумму, и дату для всех строк из таблицы Порядков. 2. Напишите запрос который вывел бы все строки из таблицы Заказчиков для которых номер продавца = 1001. 3. Напишите запрос который вывел бы таблицу со столбцами в следующем порядке: city, sname, snum, comm. 4. Напишите команду SELECT которая вывела бы оценку(rating), сопро- вождаемую именем каждого заказчика в San Jose. 5. Напишите запрос который вывел бы значения snum всех продавцов в текущем порядке из таблицы Порядков без каких бы то ни было пов- торений. (См. Приложение A для ответов.) 4. ИСПОЛЬЗОВАНИЕ РЕЛЯЦИОННЫХ И БУЛЕВЫХ ОПЕРАТОРОВ ДЛЯ СОЗДАНИЯ БОЛЕЕ ИЗОЩРЕННЫХ ПРЕДИКАТОВ В ГЛАВЕ 3, ВЫ УЗНАЛИ ЧТО ПРЕДИКАТЫ МОГУТ оценивать равенство опера- тора как верного или неверного. Они могут также оценивать другие виды связей кроме равенств. Эта глава будет исследовать другие реляционные операторы используемые в SQL. Вы также узнаете как использовать опера- торы Буля, чтобы изменять и объединять значения предиката. С помощью операторов Буля (или проще говоря логических операторов), одиночный предикат может содержать любое число условий. Это позволяет вам созда- вать очень сложные предикаты. Использование круглых скобок в структуре этих сложных предикатов будет также объясняться. ========= РЕЛЯЦИОННЫЕ ОПЕРАТОРЫ ======= Реляционный оператор - математический символ который указывает на определенный тип сравнения между двумя значениями. Вы уже видели как используются равенства, такие как 2 + 3 = 5 или city = "London". Но также имеются другие реляционные операторы. Предположим что вы хотите видеть всех Продавцов с их комиссионными выше определенного значения. Вы можете использовать тип сравнения "больше чем" - (>). Реляционные операторы которыми распологает SQL: = Равный к > Больше чем < Меньше чем >= Больше чем или равно <= Меньше чем или равно <> Не равно Эти операторы имеют стандартные значения для числовых значений. Для значения символа, их определение зависит от формата преобразования, ASCII или EBCDIC, который вы используете. SQL сравнивает символьные значения в терминах основных номеров как определено в формате преобра- зования. Даже значение символа, такого как "1", который представляет номер, не обязательно равняется номеру который он представляет. Вы мо- жете использовать реляционные операторы чтобы установить алфавитный порядок - например, "a" < "n" где средство a первое в алфавитном по- рядке - но все это ограничивается с помощью параметра преобразования формата. И в ASCII и в EBCDIC, символы - по значению: меньше чем все другие символы которым они предшествуют в алфавитном порядке и имеют один ва- риант(верхний или нижний). В ASCII, все символы верхнего регистра - меньше чем все символы нижнего регистра, поэтому "Z" < "a", а все но- мера - меньше чем все символы, поэтому "1" < "Z". То же относится и к EBCDIC. Чтобы сохранить обсуждение более простым, мы допустим что вы будете использовать текстовый формат ASCII. Проконсультируйтесь с ва- шей документацией системы если вы неуверены какой формат вы используе- те или как он работает. Значения сравниваемые здесь называются - скалярными значениями. Ска- лярные значения производяться скалярными выражениями; 1 + 2 - это ска- лярное выражение которое производит скалярное значение 3. Скалярное значение может быть символом или числом, хотя очевидно что только но- мера используются с арифметическими операторами, такими как +(плюс) или *(звезда). Предикаты обычно сравнивают значения скалярных величин, используя или реляционные операторы или специальные операторы SQL чтобы увидеть верно ли это сравнение. Некоторые операторы SQL описаны в Главе 5. Предположим что вы хотите увидеть всех заказчиков с оценкой(rating) выше 200. Так как 200 - это скалярное значение, как и значение в столбце оценки, для их сравнения вы можете использовать реляционный оператор. SELECT * FROM Customers WHERE rating > 200; Вывод для этого запроса показывается в Рисунке 4.1. Конечно, если бы мы захотели увидеть еще и заказчиков с оценкой рав- ной 200, мы стали бы использовать предикат rating > = 200 ========= БУЛЕВЫ ОПЕРАТОРЫ =========== Основные Булевы операторы также распознаются в SQL. Выражения Буля - являются или верными или неверными, подобно предикатам. Булевы опера- торы связывают одно или более верных/неверных значений и производят едиственное верное/или/неверное значение. Стандартными операторами Бу- ля распознаваемыми в SQL являются: AND, OR, и NOT. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE rating > 200; | | ============================================= | | snum cname city rating snum | | ----- -------- -------- ----- ------ | | 2004 Crass Berlin 300 1002 | | 2008 Cirneros San Jose 300 1007 | ============================================= Рисунок 4.1: Использование больше чем (>) Существуют другие, более сложные, операторы Буля (типа " исключен- ный или "), но они могут быть сформированы из этих трех простых опе- раторов - AND, OR, NOT. Как вы можете понять, Булева верня / неверная логика - основана на цифровой компьютерной операции; и фактически, весь SQL(или любой дру- гой язык) может быть сведен до уровня Булевой логики. Операторы Буля и как они работают: * AND берет два Буля (в форме A AND B) как аргументы и оценивает их по отношению к истине, верны ли они оба. * OR берет два Буля (в форме A OR B) как аргументы и оценивает на правильность, верен ли один из них. * NOT берет одиночный Булев (в форме NOT A) как аргументы и заменяет его значение с неверного на верное или верное на неверное. Связывая предикаты с операторами Буля, вы можете значительно увели- чить их возможности. Предположим вы хотите видеть всех заказчиков в San Jose которые имеют оценку(рейтинг) выше 200: SELECT * FROM Customers WHERE city = " San Jose' AND rating > 200; Вывод для этого запроса показан на Рисунке 4.2. Имеется только один заказчик который удовлетворяет этому условию. Если вы же используете OR вы получите всех заказчиков которые нахо- дились в San Jose или(OR) которые имели оценку выше 200. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE city = 'San Jose' | | AND rating > 200; | | ============================================= | | сnum cname city rating snum | | ------ -------- -------- ---- ----- | | 2008 Cirneros San Jose 300 1007 | ============================================= Рисунок 4.2: SELECT использующий AND SELECT * FROM Customers WHERE city = " San Jose' OR rating > 200; Вывод для этого запроса показывается в Рисунке 4.3. NOT может использоваться для инвертирования значений Буля. Имеется пример запроса с NOT: SELECT * FROM Customers WHERE city = " San Jose' OR NOT rating > 200; Вывод этого запроса показывается в Рисунке 4.4. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE city = 'San Jose' | | OR rating > 200; | | ============================================= | | сnum cname city rating snum | | ----- ------- -------- ----- ------ | | 2003 Liu San Jose 200 1002 | | 2004 Grass Berlin 300 1002 | | 2008 Cirneros San Jose 300 1007 | ============================================= Рисунок 4.:3: SELECT использующий OR =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE city = 'San Jose' | | OR NOT rating > 200; | | ============================================= | | cnum cname city rating snum | | ------ -------- ------ ----- ----- | | 2001 Hoffman London 100 1001 | | 2002 Giovanni Rome 200 1003 | | 2003 Liu San Jose 200 1002 | | 2006 Clemens London 100 1001 | | 2008 Cirneros San Jose 300 1007 | | 2007 Pereira Rome 100 1004 | ============================================= Рисунок 4.4: SELECT использующий NOT Все записи за исключением Grass были выбраны. Grass не был в San Jo- se, и его оценка была больше чем 200, так что он потерпел неудачу при обеих проверках. В каждой из других строк встретился один или другой или оба критериев. Обратите внимание что оператор NOT должен предшест- вовать Булеву оператору, чье значение должно измениться, и не должен помещаться перед реляционным оператором. Например неправильным вводом оценки предиката будет: rating NOT > 200 Он выдаст другую отметку. А как SQL оценит следующее? SELECT * FROM Customers WHERE NOT city = " San Jose' OR rating > 200; NOT применяется здесь только к выражению city = 'SanJose', или к вы- ражению rating > 200 тоже? Как и написано, правильный ответ будет прежним. SQL может применять NOT с выражением Буля только сразу после него. Вы можете получить другой результат при команде: SELECT * FROM Customers WHERE NOT(city = " San Jose' OR rating > 200); Здесь SQL понимает круглые скобки как означающие, что все внутри них будет оцениваться первым и обрабатываться как единое выражение с по- мощью всего что снаружи них (это является стандартной интерпретацией в математике). Другими словами, SQL берет каждую строку и определяет, соответствует ли истине равенство city = " San Jose' или равенство ra- ting > 200. Если любое условие верно, выражение Буля внутри круглых скобок верно. Однако, если выражение Буля внутри круглых скобок верно, предикат как единое целое неверен, потому что NOT преобразует верно в неверно и наоборот. Вывод для этого запроса - показывается в Рисунке 4.5. Имеется намеренно сложный пример. Посмотрим сможете ли вы проследить его логику (вывод показан в Рисунке 4.6): SELECT * FROM Orders WHERE NOT ((odate = 10/03/1990 AND snum >1002) OR amt > 2000.00); =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE NOT (city = 'San Jose' | | OR rating > 200); | | ============================================= | | cnum cname city rating snum | | ----- -------- ------- ----- ------ | | 2001 Hoffman London 100 1001 | | 2002 Giovanni Rome 200 1003 | | 2006 Clemens London 100 1001 | | 2007 Pereira Rome 100 1004 | ============================================= Рисунок 4.5: SELECT использующий NOT и вводное предложение =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders | | WHERE NOT ((odate = 10/03/1990 AND snum > 1002) | | OR amt > 2000.00); | | =============================================== | | onum amt odate cnum snum | | ------ -------- ---------- ----- ----- | | 3003 767.19 10/03/1990 2001 1001 | | 3009 1713.23 10/04/1990 2002 1003 | | 3007 75.75 10/04/1990 2004 1002 | | 3010 1309.95 10/06/1990 2004 1002 | ================================================= Рисунок 4.6: Полный (комплексный) запрос Несмотря на то что Булевы опреаторы индивидуально просты, они не так просты когда комбинируются в комплексное выражение. Способ оценки комплекса Булева состоит в том, чтобы оценивать Булевы выражения наиболее глубоко вложенные в круглых скобках, объединять их в единичное Булево значение, и затем объединять его с верхними значе- ниями. Имеется подробное объяснение того как пример выше был вычислен. Наи- более глубоко вложенные выражения Буля в предикате - это odate = 10/03/1990 и snum > 1002 являются объединеными с помощью AND, формируя одно выражение Буля которое будет оценено как верное для всех строк в которых встретились оба эти условия. Это составное Булево выражение (которое мы будем называть Булево номер 1, или B1 для краткости) объ- диняется с выражением (amt) > 2000.00 (B2) с помощью OR, формируя третье выражение (B3), которое является верным для данной строки, если или B1 или B2 - верны для этой строки. B3 полностью содержится в круглых скобках которым предшествует NOT, формируя последнее выражение Буля(B4), которое является условием пре- диката. Таким образом B4, предикат запроса, - будет верен всякий раз, когда B3 неправилен. B3 - неправилен всегда, когда B1 и B2 - оба неверны. B1 неправилен для строки если дата порядка строки не 10/03/1990, или если значение snum не большее чем 1002. B2 неправилен для всех строк, зна- чения суммы приобретений которых не превышает 2000.00. Любая строка со значением выше 2000.00 сделает B2 - верным; в результате B3 будет ве- рен, а B4 нет. Следовательно, все эти строки будут удалены из вывода. Из оставшихся, строки которые на 3 Октября имеют snum > 1002 (такие как строки для onum 3001 на 3 Октября со snum = 1007), делают B1 вер- ным, с помощью верного B3 и неверного предиката запроса. Они будут также удалены из вывода. Вывод показан для строк которые оставлены. ================ РЕЗЮМЕ ================ В этой главе, вы значительно расширили ваше знакомство с предиката- ми. Теперь вы можете находить значения которые связаны с данным значе- нием любым способом - определяемым различными реляционными оператора- ми. Вы можете также использовать операторы Буля AND и OR чтобы много ус- ловий, каждое из которых автономно в предикатах, объединять в единый предикат. Оператор Буля NOT, как вы уже видели, может изменять значе- ние условия или группы условий на противоположное. Булевы и Реляционные операторы могут эффективно управляться с по- мощью круглых скобок, которые определяют порядок, в котором операции будут выполнены. Эти операции применимы к любому уровню сложности и вы поняли как сложные условия могут создаваться из этих простых частей. Теперь, когда мы показали как используются стандартные математичес- кие операторы, мы можем перейти к операторам которые являются исключи- тельными в SQL. Это мы сделаем в Главе 5. ************** РАБОТА С SQL ************** 1. Напишите запрос который может дать вам все порядки со значениями суммы выше чем $1,000. 2. Напишите запрос который может выдать вам поля sname и city для всех продавцов в Лондоне с комиссионными выше.10. 3. Напишите запрос к таблице Заказчиков чей вывод может включить всех заказчиков с оценкой =< 100, если они не находятся в Риме. 4. Что может быть выведено в результате следующего запроса? SELECT * FROM Orders WHERE (amt < 1000 OR NOT (odate = 10/03/1990 AND cnum > 2003)); 5. Что может быть выведено в результате следующего запроса? SELECT * FROM Orders WHERE NOT ((odate = 10/03/1990 OR snum > 1006) AND amt > = 1500); 6. Как можно проще переписать такой запрос? SELECT snum, sname, city, comm FROM Salespeople WHERE (comm > +.12 OR comm <.14); (См. Приложение A для ответов.) 5. ИСПОЛЬЗОВАНИЕ СПЕЦИАЛЬНЫХ ОПЕРАТОРОВ В УСЛОВИЯХ. В ДОПОЛНЕНИИ К РЕЛЯЦИОННЫМ И БУЛЕВСКИМ операторам обсуждаемым в Гла- ве 4, SQL использует специальные операторы IN, BETWEEN, LIKE, и IS NULL. В этой главе, вы узнаете как их использовать и как реляционные операторы позволяют создавать более сложные и мощные предикаты. Обсуж- дение оператора IS NULL будет включать отсутствие данных и значение NULL, которое указывает на то: что данные отсутствуют. Вы также узнае- те о разновидностях использования оператора NOT применяющегося с этими операторами. ============ ОПЕРАТОР IN =============== Оператор IN определяет набор значений в которое данное значение мо- жет или не может быть включено. В соответствии с нашей учебной базой данных на которой вы обучаетесь по настоящее временя, если вы хотите найти всех продавцов, которые размещены в Barcelona или в London, вы должны использовать следующий запрос (вывод показывается в Рисунке 5.1): SELECT * FROM Salespeople WHERE city = 'Barcelona' OR city = 'London'; Имеется и более простой способ получить ту же информацию: SELECT * FROM Salespeople WHERE city IN ('Barcelona', 'London'); Вывод для этого запроса показывается в Рисунке 5.2. Как вы можете видеть, IN определяет набор значений с помощью имен членов набора заключеных в круглые скобки и отделенных запятыми. Он затем проверяет различные значения указанного поля пытаясь найти сов- падение со значениями из набора. Если это случается, то предикат ве- рен. Когда наборсодержит значения номеров а не символов, одиночные ка- вычки опускаются. Давайте найдем всех заказчиков относящихся к продав- цам имеющих значения snum = 1001, 1007, и 1004. Вывод для следующего запроса показан на Рисунке 5.3: SELECT * FROM Customers WHERE cnum IN (1001, 1007, 1004); =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE city = 'Barcelona' | | OR city = 'London'; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1004 Motika London 0.11 | | 1007 Rifkin Barcelona 0.15 | | | =============================================== Рисунок 5.1 Нахождение продавцов в Барселоне и Лондоне =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE city IN ('Barcelona', 'London'; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1004 Motika London 0.11 | | 1007 Rifkin Barcelona 0.15 | | | =============================================== Рисунок 5.2 SELECT использует IN =============== SQL Execution Log ============ | SELECT * | | FROM Customers | | WHERE snum IN (1001, 1007, 1004); | | ============================================= | | snum cname city rating snum | | ------ -------- ------ ---- ------ | | 2001 Hoffman London 100 1001 | | 2006 Clemens London 100 1001 | | 2008 Cisneros San Jose 300 1007 | | 2007 Pereira Rome 100 1004 | ============================================= Рисунок 5.3: SELECT использует IN с номерами =========== ОПЕРАТОР BETWEEN ========== Оператор BETWEEN похож на оператор IN. В отличии от определения по номерам из набора, как это делает IN, BETWEEN определяет диапазон, значения которого должны уменьшаться что делает предикат верным. Вы должны ввести ключевое слово BETWEEN с начальным значением, ключевое AND и конечное значение. В отличие от IN, BETWEEN чувствителен к по- рядку, и первое значение в предложении должно быть первым по алфавит- ному или числовому порядку. (Обратите Внимание что, в отличие от Анг- лийского языка, SQL не говорит что "значение находится (между)BETWEEN значением и значением|, а просто "значение BETWEEN значение значение|. Это применимо и к оператору LIKE). Следующий пример будет извлекать из таблицы Продавцов всех продавцов с комиссионными между.10 и.12 (вы- вод показывается в Рисунке 5.4): SELECT * FROM Salespeople WHERE comm BETWEEN.10 AND.12; Для включенного оператора BETWEEN, значение совпадающее с любым из двух значений границы (в этом случае,.10 и.12) заставляет предикат быть верным. =============== SQL Execution Log ============ | SELECT * | | FROM Salespeople | | WHERE comm BETWEEN.10 AND.12; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1004 Motika London 0.11 | | 1003 Axelrod New York 0.10 | =============================================== Рисунок 5.4: SELECT использует BETWEEN SQL не делает непосредственной поддержки невключения BETWEEN. Вы должны или определить ваши граничные значения так, чтобы включающая интерпретация была приемлема, или сделать что-нибудь типа этого: SELECT * FROM Salespeople WHERE (comm BETWEEN.10, AND.12) AND NOT comm IN (.10,.12); Вывод для этого запроса показывается в Рисунке 5.5. По общему признанию, это немного неуклюже, но зато показывает как эти новые операторы могут комбинироваться с операторами Буля чтобы производить более сложные предикаты. В основном, вы используете IN и BETWEEN также как вы использовали реляционные операторы чтобы сравни- вать значения, которые берутся либо из набора (для IN) либо из диа- пазона (для BETWEEN). Также, подобно реляционным операторам, BETWEEN может работать с сим- вольными полями в терминах эквивалентов ASCII. Это означает что вы мо- жете использовать BETWEEN чтобы выбирать ряд значений из упорядоченных по алфавиту значений. =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE (comm BETWEEN.10 AND.12 | | AND NOT comm IN (.10.12; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1004 Motika London 0.11 | | | =============================================== Рисунок 5.5: Сделать BETWEEN - невключенным Этот запрос выбирает всех заказчиков чьи имена попали в определенный алфавитный диапазон: SELECT * FROM Customers WHERE cname BETWEEN 'A' AND 'G'; Вывод для этого запроса показывается в Рисунке 5.6. Обратите Внимание что Grass и Giovanni отсутствуют, даже при вклю- ченном BETWEEN. Это происходит из-за того что BETWEEN сравнивает стро- ки неравной длины. Строка 'G' более короткая чем строка Giovanni, поэ- тому BETWEEN выводит 'G' с пробелами. Пробелы предшествуют символам в алфавитном порядке (в большинстве реализаций), поэтому Giovanni не выбирается. То же самое происходит с Grass. Важно помнить это когда вы используете BETWEEN для извлечения значений из алфавитных диапазонов. Обычно вы указываете диапазон с помощью символа начала диапазона и символа конца(вместо которого можно просто поставить z). =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE cname BETWEEN 'A' AND 'G'; | | ============================================= | | cnum cname city rating snum | | ------ -------- ------ ---- ------ | | 2006 Clemens London 100 1001 | | 2008 Cisneros San Jose 300 1007 | | | ============================================= Рисунок 5. 6: Использование BETWEEN в алфавитных порядках ============ ОПЕРАТОР LIKE ============= LIKE применим только к полям типа CHAR или VARCHAR, с которыми он используется чтобы находить подстроки. Т.е. он ищет поле символа чтобы видеть, совпадает ли с условием часть его строки. В качестве условия он использует групповые символы(wildkards) - специальные символы кото- рые могут соответствовать чему-нибудь. Имеются два типа групповых символов используемых с LIKE: * символ подчеркивания (_) замещает любой одиночный символ. Напри- мер, 'b_t' будет соответствовать словам 'bat' или 'bit', но не будет соответствовать 'brat'. * знак процента (%) замещает последовательность любого числа символов (включая символы нуля). Например '%p%t' будет соответствовать словам 'put', 'posit', или 'opt', но не 'spite'. Давайте найдем всех заказчиков чьи имена начинаются с G (вывод показывается в Рисунке 5.7): SELECT FROM Customers WHERE cname LIKE 'G%'; =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE cname LIKE 'G'; | | ============================================= | | cnum cname city rating snum | | ------ -------- ------ ---- ------ | | 2002 Giovanni Rome 200 1003 | | 2004 Grass Berlin 300 1002 | | | ============================================= Рисунок 5. 7: SELECT использует LIKE с % LIKE может быть удобен если вы ищете имя или другое значение, и если вы не помните как они точно пишутся. Предположим что вы неуверены как записано по буквам имя одного из ваших продавцов Peal или Peel. Вы мо- жете просто использовать ту часть которую вы знаете и групповые симво- лы чтобы находить все возможные пары (вывод этого запроса показывает- ся в Рисунке 5.8): SELECT * FROM Salespeople WHERE sname LIKE 'P _ _ l %'; Групповые символы подчеркивания, каждый из которых представляет один символ, добавят только два символа к уже существующим 'P' и 'l', поэ- тому имя наподобии Prettel не может быть показано. Групповой символ ' % ' - в конце строки необходим в большинстве реализаций если длина по- ля sname больше чем число символов в имени Peel (потому что некоторые другие значения sname - длиннее чем четыре символа). В таком случае, значение поля sname, фактически сохраняемое как имя Peel, сопровожда- ется рядом пробелов. Следовательно, символ 'l' не будет рассматривать- ся концом строки. Групповой символ ' % ' - просто соответствует этим пробелам. Это необязательно, если поля sname имеет тип - VARCHAR. =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE sname LIKE ' P 1% '; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | | =============================================== Рисунок 5.8: SELECT использует LIKE с подчеркиванием (_) А что же Вы будете делать если вам нужно искать знак процента или знак подчеркивания в строке? В LIKE предикате, вы можете определить любой одиночный символ как символ ESC. Символ ESC используется сразу перед процентом или подчеркиванием в предикате, и означает что процент или подчеркивание будет интерпретироваться как символ а не как группо- вой символ. Например, мы могли бы найти наш sname столбец где присутс- твует подчеркивание, следующим образом: SELECT * FROM Salespeople WHERE sname LIKE '%/_%'ESCAPE'/'; С этими данными не будет никакого вывода, потому что мы не включили никакого подчеркивания в имя нашего продавца. Предложение ESCAPE опре- деляет '/ ' как символ ESC. Символ ESC используемый в LIKE строке, сопровождается знаком процента, знаком подчеркивания, или знаком ESCA- PE, который будет искаться в столбце, а не обрабатываться как группо- вой символ. Символ ESC должен быть одиночным символом и применяться только к одиночному символу сразу после него. В примере выше, символ процента начала и символ процента окончания обрабатываются как групповые символы; только подчеркивание предостав- лено само себе. Как упомянуто выше, символ ESC может также использоваться самостоя- тельно. Другими словами, если вы будете искать столбец с вашим симво- лом ESC, вы просто вводите его дважды. Во-первых это будет означать что символ ESC "берет следующий символ буквально как символ", и во-вторых что символ ESC самостоятелен. Имеется предыдущий пример который пересмотрен чтобы искать местонахождение строки '_/' в sname столбце: SELECT * FROM Salespeople WHERE sname LIKE ' % /_ / / %'ESCAPE'/'; Снова не будет никакого вывода с такими данными. Строка сравнивается с содержанием любой последовательности символов (%), сопровождаемых символом подчеркивания (/_), символом ESC (//), и любой последова- тельностью символов в конце строки (%). РАБОТА С НУЛЕВЫМИ(NULL) ЗНАЧЕНИЯМИ Часто, будут иметься записи в таблице которые не имеют никаких зна- чений для каждого поля, например потому что информация не завершена, или потому что это поле просто не заполнялось. SQL учитывает такой ва- риант, позволяя вам вводить значение NULL(ПУСТОЙ) в поле, вместо зна- чения. Когда значение поля равно NULL, это означает, что программа ба- зы данных специально промаркировала это поле как не имеющее никакого значения для этой строки (или записи). Это отличается от просто назна- чения полю, значения нуля или пробела, которые база данных будет обра- батывать также как и любое другое значение. Точно также, как NULL не является техническим значением, оно не имеет и типа данных. Оно может помещаться в любой тип поля. Тем ни менее, NULL в SQL часто упоминает- ся как нуль. Предположим, что вы получили нового заказчика который еще не был назначен продавцу. Чем ждать продавца к которому его нужно назначить, вы можете ввести заказчика в базу данных теперь же, так что он не по- теряется при перестановке. Вы можете ввести строку для заказчика со значением NULL в поле snum и заполнить это поле значением позже, когда продавец будет назначен. ========== NULL ОПЕРАТОР ========= Так как NULL указывает на отсутствие значения, вы не можете знать каков будет результат любого сравнения с использованием NULL. Когда NULL сравнивается с любым значением, даже с другим таким же NULL, ре- зультат будет ни верным ни неверным, он - неизвестен. Неизвестный Бу- лев, вообще ведет себя также как неверная строка, которая произведя неизвестное значение в предикате не будет выбрана запросом - имейте ввиду что в то время как NOT(неверное) - равняется верно, NOT (неиз- вестное) - равняется неизвестно. Следовательно, выражение типа 'city = NULL' или 'city IN (NULL)' бу- дет неизвестно, независимо от значения city. Часто вы должны делать различия между неверно и неизвестно - между строками содержащими значения столбцов которые не соответствуют усло- вию предиката и которые содержат NULL в столбцах. По этой причине, SQL предоставляет специальный оператор IS, который используется с ключевым словом NULL, для размещения значения NULL. Найдем все записи в нашей таблице Заказчиков с NULL значениями в ci- ty столбце: SELECT * FROM Customers WHERE city IS NULL; Здесь не будет никакого вывода, потому что мы не имеем никаких зна- чений NULL в наших типовых таблицах. Значения NULL - очень важны, и мы вернемся к ним позже. ИСПОЛЬЗОВАНИЕ NOT СО СПЕЦИАЛЬНЫМИ ОПЕРАТОРАМИ Специальные операторы которые мы изучали в этой главе могут немед- ленно предшествовать Булеву NOT. Он противоположен реляционным операторам, которые должны иметь опе- ратор NOT - вводимым выражением. Например, если мы хотим устранить NULL из нашего вывода, мы будем использовать NOT чтобы изменить на противоположное значение предиката: SELECT * FROM Customers WHERE city NOT NULL; При отсутствии значений NULL(как в нашем случае), будет выведена вся таблица Заказчиков. Аналогично можно ввести следующее SELECT * FROM Customers WHERE NOT city IS NULL; - что также приемлемо. Мы можем также использовать NOT с IN: SELECT * FROM Salespeople WHERE city NOT IN ('London', 'San Jose'); А это - другой способ подобного же выражения SELECT * FROM Salespeople WHERE NOT city IN ('London', ' San Jose'); Вывод для этого запроса показывается в Рисунке 5.9. Таким же способом Вы можете использовать NOT BETWEEN и NOT LIKE. =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE sity NOT IN ('London', 'San Jose'; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1003 Rifkin Barcelona 0.15 | | 1007 Axelrod New York 0.10 | | | =============================================== Рисунок 5. 9: Использование NOT с IN =============== РЕЗЮМЕ ================ Теперь вы можете создавать предикаты в терминах связей специально определенных SQL. Вы можете искать значения в определенном диапазоне (BETWEEN) или в числовом наборе (IN), или вы можете искать символьные значения которые соответствуют тексту внутри параметров (LIKE). Вы также изучили некоторые вещи относительно того как SQL поступает при отсутствии данных - что реальность мировой базы данных - используя NULL вместо конкретных значений. Вы можете извлекать или исключать значения NULL из вашего вывода используя оператор IS NULL. Теперь, когда вы имеете в вашем распоряжении весь набор стандартных математи- ческих и специальных операторов, вы можете переходить к специальным функциям SQL которые работают на всех группах значений, а не просто на одиночном значении, что важно. Это уже тема Главы 6. ************** РАБОТА С SQL ************** 1. Напишите два запроса которые могли бы вывести все порядки на 3 или 4 Октября 1990 2. Напишите запрос который выберет всех заказчиков обслуживаемых про- давцами Peel или Motika. (Подсказка: из наших типовых таблиц, поле snum связывает вторую таблицу с первой) 3. Напишите запрос, который может вывести всех заказчиков чьи имена начинаются с буквы попадающей в диапазон от A до G. 4. Напишите запрос который выберет всех пользователей чьи имена начи- наются с буквы C. 5. Напишите запрос который выберет все порядки имеющие нулевые значе- ния или NULL в поле amt(сумма). (См. Приложение A для ответов.) 6. ОБОБЩЕНИЕ ДАННЫХ С ПОМОЩЬЮ АГРЕГАТНЫХ ФУНКЦИЙ В ЭТОЙ ГЛАВЕ, ВЫ ПЕРЕЙДЕТЕ ОТ ПРОСТОГО использования запросов к изв- лечению значений из базы данных и определению, как вы можете использо- вать эти значения чтобы получить из них информацию. Это делается с по- мощью агрегатных или общих функций которые берут группы значений из поля и сводят их до одиночного значения. Вы узнаете как использовать эти функции, как определить группы значений к которым они будут приме- няться, и как определить какие группы выбираются для вывода. Вы будете также видеть при каких условиях вы сможете объединить значения поля с этой полученной информацией в одиночном запросе. ==== ЧТО ТАКОЕ АГРЕГАТНЫЕ ФУНКЦИИ? ===== Запросы могут производить обобщенное групповое значение полей точно также как и значение одного поля. Это делает с помощью агрегатых функ- ций. Агрегатные функции производят одиночное значение для всей группы таблицы. Имеется список этих функций: * COUNT производит номера строк или не-NULL значения полей которые выбрал запрос. * SUM производит арифметическую сумму всех выбранных значений данного поля. * AVG производит усреднение всех выбранных значений данного поля. * MAX производит наибольшее из всех выбранных значений данного поля. * MIN производит наименьшее из всех выбранных значений данного поля. КАК ИСПОЛЬЗОВАТЬ АГРЕГАТНЫЕ ФУНКЦИИ? Агрегатные функции используются подобно именам полей в предложении SELECT запроса, но с одним исключением, они берут имена поля как аргу- менты. Только числовые поля могут использоваться с SUM и AVG. С COUNT, MAX, и MIN, могут использоваться и числовые или символьные поля. Когда они используются с символьными полями, MAX и MIN будут транслировать их в эквивалент ASCII, который должен сообщать, что MIN будет означать первое, а MAX последнее значение в алфавитном порядке(выдача алфавит- ного упорядочения обсуждается более подробно в Главе 4). Чтобы найти SUM всех наших покупок в таблицы Порядков, мы можем ввести следующий запрос, с его выводом в Рисунке 6.1: SELECT SUM ((amt)) FROM Orders; =============== SQL Execution Log ============ | | | SELECT SUM (amt) | | FROM Orders; | | ==============================================| | | | ------- | | 26658.4 | | | | | =============================================== Рисунок 6.1: Выбор суммы Это конечно, отличается от выбора поля при котором возвращается оди- ночное значение, независимо от того сколько строк находится в таблице. Из-за этого, агрегатные функции и поля не могут выбираться одновремен- но, пока предложение GROUP BY (описанное далее) не будет использовано. Нахождение усредненой суммы - это похожая операция (вывод следующего запроса показывается в Рисунке 6.2): SELECT AVG (amt) FROM Orders; =============== SQL Execution Log ============ | | | SELECT AVG (amt) | | FROM Orders; | | ==============================================| | | | ------- | | 2665.84 | | | | | =============================================== Рисунок 6.2: Выбор среднего СПЕЦИАЛЬНЫЕ АТРИБУТЫ COUNT Функция COUNT несколько отличается от всех. Она считает число значе- ний в данном столбце, или число строк в таблице. Когда она считает значения столбца, она используется с DISTINCT чтобы производить счет чисел различных значений в данном поле. Мы могли бы использовать ее, например, чтобы сосчитать номера продавцов в настоящее время описаных в таблице Порядков (вывод показывается в Рисунке 6.3): SELECT COUNT (DISTINCT snum) FROM Orders; ИСПОЛЬЗОВАНИЕ DISTINCT Обратите внимание в вышеупомянутом примере, что DISTINCT, сопровож- даемый именем поля с которым он применяется, помещен в круглые скобки, но не сразу после SELECT, как раньше. Этого использования DISTINCT с COUNT применяемого к индивидуальным столбцам, требует стандарт ANSI, но большое количество программ не предъявляют к ним такого требования. =============== SQL Execution Log ============ | | | SELECT COUNT (DISTINCT snum) | | FROM Orders; | | ==============================================| | | | ------- | | 5 | | | | | =============================================== Рисунок 6.3: Подсчет значений поля Вы можете выбирать многочисленые счета(COUNT) из полей с помощью DISTINCT в одиночном запросе который, как мы видели в Главе 3, не вы- полнялся когда вы выбирали строки с помощью DISTINCT. DISTINCT может использоваться таким образом, с любой функцией агрегата, но наиболее часто он используется с COUNT. С MAX и MIN, это просто не будет иметь никакого эффекта, а SUM и AVG, вы обычно применяете для включения пов- торяемых значений, так как они законно эффективнее общих и средних значений всех столбцов. ИСПОЛЬЗОВАНИЕ COUNT СО СТРОКАМИ, А НЕ ЗНАЧЕНИЯМИ Чтобы подсчитать общее число строк в таблице, используйте функцию COUNT со звездочкой вместо имени поля, как например в следующем приме- ре, вывод из которого показан на Рисунке 6.4: SELECT COUNT (*) FROM Customers COUNT со звездочкой включает и NULL и дубликаты, по этой причине DISTINCT не может быть использован. DISTINCT может производить более высокие номера чем COUNT особого поля, который удаляет все =============== SQL Execution Log ============ | | | SELECT COUNT (*) | | FROM Customers; | | ==============================================| | | | ------- | | 7 | | | | | =============================================== Рисунок 6. 4: Подсчет строк вместо значений строки, имеющие избыточные или NULL данные в этом поле. DISTINCT не применим c COUNT (*), потому, что он не имеет никакого действия в хорошо разработаной и поддерживаемой базе данных. В такой базе данных, не должно быть ни таких строк, которые бы являлись пол- ностью пустыми, ни дубликатов (первые не содержат никаких данных, а последние полностью избыточны). Если, с другой стороны, все таки име- ются полностью пустые или избыточные строки, вы вероятно не захотите чтобы COUNT скрыл от вас эту информацию. ВКЛЮЧЕНИЕ ДУБЛИКАТОВ В АГРЕГАТНЫЕ ФУНКЦИИ Агрегатные функции могут также (в большинстве реализаций) исполь- зовать аргумент ALL, который помещается перед именем поля, подобно DISTINCT, но означает противоположное: - включать дубликаты. ANSI тех- нически не позволяет этого для COUNT, но многие реализации ослабляют это ограничение. Различия между ALL и * когда они используются с COUNT - * ALL использует имя_поля как аргумент. * ALL не может подсчитать значения NULL. Пока * является единственым аргументом который включает NULL значе- ния, и он используется только с COUNT; функции отличные от COUNT игно- рируют значения NULL в любом случае. Следующая команда подсчитает(CO- UNT) число не-NULL значений в поле rating в таблице Заказчиков (вклю- чая повторения): SELECT COUNT (ALL rating) FROM Customers; АГРЕГАТЫ ПОСТРОЕННЫЕ НА СКАЛЯРНОМ ВЫРАЖЕНИИ До этого, вы использовали агрегатные функции с одиночными полями как аргументами. Вы можете также использовать агрегатные функции с аргу- ментами которые состоят из скалярных выражений включающих одно или бо- лее полей. (Если вы это делаете, DISTINCT не разрешается.) Предполо- жим, что таблица Порядков имеет еще один столбец который хранит преды- дущий неуплаченый баланс (поле blnc) для каждого заказчика. Вы должны найти этот текущий баланс, добавлением суммы приобретений к предыдуще- му балансу. Вы можете найти наибольший неуплаченый баланс следующим образом: SELECT MAX (blnc + (amt)) FROM Orders; Для каждой строки таблицы, этот запрос будет складывать blnc и amt для этого заказчика и выбирать самое большое значение которое он най- дет. Конечно, пока заказчики могут иметь многочисленые порядки, их не- уплаченый баланс оценивается отдельно для каждого порядка. Возможно, порядок с более поздней датой будет иметь самый большой неуплаченый баланс. Иначе, старый баланс должен быть выбран как в запросе выше. Фактически, имеются большое количество ситуаций в SQL где вы можете использовать скалярные выражения с полями или вместо полей, как вы увидете это в Главе 7. ПРЕДЛОЖЕНИЕ GROUP BY Предложение GROUP BY позволяет вам определять подмножество значений в особом поле в терминах другого поля, и применять функцию агрегата к подмножеству. Это дает вам возможность объединять поля и агрегатные функции в едином предложении SELECT. Например, предположим что вы хо- тите найти наибольшую сумму приобретений полученную каждым продавцом. Вы можете сделать раздельный запрос для каждого из них, выбрав MAX (amt) из таблицы Порядков для каждого значения поля snum. GROUP BY, однако, позволит Вам поместить их все в одну команду: SELECT snum, MAX (amt) FROM Orders GROUP BY snum; Вывод для этого запроса показывается в Рисунке 6.5. =============== SQL Execution Log ============== | | | SELECT snum, MAX (amt) | | FROM Orders | | GROUP BY snum; | | =============================================== | | snum | | ------ -------- | | 1001 767.19 | | 1002 1713.23 | | 1003 75.75 | | 1014 1309.95 | | 1007 1098.16 | | | ================================================ Рисунок 6.5: Нахождение максимальной суммы продажи у каждого продавца GROUP BY применяет агрегатные функции независимо от серий групп ко- торые определяются с помощью значения поля в целом. В этом случае, каждая группа состоит из всех строк с тем же самым значением поля snum, и MAX функция применяется отдельно для каждой такой группы. Это значение поля, к которому применяется GROUP BY, имеет, по определению, только одно значение на группу вывода, также как это делает агрегатная функция. Результатом является совместимость которая позволяет агрега- там и полям объединяться таким образом. Вы можете также использовать GROUP BY с многочислеными полями. Со- вершенствуя вышеупомянутый пример далее, предположим что вы хотите увидеть наибольшую сумму приобретений получаемую каждым продавцом каж- дый день. Чтобы сделать это, вы должны сгруппировать таблицу Порядков по датам продавцов, и применить функцию MAX к каждой такой группе, по- добно этому: SELECT snum, odate, MAX ((amt)) FROM Orders GROUP BY snum, odate; Вывод для этого запроса показывается в Рисунке 6.6. =============== SQL Execution Log ============== | | | SELECT snum, odate, MAX (amt) | | FROM Orders | | GROUP BY snum, odate; | | =============================================== | | snum odate | | ------ ---------- -------- | | 1001 10/03/1990 767.19 | | 1001 10/05/1990 4723.00 | | 1001 10/06/1990 9891.88 | | 1002 10/03/1990 5160.45 | | 1002 10/04/1990 75.75 | | 1002 10/06/1990 1309.95 | | 1003 10/04/1990 1713.23 | | 1014 10/03/1990 1900.10 | | 1007 10/03/1990 1098.16 | | | ================================================ Рисунок 6.6: Нахождение наибольшей суммы приобретений на каждый день Конечно же, пустые группы, в дни когда текущий продавец не имел по- рядков, не будут показаны в выводе. ПРЕДЛОЖЕНИЕ HAVING Предположим, что в предыдущем примере, вы хотели бы увидеть только максимальную сумму приобретений значение которой выше $3000.00. Вы не сможете использовать агрегатную функцию в предложении WHERE (если вы не используете подзапрос, описанный позже), потому что предикаты оце- ниваются в терминах одиночной строки, а агрегатные функции оцениваются в терминах групп строк. Это означает что вы не сможете сделать что-ни- будь подобно следующему: SELECT snum, odate, MAX (amt) FROM Oreders WHERE MAX ((amt)) > 3000.00 GROUP BY snum, odate; Это будет отклонением от строгой интерпретации ANSI. Чтобы увидеть максимальную стоимость приобретений свыше $3000.00, вы можете исполь- зовать предложение HAVING. Предложение HAVING определяет критерии используемые чтобы удалять определенные группы из вывода, точно также как предложение WHERE дела- ет это для индивидуальных строк. Правильной командой будет следующяя: SELECT snum, odate, MAX ((amt)) FROM Orders GROUP BY snum, odate HAVING MAX ((amt)) > 3000.00; Вывод для этого запроса показывается в Рисунке 6. 7. =============== SQL Execution Log ============== | | | SELECT snum, odate, MAX (amt) | | FROM Orders | | GROUP BY snum, odate | | HAVING MAX (amt) > 3000.00; | | =============================================== | | snum odate | | ------ ---------- -------- | | 1001 10/05/1990 4723.00 | | 1001 10/06/1990 9891.88 | | 1002 10/03/1990 5160.45 | | | ================================================ Рисунок 6. 7: Удаление групп агрегатных значений Аргументы в предложении HAVING следуют тем же самым правилам что и в предложении SELECT, состоящей из команд использующих GROUP BY. Они должны иметь одно значение на группу вывода. Следующая команда будет запрещена: SELECT snum, MAX (amt) FROM Orders GROUP BY snum HAVING odate = 10/03/1988; Поле оdate не может быть вызвано предложением HAVING, потому что оно может иметь (и действительно имеет) больше чем одно значение на группу вывода. Чтобы избегать такой ситуации, предложение HAVING долж- но ссылаться только на агрегаты и поля выбранные GROUP BY. Имеется правильный способ сделать вышеупомянутый запрос(вывод показывается в Рисунке 6.8): SELECT snum, MAX (amt) FROM Orders WHEREodate = 10/03/1990 GROUP BY snum; =============== SQL Execution Log ============== | | | SELECT snum, odate, MAX (amt) | | FROM Orders | | GROUP BY snum, odate; | | =============================================== | | snum | | ------ -------- | | 1001 767.19 | | 1002 5160.45 | | 1014 1900.10 | | 1007 1098.16 | | | ================================================ Рисунок 6.8: Максимальное значение суммы приобретений у каждого продавца на 3 Октября Поскольку поля odate нет, не может быть и выбраных полей, значение этих данных меньше чем в некоторых других примерах. Вывод должен веро- ятно включать что-нибудь такое что говорит - " это - самые большие по- рядки на 3 Октября." В Главе 7, мы покажем как вставлять текст в ваш вывод. Как и говорилось ранее, HAVING может использовать только аргументы которые имеют одно значение на группу вывода. Практически, ссылки на агрегатные функции - наиболее общие, но и поля выбранные с помощью GROUP BY также допустимы. Например, мы хотим увидеть наибольшие поряд- ки для Serres и Rifkin: SELECT snum, MAX (amt) FROM Orders GROUP BY snum HAVING snum B (1002,1007); Вывод для этого запроса показывается в Рисунке 6.9. =============== SQL Execution Log ============== | | | SELECT snum, MAX (amt) | | FROM Orders | | GROUP BY snum | | HAVING snum IN (1002, 1007); | | =============================================== | | snum | | ------ -------- | | 1002 5160.45 | | 1007 1098.16 | | | ================================================ Рисунок 6. 9: Использование HAVING с GROUP BY полями НЕ ДЕЛАЙТЕ ВЛОЖЕННЫХ АГРЕГАТОВ В строгой интерпретации ANSI SQL, вы не можете использовать агрегат агрегата. Предположим что вы хотите выяснять, в какой день имелась на- ибольшая сумма приобретений. Если вы попробуете сделать это, то ваша SELECT odate, MAX (SUM (amt)) FROM Orders GROUP BY odate; команда будет вероятно отклонена. (Некоторые реализации не предписы- вают этого ограничения, которое является выгодным, потому что вложен- ные агрегаты могут быть очень полезны, даже если они и несколько проб- лематичны.) В вышеупомянутой команде, например, SUM должен применяться к каждой группе поля odate, а MAX ко всем группам, производящим оди- ночное значение для всех групп. Однако предложение GROUP BY подразуме- вает что должна иметься одна строка вывода для каждой группы поля oda- te. =============== РЕЗЮМЕ ================ Теперь вы используете запросы несколько по-другому. Способность по- лучать, а не просто размещать значения, очень мощна. Это означает что вы не обязательно должны следить за определенной информацией если вы можете сформулировать запрос так чтобы ее получить. Запрос будет да- вать вам по-минутные результаты, в то время как таблица общего или среднего значений будет хороша только некоторое время после ее модифи- кации. Это не должно наводить на мысль, что агрегатные функции могут полностью вытеснить потребность в отслеживании информации такой напри- мер как эта. Вы можете применять эти агрегаты для групп значений определенных предложением GROUP BY. Эти группы имеют значение поля в целом, и могут постоянно находиться внутри других групп которые имеют значение поля в целом. В то же время, предикаты еще используются чтобы определять ка- кие строки агрегатной функции применяются. Объединенные вместе, эти особенности делают возможным, производить агрегаты основанные на сильно определенных подмножествах значений в поле. Затем вы можете определять другое условие для исключения опреде- ленных результатов групп с предложением HAVING. Теперь, когда вы стали знатоком большого количества того как запрос производит значения, мы покажем вам, в Главе 7, некоторые вещи которые вы можете делать со значениями которые он производит. ************** РАБОТА С SQL ************** 1. Напишите запрос который сосчитал бы все суммы приобретений на 3 Ок- тября. 2. Напишите запрос который сосчитал бы число различных не-NULL значе- ний поля city в таблице Заказчиков. 3. Напишите запрос который выбрал бы нименьшую сумму для каждого за- казчика. 4. Напишите запрос который бы выбирал заказчиков в алфавитном порядке, чьи имена начинаются с буквы G. 5. Напишите запрос который выбрал бы высшую оценку в каждом городе. 6. Напишите запрос который сосчитал бы число заказчиков регистрирующих каждый день свои порядки. (Если продавец имел более одного порядка в данный день, он должен учитываться только один раз.) (См. Приложение A для ответов.) 7. ФОРМИРОВАНИЕ ВЫВОДОВ ЗАПРОСОВ ЭТА ГЛАВА РАСШИРИТ ВАШИ ВОЗМОЖНОСТИ в работе с выводом который про- изводит запрос. Вы узнаете как вставлять текст и константы между выб- ранных полей, как использовать выбранные поля в математических выраже- ниях, чьи результаты затем становятся выводом, и как сделать чтобы ва- ши значения выводились в определенном порядке. Эта последняя особен- ность включена, чтобы упорядочивать ваш вывод по любым столбцам, любым полученным значениям этого столбца, или по обеим. =========== СТРОКИ И ВЫРАЖЕНИЯ ============ Большинство основанных на SQL баз данных предоставляют специальные средства позволяющие Вам совершенствовать вывод ваших запросов. Конеч- но, они претерпевают значительные изменения от программы к программе, и их обсуждение здесь не входит в наши задачи, однако, имеются пять особенностей созданых в стандарте SQL которые позволяют вам делать больше чем просто вывод значений полей и агрегатных данных. СКАЛЯРНОЕ ВЫРАЖЕНИЕ С ПОМОЩЬЮ ВЫБРАННЫХ ПОЛЕЙ Предположим что вы хотите выполнять простые числовые вычисления дан- ных чтобы затем помещать их в форму больше соответствующую вашим пот- ребностям. SQL позволяет вам помещать скалярные выражения и константы среди выбраных полей. Эти выражения могут до



Дата публикования: 2014-11-03; Прочитано: 443 | Нарушение авторского права страницы



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...