Перейти к оглавлению
2. SQL : ОБЗОР.
ЭТА ГЛАВА ПОЗАКОМИТ ВАС СО СТРУКТУРОЙ SQL языка а также с определен-
ными общими выводами, такими как тип данных которые эти поля могут со-
держать и некоторые области неоднозначностей которые существуют в SQL.
Она педназначена обеспечить связь с более конкретной информацией в
последующих главах. Вы не должны запоминать каждую подробность упомя-
нутую в этой главе. Краткий обзор представлен здесь в одной удобно
размещеной области, многие подробности которой вы можете иметь чтобы в
последствии ссылаться к ним по мере овладения языком. Мы поместили все
это в начало книги чтобы ориентировать вас на мир SQL без упрощенного
подхода к его проблемам и в тоже время дать Вам привычные в будущем
места для ссылки к ним когда у Вас появятся вопросы. Этот материал мо-
жет стать более понятным когда мы перейдем к описанию конкретных ко-
манд SQL, начинающихся с Главы 3.
========= КАК РАБОТАЕТ SQL? ==========
SQL это язык ориентированный специально на реляционные базы данных.
Он устраняет много работы которую вы должны были бы сделать если бы вы
использовали универсальный язык программирования, напрмер C. Чтобы
сформировать реляционную базу данных на C, вам необходимо было бы на-
чать с самого начала. Вы должны были бы определить объект - называемый
таблицей которая могла бы расти чтобы иметь любое число строк, а затем
создавать постепенно процедуры для помещения значений в нее и извлече-
ния из них. Если бы вы захотели найти некоторые определенные строки,
вам необходимо было бы выполнить по шагам процедуру, подобную следую-
щей :
1. Рассмотрите строку таблицы.
2. Выполните проверку - является ли эта строка одной из строк кото-
рая вам нужна.
3. Если это так, сохраните ее где-нибудь пока вся таблица не будет
проверена.
4. Проверьте имеются ли другие строки в таблице.
5. Если имеются, возвратитесь на шаг 1.
6. Если строк больше нет, вывести все значения сохраненные в шаге 3.
( Конечно, это не фактический набор C команд, а только логика шагов
которые должны были бы быть включены в реальную программу. ) SQL сэко-
номит вам все это. Команды в SQL могут работать со всеми группами таб-
лиц как с единым объектом и могут обрабатывать любое количество инфор-
мации извлеченной или полученной из их, в виде единого модуля.
ЧТО ДЕЛАЕТ ANSI ?
Как мы уже рассказывали в Введении, стандарт SQL определяется с по-
мощью кода ANSI (Американский Национальный Институт Стандартов ). SQL
не изобретался ANSI. Это по существу изобретение IBM. Но другие компа-
нии подхватили SQL сразу же, по крайней мере одна компания (Oracle)
отбила у IBM право на рыночную продажу SQL продуктов.
После того как появился ряд конкурирующих программ SQL на рынке, AN-
SI определил стандарт к которому они должны быть приведены (определе-
ние таких стандартов и является функцией ANSI ).
Однако после этого, появились некоторые проблемы. Возникли они в ре-
зультате стандартизации ANSI ввиде некоторых ограничений. Так как не
всегда ANSI определяет то что является наиболее полезным, то программы
пытаются соответствовать стандарту ANSI не позволяя ему ограничивать
их слишком сильно. Это, в свою очередь, ведет к случайным несогласо-
ванностям. Программы Баз Данных обычно дают ANSI SQL дополнительные
особенности и часто ослабляют многие ограничения из большинства из
них.
Следовательно, общие разновидности ANSI будут также рассмотрены. Хо-
тя мы очевидно не сможем объять каждое исключение или разновидность,
удачные идеи имеют тенденцию к внедрению и использованию в различных
программах даже когда они не определены стандартом ANSI.
ANSI - это вид минимального стандарта и вы можете делать больше чем
он позволяет, хотя и должны выполнять его указания при выполнении за-
дач которые он определяет.
ИНТЕРАКТИВНЫЙ И ВЛОЖЕННЫЙ SQL
Имеются два SQL: Интерактивный и Вложенный. Большей частью, обе фор-
мы работают одинаково, но используются различно. Интерактивный SQL ис-
пользуется для функционирования непосредственно в базе данных чтобы
производить вывод для использования его заказчиком. В этой форме SQL,
когда вы введете команду, она сейчас же выполнится и вы сможете уви-
деть вывод (если он вообще получится) - немедленно.
Вложенный SQL состоит из команд SQL помещенных внутри программ, ко-
торые обычно написаны на некотором другом языке (типа КОБОЛА или Пас-
каля).
Это делает эти программы более мощными и эффективным. Однако, допус-
кая эти языки, приходится иметь дело с структурой SQL и стилем управ-
ления данных который требует некоторых расширений к интерактивному
SQL. Передача SQL команд во вложенный SQL является выдаваемой ("passed
off") для переменных или параметров используемых программой в которую
они были вложены.
В этой книге, мы будем представлять SQL в интерактивной форме. Это
даст нам возможность обсуждать команды и их эффекты не заботясь о том
как они связаны с помощью интерфейса с другими языками. Интерактивный
SQL - это форма наиболее полезная непрограммистам. Все что вы узнаете
относительно интерактивного SQL в основном применимо и к вложенной
форме. Изменения необходимые для использования вложенной формы будут
использованы в последней главе этой книги.
СУБПОДРАЗДЕЛЕНИЯ SQL
И в интерактивной и во вложенной формах SQL, имеются многочисленные
части, или субподразделения. Так как вы вероятно сталкнетесь с этой
терминологией при чтении SQL, мы дадим некоторые пояснения.
К сожалению, эти термины не используются повсеместно во всех реали-
зациях. Они подчеркиваются ANSI и полезны на концептуальном уровне, но
большинство SQL программ практически не обрабатывают их отдельно, так
что они по существу становятся функциональными категориями команд SQL.
DDL ( Язык Определения Данных ) - так называемый Язык Описания Схемы
в ANSI, состоит из команд которые создают объекты ( таблицы, индексы,
просмотры, и так далее ) в базе данных.
DML (Язык Манипулирования Данными) - это набор команд которые опре-
деляют какие значения представлены в таблицах в любой момент времени.
DCD (Язык Управления Данными) состоит из средств которые определяют,
разрешить ли пользователю выполнять определенные действия или нет.
Они являются составными частями DDL в ANSI. Не забывайте эти имена.
Это не различные языки, а разделы команд SQL сгруппированных по их
функциям.
======== РАЗЛИЧНЫЕ ТИПЫ ДАННЫХ ========
Не все типы значений которые могут занимать поля таблицы - логически
одинаковые. Наиболее очевидное различие - между числами и текстом. Вы
не можете помещать числа в алфавитном порядке или вычитать одно имя из
другого. Так как системы с реляционной базой данных базируются на свя-
зях между фрагментами информации, различные типы данных должны понятно
отличаться друга от друга, так чтобы соответствующие процессы и срав-
нения. могли быть в них выполнены.
В SQL, это делается с помощью назначения каждому полю - типа данных
который укаазывает на тип значения которое это поле может содержать.
Все значения в данном поле должны иметь одинаковый тип. В таблице За-
казчиков, например, cname и city - содержат строки текста для оценки,
snum, и cnum - это уже номера. По этой причине, вы не можете ввести
значение Highest(Наивысший) или значение None(Никакой) в поле rating,
которое имеет числовой тип данных. Это ограничение удачно, так как оно
налагает некоторую структурность на ваши данные. Вы часто будете срав-
нивать некоторые или все значения в данном поле, поэтому вы можете вы-
полнять действие только на определенных строках а не на всех. Вы не
могли бы сделать этого если бы значения полей имели смешанный тип дан-
ных.
К сожалению, определение этих типов данных является основной об-
ластью в которой большинство коммерческих программ баз данных и офици-
альный стандарт SQL, не всегда совпадают. ANSI SQL стандарт распознает
только текст и тип номера, в то время как большинство коммерческих
программ используют другие специальные типы. Такие как, DATA(ДАТА) и
TIME(ВРЕМЯ) - фактически почти стандартные типы( хотя точный формат их
меняется ). Некоторые пакеты также поддерживают такие типы, как напри-
мер MONEY(ДЕНЬГИ) и BINARY (ДВОИЧНЫЕ). (MONEY - это специальная систе-
ма исчисления используемая компьютерами. Вся информация в компьютере
передается двоичными числами и затем преобразовываются в другие систе-
мы, что бы мы могли легко использовать их и понимать.)
ANSI определяет несколько различных типов значений чисел, различия
между которыми - довольно тонки и иногда их путают. Разрешенные ANSI
типы данных перечислены в Приложении B.
Сложность числовых типов ANSI можно, по крайней мере частично,объяс-
нить усилием сделать вложенный SQL, совместимым с рядом других языков.
Два типа чисел ANSI , INTEGER(ЦЕЛОЕ ЧИСЛО) и DECIMAL (ДЕСЯТИЧНОЕ
ЧИСЛО) ( которые можно сокращать как INT и DEC, соответственно ), бу-
дут адекватны для наших целей, также как и для целей большинства прак-
тических деловых прикладных программ. Естественно, что тип ЦЕЛОЕ можно
представить как ДЕСЯТИЧНОЕ ЧИСЛО которое не содержит никаких цифр
справа от десятичной точки.
Тип для текста - CHAR ( или СИМВОЛ ), который относится к строке
текста. Поле типа CHAR имеет определенную длину, которая определяется
максимальным числом символов которые могут быть введены в это поле.
Больше всего реализаций также имеют нестандартный тип называемый VARC-
HAR(ПЕРЕМЕННОЕ ЧИСЛО СИМВОЛОВ), который является текстовой строкой ко-
торая может иметь любую длину до определенного реализацией максимума
(обычно 254 символа ). CHARACTER и VARCHAR значения включаются в оди-
ночные кавычки как "текст". Различие между CHAR и VARCHAR в том, что
CHAR должен резервировать достаточное количество памяти для максималь-
ной длины строки, а VARCHAR распределяет память так как это необходи-
мо.
Символьные типы состоят из всех печатных символов, включая числа.
Однако, номер 1 не то же что символ "1". Символ "1" - только другой
печатный фрагмент текста, не определяемый системой как наличие число-
вого значения 1. Например 1 + 1 = 2, но "1" + "1" не равняется "2".
Символьные значения сохраняются в компьютере как двоичные значения, но
показываются пользователю как печатный текст. Преобразование следует
за форматом определяемым системой которую вы используете. Этот формат
преобразования будет одним из двух стандартных типов (возможно с рас-
ширениями) используемых в компьютерных системах: в ASCII коде ( ис-
пользуемом во всех персональных и малых компьютерах ) и EBCDIC коде
(Расширенном Двоично-Десятичном Коде Объмена Информации) (используемом
в больших компьютерах). Определенные операции, такие как упорядочива-
ние в алфавитном порядке значений поля, будет изменяться вместе с фор-
матом. Применение этих двух форматов будет обсуждаться в Главе 4.
Мы должны следить за рынком, а не ANSI, в использовании типа называ-
емого DATE(ДАТОЙ). ( В системе, которая не распознает тип ДАТА, вы ко-
нечно можете обьявить дату как символьное или числовое поле, но это
сделает большинство операций более трудоемкими. ) Вы должны смотреть
свою документацию по пакету программ которые вы будете использовать,
чтобы выяснить точно, какие типы данных она поддерживает.
SQL НЕСОГЛАСОВАННОСТИ
Вы можете понять из предшествующего обсуждения, что имеются самосто-
ятельные несогласованности внутри продуктов мира SQL. SQL появился из
коммерческого мира баз данных как инструмент, и был позже превращен в
стандарт ANSI. К сожалению, ANSI не всегда определяет наибольшую поль-
зу, поэтому программы пытаются соответствовать стандарту ANSI не поз-
воляя ему ограничивать их слишком сильно. ANSI - вид минимального
стандарта - вы можете делать больше чем он это позволяет, но вы должны
быть способны получить те же самые результаты что и при выполнении той
же самой задачи.
ЧТО ТАКОЕ - ПОЛЬЗОВАТЕЛЬ?
SQL обычно находится в компьютерных системах которые имеют больше
чем одного пользователя, и следовательно должны делать различие между
ними ( ваше семейство PC может иметь любое число пользователей, но оно
обычно не имеет способов чтобы отличвать одного от другого ). Обычно,
в такой системе, каждый пользователь имеет некий вид кода проверки
прав который идентифицирует его или ее (терминология изменяется ). В
начале сеанса с компьютером, пользователь входит в систему (регистри-
руется), сообщая компьютеру кто этот пользователь, идентифицированный
с помощью определенного ID(Идентификатора). Любое колличество людей
использующих тот же самый ID доступа, являются отдельными пользовате-
лями; и аналогично, один человек может представлять большое количество
пользователей ( в разное время ), используя различные доступные Иден-
тификаторы.
SQL следует этому примеру. Действия в большинстве сред SQL приведены
к специальному доступному Идентификатору который точно соответствует
определенному пользователю. Таблица или другой объект принадлежит
пользователю, который имеет над ним полную власть. Пользователь может
или не может иметь привилегии чтобы выполнять действие над объектом.
Для наших целей, мы договоримся, что любой пользователь имеет привиле-
гии необходимые чтобы выполнять любое действие, пока мы не возвратимся
специально к обсуждению привилегий в Главе 22.
Специальное значение - USER(ПОЛЬЗОВАТЕЛЬ) может использоваться как ар-
гумент в команде. Оно указывает на доступный Идентификатор пользовате-
ля, выдавшего команду.
УСЛОВИЯ И ТЕРМИНОЛОГИЯ
Ключевые слова - это слова которые имеют специальное значение в SQL.
Они могут быть командами, но не текстом и не именами объектов. Мы бу-
дем выделять ключевые слова печатая их ЗАГЛАВНЫМИ БУКВАМИ. Вы должны
соблюдать осторожность чтобы не путать ключевые слова с терминами.
SQL имеет определенные специальные термины которые используются что-
бы описывать его. Среди них - такие слова как запрос, предложение, и
предикат, которые являются важнейшими в описании и понимании языка но
не означают что-нибудь самостоятельное для SQL.
Команды, или предложения, являются инструкциями которыми Вы обращае-
тесь к SQL базе данных. Команды состоят из одной или более отдельных
логических частей называемых предложениями. Предложения начинаются
ключевым словом для которого они являются проименованными, и состоят
из ключевых слов и аргументов. Например предложения с которыми вы мо-
жете сталкиваться - это " FROM Salespeope " и " WHERE city = "London".
Аргументы завершают или изменяют значение предложения. В примерах вы-
ше, Salespeople - аргумент, а FROM - ключевое слово предложения FROM.
Аналогично, " city = "London" " - агрумент предложения WHERE. Объекты
- структуры в базе данных которым даны имена и сохраняются в памяти.
Они включают в себя базовые таблицы, представления (два типа таблиц),
и индексы.
Чтобы показать Вам как формируются команды, мы будем делать это на
примерах. Имеется, однако, более формальный метод описания команд ис-
пользующих стандартизированные условные обозначения. Мы будем исполь-
зовать его в более поздних главах, для удобства чтобы понимать эти ус-
ловные обозначения в случае если вы столкнетесь с ним в других SQL до-
кументах. Квадратные скобки ( [ ] ) будут указывать части которые мо-
гут неиспользоваться, а многоточия ( ... ) указывать что все предшест-
вующее им может повторяться любое число раз. Слова обозначенные в уг-
ловых скобках (<>) - специальные термины которые объясняют что они со-
бой представляют. Мы упростили стандартную терминологию SQL значитель-
но, но без ухудшения его понимания.
============== РЕЗЮМЕ ================
Мы быстро прошли основы в этой главе. Но нашим намерением и было -
просто пролететь над основами SQL, так чтобы вы могли понять идею от-
носительно всего объема. Когда мы возвратимся к основе в следующей
главе, некоторые вещи станут более конкретными. Теперь вы знаете
кое-что относительно SQL - какова его структура, как он используется,
как он представляет данные, и как они определяются ( и некоторые не-
согласованности появляющиеся при этом ), и некоторые условные обозна-
чения и термины используемые чтобы описывать их. Все это - много ин-
формации для одной главы; мы не ожидаем что бы вы запомнили все эти
подробности, но вы сможете вернуться позже к ним если понадобится. По
Главе 3, мы будем идти, показывая конкретно, как формируются команды и
что они делают. Мы представим вам команду SQL используемую чтобы изв-
лекать информацию из таблиц, и которая является наиболее широко ис-
пользуемой командой в SQL. К концу этой главы, вы будете способны изв-
лекать конкретную информацию из вашей базы данных с высокой степенью
точности.
************** РАБОТА С SQL **************
1. Какое наибольшее основное различие между типами данных в SQL ?
2. Распознает ANSI тип данных DATA ?
3. Какой подраздел SQL используется чтобы помещать значения в
таблицы ?
4. Что такое - ключевое слово ?
( См. Приложение A для ответов. )
Перейти к оглавлению