Об основаниях ненавигационного языка запросов к
объектно-ориентированным базам данных

Сергей Кузнецов

1. Введение

Вызывающее интерес все большего числа исследователей и разработчиков и активно развивающееся направление объектно-ориентированных баз данных (ООБД) обладает несколькими специфичными характерными чертами. При том, что практически все осознают потребность в ООБД, отсутствует какая-либо общая, повсеместно признанная точка зрения о том, что должны обеспечивать системы управления ООБД (ООСУБД).

В самых общих словах, на уровне общего согласия, ООБД должна содержать классы объектов произвольно сложной структуры, инкапсулирующее поведение. Практически все согласны, что ООСУБД должна поддерживать систему объектно-ориентированного программирования, позволяющую как определять новые классы объектов, так и создавать прикладные системы. Более того, многие рассматривают это как основную черту ООБД - устранение несоответствия между языками программирования и языками БД [1].

Вместе с тем, односторонний взгляд на ООСУБД как на систему объектно-ориентированного программирования, поддерживающую долговременное хранение объектов, не отражает специфику таких систем как систем управления базами данных. Возникающая ситуация в некотором смысле противоположна ситуации с реляционными СУБД, но столь же неудовлетворительна. В случае реляционных систем имеются мощные средства управления БД - непроцедурные языки запросов и манипулирования данными, но программирование прикладных систем происходит с использованием не очень естественных комбинаций языков программирования и языков БД (например, языка Си со встроенным SQL). В большинстве реализованных ООСУБД поддерживается система объектно-ориентированного программирования, но средства запросов к ООБД существенно слабее, чем в реляционных системах.

Очевидные недостатки этой ситуации можно объяснять разными причинами, но прежде всего они кроятся в отсутствии простого и мощного теоретического основания ООБД.

В этой работе я не претендую на создание такого базиса. Рассматриваются лишь некоторые аспекты, которые в будущем, возможно, могли бы послужить основой непроцедурных языков запросов к ООБД. Более точно, памятуя о той роли, которую сыграла реляционная алгебра в истории языков запросов реляционных СУБД, я предлагаю алгебру классов для ООБД. Основная мысль состоит в том, чтобы использовать понятие класса для обеспечения замкнутости алгебры. Подобно тому, как операндами и результатом выражения реляционной алгебры являются отношения, операндами и результатом выражения алгебры классов являются классы. В предлагаемой алгебре используется тот же набор операций, что и в классической реляционной алгебре. Проблема состояла в том, чтобы разработать правильную интерпретацию этих операций в контексте ООБД.

Для разработки алгебры объектов потребовалось уточнить базовые концепции и определения ООБД. Заметим, что ни одно из этих уточнений не является новым: соответствующие идеи неоднократно появлялись в публикациях. Мне не приходилось встречать в публикациях только одну идею - возможность существования в ООБД нескольких классов однотипных объектов.

При реализации непроцедурных языков ООБД возникает ряд вопросов, связанных главным образом с трудностями оптимизации запросов. В существующих системах эта проблема, как правило, решается за счет отказа от инкапсуляции объектов или путем введения существенных ограничений на инкапсуляцию. В данной работе предлагается некоторый подход, дающий возможность выполнять оптимизацию запросов к ООБД без требования ограничения инкапсуляции объектов.

Общая структура статьи следующая. Второй раздел содержит краткий обзор языков запросов к ООБД и методов оптимизации запросов. В третьем разделе приводятся некоторые соображения из области реляционной алгебры, повлиявшие на разработку алгебры классов. В четвертом разделе содержатся основные определения и формулировка алгебры классов. Пятый раздел посвящается оптимизации запросов к ООБД. Шестой раздел - заключение.

2. Языки запросов к ООБД и методы оптимизации

Как отмечают многие исследователи и разработчики (например, [1, 2]), объектно-ориентированная система БД представляет собой объединение системы программирования и СУБД (альтернативная, но не более проясняющая суть дела точка зрения состоит в том, что объектно-ориентированная СУБД - это СУБД, основанная на объектно-ориентированной модели данных [2]).

Мы уже говорили, что основная практическая надобность в ООБД связана с потребностью в некоторой интегрированной среде построения сложных информационных систем. В этой среде должны отсутствовать противоречия между структурной и поведенческой частями проекта и должно поддерживаться эффективное управление сложными структурами данных во внешней памяти. С этой точки зрения языковая среда ООБД - это объектно-ориентированная система программирования, естественно включающая средства работы с долговременными объектами. "Естественность" включения средств работы с БД в язык программирования означает, что работа с долговременными (хранимыми во внешней БД) объектами должна происходить на основе тех же синтаксических конструкций (и с той же семантикой), что и работа со временными, существующими только во время работы программы объектами.

Эта сторона ООБД наиболее близка родственному направлению языков программирования БД [3]. Языки программирования ООБД и БД во многих своих чертах различаются только терминологически; существенным отличием является лишь поддержание в языках первого класса подхода к наследованию классов. Кроме того, языки второго класса, как правило, более развиты как в отношении системы типов, так и в отношении управляющих конструкций.

Другим аспектом языкового окружения ООБД является потребность в языках запросов, которые можно было бы использовать в интерактивном режиме. Если доступ к объектам внешней БД в языках программирования ООБД носит в основном навигационный характер, то для языков запросов более удобен декларативный стиль. Декларативные языки запросов к ООБД менее развиты, чем языки программирования ООБД, и при их реализации возникают существенные проблемы. Ниже мы рассмотрим имеющиеся подходы и их ограничения более подробно. Но начнем с языков программирования ООБД.

К моменту написания данной работы нам неизвестен какой-либо язык программирования ООБД, который был бы спроектирован целиком заново, начиная с нуля. Естественным подходом к построению такого языка было использование (с необходимыми расширениями) некоторого существующего объектно-ориентированного языка. Начало расцвета направления ООБД совпало с пиком популярности языка Smalltalk-80. Этот язык оказал большое влияние на разработку первых систем ООБД, и, в частности, использовался в качестве языка программирования [4, 5]. Во многом опирается на Smalltalk и известная коммерчески доступная система GemStone [6-7].

Трудности с эффективной практической реализацией языка Smalltalk побудили разработчиков систем ООБД к поиску альтернативных базовых языков. Известная близость объектно-ориентированного и функционального подходов к программированию позволяет достаточно успешно опираться на функциональные языки программирования. В частности, язык Лисп (Common Lisp) является основой проекта ORION [8]. В этом проекте Лисп является и инструментальным языком, и базой объектно-ориентированного языка программирования в среде ORION.

Потребности в еще более эффективной реализации заставляют использовать в качестве основы объектно-ориентированного языка языки более низкого уровня. Например, в системе VBASE [9] наряду со специально разработанным языком TDL, предназначенным для определения типов, используется объектно-ориентированное расширение языка Си - COP (C Object Processor). В уже упоминавшемся проекте O2 [10-13] наряду с функциональным объектно-ориентированным языком программирования [14] используются два объектно-ориентированных расширения языков Бейсик и Си. При этом, насколько можно судить по публикациям, наибольшее распространение среди пользователей этой системы (она уже коммерчески доступна) получил язык CO2, являющийся расширением языка Си. Возможно это связано лишь с широкой (и все более возрастающей) популярностью языка Си (и его объектно-ориентированного потомка Си++), ставшего поистине девизом "настоящих программистов". Может быть, причины более глубинны (например, языки более высокого уровня слишком ограничительны для программистов-профессионалов; недаром большинство современных реализаций языков более высокого уровня выполняются именно на языке Си). Тем не менее, современная ситуация именно такова, и мы считаем полезным привести краткое описание основных особенностей языка CO2 [12-13, 15].

Прежде всего, CO2 не является полностью самостоятельным языком. Этот язык входит во многоязыковую среду O2 и предназначен для программирования методов ранее определенных классов. Определение классов, сигнатур методов (фактически, прототипов функций в терминологии языка Си) и имен постоянно хранимых значений и объектов производится с использованием отдельного языка определения схемы БД.

Имя любого объекта трактуется как указатель на значение этого объекта; разыменование производится с помощью обычного оператора Си '*'. Доступ к значению объекта возможен только из метода его класса, если только при перечислении методов оператор '*' не объявлен явно публичным.

Поддерживается операция порождения нового объекта указанного класса. В отличие от языка Си++ в CO2 невозможно совместить создание нового объекта с его инициализаций (понятие метода-конструктора начального значения объекта в CO2 не поддерживается). Для инициализации необходимо либо явно обратиться к соответствующему методу класса с указанием вновь созданного объекта (поддерживается соответствующий механизм "передачи сообщений", означающий на самом деле вызов функции), либо воспользоваться оператором '*' и явно присвоить новое значение, если '*' - публичный оператор для данного класса.

CO2 включает средства конструирования значений-кортежей, множеств, и списков. Понятие значения-кортежа фактически эквивалентно понятию значения-структуры обычного языка Си (с тем отличием, что элементами кортежа могут являться объекты, множества и списки). Для значений-множеств и списков поддерживаются операции добавления и изъятия элементов, а также набор теоретико-множественных операций (и конкатенации для списков).

Основой манипулирования объектами, хранимыми в БД, является расширенное по сравнению с языком Си средство итерации. Итератор применим к значениям-множествам или спискам. Фактически он означает последовательное применение оператора-тела цикла ко всем элементам множества или списка. Если мы вспомним, что долговременно хранимому классу объектов неявно соответствует одноименное значение-множество с элементами-объектами данного класса, то становится понятно, что итератор языка CO2 обеспечивает явную навигацию в классах объектов. Единственное, что остается от привычных пользователям СУБД языков запросов, - это ограниченная возможность указания характеристик требуемых в цикле объектов (это делается путем использования оператора разыменования и явного указания условий на атрибуты; конечно, для этого нужно, чтобы оператор '*' был объявлен публичным в данном классе).

Разработчики O2 подчеркивают, что они умышленно сделали CO2 более бедным по возможностям, чем, например, язык Си++, потому что многое по части управления объектами берет на себя общий менеджер объектов системы, явно вызываемый из рабочей программы.

Потребность в поддержании в объектно-ориентированной СУБД не только языка (или семейства языков) программирования ООБД, но и развитого языка запросов в настоящее время осознается практически всеми разработчиками. Система должна поддерживать легко осваиваемый интерфейс, прямо доступный конечному пользователю в интерактивном режиме. Один из подходов основывается на поддержании обходчиков [16]. В этом случае конечный интерфейс обычно является графическим. На экране отображается схема (или подсхема) ООБД, и пользователь осуществляет доступ к объектам в навигационном стиле. По мнению Бансилона [15] в этом случае разумно игнорировать принцип инкапсуляции объектов и предъявлять пользователю внутренность объектов. В большинстве существующих систем ООБД подобный интерфейс существует, но всем понятно, что навигационный язык запросов - это в некотором смысле шаг назад по сравнению с языками запросов даже реляционных систем. Ведутся активные поиски подходов к организации декларативных языков запросов к ООБД.

Беери [17] отмечает существование трех подходов. Первый подход - языки, являющиеся объектно-ориентированными расширениями языков запросов реляционных систем. Наиболее распространены языки с синтаксисом, близким к известному языку SQL [18]. Это связано, конечно, с общим признанием и чрезвычайно широким распространением этого языка. В частности, в своем Манифесте третьего поколения [19] СУБД М. Стоунбрекер и его коллеги по комитету перспективных систем БД утверждают необходимость поддержания SQL-подобного интерфейса во всех СУБД следующего поколения.

Второй подход основывается на построении полного логического объектно-ориентированного исчисления. По поводу построения такого исчисления имеются теоретические работы (например, [20]), но законченный и практически реализованный язык запросов нам неизвестен. Видимо, к этому же направлению строго теоретически обоснованных языков запросов можно отнести и работу Леллани и Спиратоса [21], основанную на алгебраической теории категорий.

Наконец, третий подход основывается на применении дедуктивного подхода. В основном это отражает стремление разработчиков к сближению направлений дедуктивных и объектно-ориентированных БД. Примером простого дедуктивного объектно-ориентированного языка запросов может служить [22].

Независимо от применяемого для разработки языка запросов подхода перед разработчиками встает одна концептуальная проблема, решение которой не укладывается в традиционное русло объектно-ориентированного подхода. Понятно, что основой для формулирования запроса должен служить класс, представляющий в ООБД множество однотипных объектов. Но что может представлять собой результат запроса? Набор основных понятий объектно-ориентированного подхода не содержит подходящего к данному случаю понятия. Обычно из положения выходят, расширяя базовый набор концепций концепцией множества объектов и полагая, что результатом запроса является некоторое подмножество объектов-экземпляров класса. Это довольно ограничительный подход, поскольку автоматически исключает возможность наличия в языке запросов средств, аналогичных реляционному оператору соединения. В конце этого раздела мы коротко изложим собственные (в достаточной степени предварительные) соображения по этому поводу, но сначала кратко рассмотрим особенности нескольких конкретных декларативных языков запросов к ООБД.

В языке запросов объектно-ориентированной СУБД ORION [23-24] полностью поддерживается принцип инкапсуляции объектов. В реализованном варианте языка запросы могут основываться только на одном классе (хотя в [24] описывается подход к определению запроса на нескольких классах в стиле расширения семантики реляционного оператора соединения). Синтаксис языка ориентирован на SQL. Очень развит набор допустимых предикатов селекции. В частности, для атрибута, доменом которого является суперкласс, можно указать имя интересующего пользователя подкласса.

Язык запросов системы Iris [25-26] находится в значительной степени под влиянием реляционной парадигмы. Даже название этого языка OSQL отражает его тесную связь с реляционным языком SQL. По сути дела, OSQL - это реляционный язык, рассчитанный на работу с ненормализованными отношениями. Естественно, при таком подходе в OSQL нарушается инкапсуляция объектов.

На наш взгляд, особый интерес представляет декларативный язык запросов системы O2 RELOOP [27]. В общих словах, это декларативный язык запросов с SQL-ориентированным синтаксисом, основанный на специально разработанной для модели O2 алгебре объектов и значений. (Кстати, это не единственная работа в направлении построения алгебры для объектно-ориентированных моделей данных. См., например, [28].) На наш взгляд, особенно впечатляющим качеством языка RELOOP является естественность его построения в общем контексте модели O2. Запрос задается всегда на значении-множестве или списке. Если мы вспомним, что долговременному классу в O2 соответствует одноименное значение-множество, то тем самым можно определить запрос на любом хранимом классе. Результатом запроса может являться объект, значение-множество или значение-список. При этом элементами значений-множеств могут являться объекты (простая выборка), либо значения-кортежи с элементами-объектами разных классов (например). В совокупности эти особенности языка позволяют формулировать запросы над несколькими классами (специфическое соединение, порождающее не новые объекты, а кортежи из существующих объектов), а также употреблять вложенные подзапросы.

Остановимся теперь на проблемах выполнения запросов к ООБД, сформулированных на каком-либо декларативном языке. Каким бы не был этот язык, в конечном счете потребуется по внешнему представлению запроса сформировать план его выполнения, который минимизировал бы общие накладные расходы системы, требующиеся для выполнения запроса. Другими словами, до выполнения запроса необходимо выполнить его оптимизацию, учитывая в общем случае необходимость обменов с внешней памятью.

Публикации, касающиеся оптимизации запросов к ООБД, практически отсутствуют. Это свидетельствует о недостаточной развитости каких-либо оригинальных подходов.

В большинстве систем по сути дела применяется тот же подход к оптимизации запросов, который использовался в реляционных системах: формируется набор альтернативных планов, оценивается стоимость каждого из них и выбирается план с наименьшей стоимостью. (Подробный обзор современных методов оптимизации запросов в реляционных СУБД и нерешенных проблем можно найти в [29].) Возможность применения такого подхода в СУБД ORION и O2 (да и в других) опирается на то, что объекты в этих системах не полностью инкапсулированы. Наряду с методами, в объектах видны и некоторые атрибуты, и если условие выборки задано через эти атрибуты, оптимизатор запросов, которому известны внутренняя структура объектов и набор существующих индексов, получает возможность выбора. Если же условие выборки можно формулировать только через методы, при подходах ORION и O2 единственным возможным способом выборки объектов класса будет последовательный просмотр всех объектов этого класса.

Здоник [30] отмечает, что основная проблема с оптимизацией запросов к ООБД связана с расширяемостью набора типов в такой БД. Каждый новый тип вводит собственную алгебру, неизвестную оптимизатору запросов. Например, оптимизатор не имеет информации о возможной коммутативности двух операций типа и т.д. Здоник полагает, что возможному решению проблемы оптимизации могло бы способствовать формальное определение алгебраических свойств операций типа при его разработке. Примерно такой подход применяется в оптимизаторах, основанных на наборе правил, применяемых в расширяемых СУБД (например, [31]).

Как кажется, из последних публикаций, затрагивающих проблемы оптимизации запросов, наибольшее влияние на оптимизаторы систем ООБД может оказать [32]. Эта работа не связана непосредственно со спецификой ООБД, но преимущество предлагаемого подхода связано как раз с максимальной независимостью от особенностей организации БД. Предлагается не оценивать план выполнения запроса, а учитывать реальную стоимость уже использованного плана и на этой основе изменять критерии выбора оптимизатора. Может быть, таким образом удастся справиться с неизвестной оптимизатору алгеброй определяемых пользователями типов.

3. Взгляд на реляционную алгебру

Классическая реляционная алгебра содержит набор теоретико-множественных операций (например, объединение, пересечение и декартово произведение отношений), а также операции селекции и проекции.

Реляционная алгебра замкнута относительно понятия "отношение", т.е. операндами и результатами любой операции являются отношения. При этом можно отметить один факт, на который обычно не обращают внимания по причине его "очевидности". Существуют два класса реляционных операций. Теоретико-множественные операции объединения и пересечения и операция селекции формируют из операндов-отношений отношение-результат с той же схемой; операции же декартова произведения и проекции формируют отношение-результат со схемой, которая в общем случае не описывалась статически в составе схемы БД. Если рассматривать схему отношения как тип, то в этой терминологии операции декартова произведения и проекции формируют не только значение, но и тип этого значения.

Тем самым, в общем случае при вычислении реляционного выражения одновременно с вычислением промежуточных отношений происходит построение некоторой динамической схемы БД. И это не вызывает никакой двусмысленности, потому что для любой реляционной операции схему отношения-результата (тип результата) можно определить в статике до выполнения операции.

Наличие в реляционной алгебре операций, порождающих отношения с новым типом, не вызывает концептуальных и/или технических затруднений по той причине, что типы (схемы) отношений очень просты. Например, можно считать, что два типа отношения совместимы относительно операций объединения и пересечения, если эти типы структурно эквивалентны (их наборы доменов совпадают). Все это легко проверяется, позволяя однозначно интерпретировать реляционные выражения.

Заметим, что хотя в реляционной модели данных имя схемы отношения совпадает с именем экземпляра отношения (это очень похоже на то, как в ООБД имя класса часто пытаются использовать одновременно как имя типа объекта и имя множества объектов), неявно возникает понятие типа отношения, которое не обязательно именовать по причине простоты определения эквивалентных (однотипных) схем отношений.

4. Основные определения и формулировка алгебры классов

Не будем приводить полный набор концепций и определений. В основном мы следуем принятым представлениям об ООБД со множественным наследованием. Затронем только те понятия, которые существенны для дальнейшего изложения.

Будем опираться на следующее: ООБД представляется как ациклический граф с корнем (АГК), все вершины которого представляют собой классы объектов, а дуги соответствуют отношению наследования (будем называть этот АГК статическим АГК ООБД). Каждый объект ООБД обладает типом и непосредственно принадлежит некоторому классу, принадлежа при этом каждому суперклассу этого класса. Все объекты одного класса обладают общим типом и поэтому можно говорить о типе класса. Тип суперкласса является супертипом типа класса (в частности, тем же самым типом). Непосредственным типом объекта называется тип класса, которому непосредственно принадлежит этот объект. Допускается также наличие в статической решетке классов ООБД нескольких классов, не связанных отношением класс-суперкласс, с одним типом. Тип объекта (класса) в нашей трактовке является не только синтаксической, но и семантической характеристикой. В частности, если два класса объектов обладают одним и тем же типом, то осмысленны теоретико-множественные операции объединения и пересечения для этих классов.

Будем различать статический АГК классов (собственно ООБД) и динамический АГК классов, возникающий при вычислении (интерпретации) запроса к БД. В статической решетке классов каждый объект непосредственно принадлежит только одному классу. В динамической решетке возможны ситуации, когда один объект (временно) непосредственно принадлежит нескольким классам, только один из которых входит в статическую решетку классов. Тем не менее, при интерпретации запроса известно, какой из классов является основным, т.е. к какому классу в данный момент относится данный объект. Заметим, что это никак не влияет на свойство объекта обладать уникальным идентификатором.

Будем считать, что каждый тип обладает функциональной сигнатурой, т.е. внешняя спецификация типа задается набором прототипов функций со специфицированными параметрами. Параметры типизированы, т.е. если параметром некоторой функции сигнатуры типа является объект, то указывается его тип, а не класс. В частности, функции типа могут не иметь параметров и это можно трактовать как возможность прямого доступа (по чтению) к атрибутам типа. Подобно этому, функция типа может выдавать в качестве значения объект некоторого типа; класс этого объекта не специфицируется.

Разделение понятий класса и типа приводит к тому, что для ООБД одновременно поддерживаются вообще говоря разные АГК классов и АГК типов. Разная структура этих графов обуславливается, во-первых, тем, что допускается существование однотипных классов, не связанных отношением наследования, и во-вторых, тем, что подкласс класса не обязательно обладает другим типом.

Исходя из введенного набора понятий, сформулируем правила интерпретации выражений алгебры объектов, операции которой определены над классами объектов, вырабатывают классы объектов и включают операции теоретико-множественного объединения, пересечения, декартова произведения, а также операции селекции и проекции. Нашей задачей является для каждой из указанных операций сформулировать условия ее применимости, тип результирующего класса и его место в получаемой после выполнения операции динамической решетке классов.

Объединение классов.

Операция объединения классов является двуместной и естественным условием ее применения является однотипность обоих классов.

Тип результирующего класса совпадает с типом классов-операндов. После выполнения операции результирующий класс становится суперклассом обоих классов-операндов. Обозначим классы-операнды A и B, а результирующий класс - C. Все объекты классов A и B непосредственно принадлежат также и классу C.

Пересечение классов.

Операция пересечения классов является двуместной и естественным условием ее применения является однотипность обоих классов.

Тип результирующего класса совпадает с типом классов-операндов. После выполнения операции результирующий класс становится подклассом каждого из классов-операндов. Обозначим классы-операнды A и B, а результирующий класс - C. Все объекты, непосредственно принадлежащие классу C, непосредственно принадлежат также и классам A и B.

Декартово произведение классов.

Операция декартова произведения классов является двуместной и применима к любым двум классам решетки классов (статической или динамической).

Сигнатура типа результирующего класса производится путем объединения сигнатур типов классов-операндов. Возможные коллизии имен функций разрешаются подобно тому, как это делается в реляционной алгебре для имен атрибутов. Результирующий класс C, полученный путем декартова произведения класса A на класс B, включает множество объектов, полученных путем попарного "склеивания" объектов классов A и B. Объекты класса C являются вновь созданными временными объектами ООБД и обладают новыми идентификаторами. Тип класса C является подтипом типов классов A и B, но класс C не является подклассом ни A, ни B. В динамической решетке классов его можно считать подклассом только корневого суперкласса статической решетки.

Заметим, что даже если в статической решетке классов у классов A и B имеется общий подкласс с тем же типом, что и у C, нельзя считать, что это и есть класс C, потому что объекты этого класса могли порождаться совсем другим образом.

Селекция класса.

Операция селекции класса является двуместной и применима к любому классу A решетки классов (статической или динамической). Вторым параметром операции является логическое выражение F, построенное на основе простых предикатов, включающих вызовы функций сигнатуры типа класса A.

Результирующий класс C обладает тем же типом, что и класс A, является его подклассом в динамической решетке классов и непосредственно включает все объекты класса A, для которых значение логического выражения F есть true.

Проекция класса.

Операция проекции класса является двуместной и применима к любому классу A решетки классов (статической или динамической). Вторым параметром операции является подсигнатура сигнатуры типа класса A (S), т.е. список имен функций, входящих в сигнатуру типа класса A.

Тип результирующего класса C является супертипом типа класса A с сигнатурой, полученной путем удаления из сигнатуры типа класса A функций, указанных в S. Объекты класса C являются вновь создаваемыми объектами ООБД и обладают новыми идентификаторами. Хотя тип класса C является супертипом типа класса A, класс С не является суперклассом класса A. В динамической решетке классов его можно считать только подклассом корневого класса динамической решетки классов.

На основе введенного набора операций можно конструировать выражения алгебры классов. Поскольку семантика элементарных операций фиксирована, можно однозначно интерпретировать выражения, если ввести естественные приоритеты операций: высший приоритет - у операций селекции и проекции, следующий по старшинству - у операции декартова произведения и низший приоритет у операций пересечения и объединения.

Заметим, что в общем случае при интерпретации выражения алгебры объектов потребуется устанавливать структурную эквивалентность типов промежуточных классов (чтобы определить, например, возможность объединения двух таких классов). При использовании функциональных сигнатур классов, если ограничиться одноуровневой проверкой структурной эквивалентности, эта задача вполне разрешима.

Конечно, как и в случае реляционных систем, на основе операций декартова произведения классов и проекции можно определить операцию соединения классов.

Заметим, что мы не говорим о реализации операций декартова произведения и проекции классов. Понятно, что в случае декартова произведения должен образовываться класс объектов, обладающих свойствами объектов из обоих классов-операндов. Строятся ли эти составные объекты простой конкатенацией составляющих объектов, или применяется какая-либо другая техника - это вопрос оптимизации. Аналогично, проекцию можно реализовывать путем простого запрета доступа к части функций объекта, а можно пытаться сокращать внутреннюю структуру объекта.

5. Оптимизация запросов к ООБД

Обычно считают, что проблема оптимизации запросов к ООБД находится в противоречии с инкапсуляцией объектов, т.е. неявно предполагается, что оптимизатор должен полагаться только на спецификацию объектов и не затрагивать их реализацию. Обосновывается это требованием обеспечения позднего связывания (во время выполнения запроса) с объектами, когда во время компиляции запроса неизвестна реализация операций.

Конечно, это правильно, если поддерживать возможности переопределения внутренних структур данных и реализации операций в подтипах в полном объеме. Заметим, однако, что потребности в полиморфизме такого рода довольно ограничены и можно, например, потребовать явного указания при определении типа тех операций, которые допускается переопределять в подтипах.

Тогда при компиляции запроса (выраженного, например, с помощью предложенной выше алгебры объектов) по типу каждого класса-операнда можно определить, какие операции и внутренние структуры данных являются общими для всех подклассов этого класса.

Поскольку мы не хотим раскрывать инкапсуляцию объектов при формулировании запросов, предикаты выборки объектов (это касается оператора селекции) могут задаваться только с привлечением операций класса (вернее операций типа этого класса). При компиляции запроса можно отметить те предикаты, в которых используются операции-инварианты подклассов данного класса.

После этого можно воспользоваться реализацией этих операций для упрощения предикатов и сведения их в лучшем случае к предикатам на внутренних атрибутах объектов. Фактически должно быть произведено частичное вычисление предикатов выборки на основе параметров логического выражения выборки и внутреннего представления типа. Конечно, технически эта процедура может быть выполнимой только в том случае, если в качества языка программирования типов используется язык достаточно высокого уровня (например, некоторый чисто функциональный или логический язык).


Литература

  1. Malkolm Atkinson, Francois Bansilhon, David DeWitt, Klaus Dittrich, David Maier, Stanley Zdonik. The Object-Oriented Database System Manifesto // 1st Int. Conf. Deductive and Object-Oriented Databases, Kyoto, Japan, Dec. 4-6, 1989
  2. Francois Bancilhon. Query Languages for Object-Oriented Database Systems: Analysis and Proposal // Datanbanksyst. Buro, Tech. and Wiss.: GI/SI - Fashtag., Zurich, Marz. 1-3, 1989.- 1-18
  3. А. В. Замулин. Системы программирования баз данных и знаний // Новосибирск: Наука, 1990.- 352 с.
  4. D. Decouchart. Design of a Distributed Object Manager for the Smalltalk-80 System // Proc. OOPCLA'86, Portland, Oreg., USA, Sept. 29 - Oct. 2, 1986.- 444-452
  5. Andrew Straw, Fred Mellender, Steve Riegel. Object Management in a Persistent Smalltalk System // Software Pract. and Exper.- 19, N 8.- 1989.- 719-737
  6. D. Jacob Penney, Jacob Stein. Class Modification in the GemStone Object-Oriented DBMS // Proc. OOPCLA'87, Orlando, Fla, USA, Oct. 4-8, 1987.- 111-117
  7. Won Kim, Jay Banerjee, Hong-Tai Chou, Jorge F. Garca, Darrell Woelk. Composite Object Support in an Object-Oriented Database System GemStone Object-Oriented DBMS // Proc. OOPCLA'87, Orlando, Fla, USA, Oct. 4-8, 1987.- 118-125
  8. Won Kim, Jorge F. Garza, Nathaniel Ballou, Darrell Woelk. Architecture of the ORION Next-Generation Database System // IEEE Trans. Knowledge and Data Eng.- 2, N 1.- 1990.- 109-124
  9. Tomothy Andrews, Craig Harris. Combining Language and Database Advances in an Object-Oriented Development Environment GemStone Object-Oriented DBMS // Proc. OOPCLA'87, Orlando, Fla, USA, Oct. 4-8, 1987.- 430-440
  10. Christophe Lecluse, Philippe Richard, Fernando Velez. O2, an Object-Oriented Data Model // Proc. ACM SIGMOD Int. Conf. Manag. Data, Chicago, Ill, USA, June 1-3, 1988, ACM SIGMOD Record.- 17, N 3.- 1988.- 424-433
  11. F. Velez, G. Bernard, V. Darnis. The O2 Object Manager: An Overview // 15th Int. Conf. Very Large Data Bases, Amsterdam, Aug. 22-25, 1989.- 357-366
  12. C. Lecluse, P. Richard. The O2 Database Programming Language // 15th Int. Conf. Very Large Data Bases, Amsterdam, Aug. 22-25, 1989.- 411-422
  13. O. Deux et al. The Story of O2 // IEEE Trans. Knowledge and Data Eng.- 2, N 1.- 1990.- 91-108
  14. Gilles Barbedette. LISPO2: A Persistent Object-Oriented LISP // Advances in Database Technology - EDBT'90.- Lecture Notes in Computer Science.- 416, 1990.- 332-347
  15. Francois Bancilhon. Query Languages for Object-Oriented Database Systems: Analysis and Proposal // Datanbanksyst. Buro, Tech. and Wiss.: GI/SI - Fashtag., Zurich, Marz. 1-3, 1989.- 1-18
  16. E. Laenens, F. Staes, D. Vermeir. Browsing a la carte in Object-oriented Databases // Computer J.- 32, N 4.- 1989.- 333-340
  17. Catriel Beeri. A Formal Approach to Object-Oriented Databases // Data and Knowledge Eng.- 5.- 1990.- 353-382
  18. D. D. Chamberlin, R. F. Boyce. SEQUEL: A Structured English Query Language // ACM SIGMOD Workshop Data Descr., Access, Contr., Ann Arbol, Mich., USA, May 1974.- 249-264
  19. The Committee for Advanced DBMS Function (Michael Stonebraker, Bruce Lindsay, Jim Gray, Make Carey, David Beech). Third Generation Data Base System Manifesto // Proc. ACM SIGMOD Int. Conf. Manag. Data, Atlanta City, NJ, USA, May 23-25, 1990, ACM SIGMOD Record.- 19, N 2.- 1990.- 34-43
  20. M. Kifer, G. Lausen. F-Logic: A Higher-Order Language for Reasoning about Objects, Inheritance, and Scheme // Proc. ACM SIGMOD Int. Conf. Manag. Data, Portland, Oreg., USA, 1989, ACM SIGMOD Record.- 18, N 2.- 1989.- 134-146
  21. S. K. Lellani, N. Spiratos. Towards a Categorical Data Model Supporting Structured Objects and Inheritance // Proc. 1st Int. East/West Database Workshop, Kiev, Oct. 1990, Lect. Notes Comput. Sci.- 540.- 1991
  22. Serge Abiteboul. Towards a Deductive Object-Oriented Database Language // Data and Knowledge Eng.- 5.- 1990.- 263-287
  23. Won Kim. Object-Oriented Databases: Definition and Research Directions // IEEE Trans. Data and Knowledge Eng.- 2, N 3.- 1990.- 327-341
  24. W. Kim. A Model of Queries for Object-Oriented Databases // 15th Int. Conf. Very Large Data Bases, Amsterdam, Aug. 22-25, 1989.- 423-432
  25. Peter Lyngbaek, Kevin Wilkinson, Waqar Hasan. The Iris Kernel Architecture // Advances in Database Technology - EDBT'90.- Lecture Notes in Computer Science.- 416, 1990.- 348-362
  26. Kevin Wilkinson, Peter Lyngbaek, Waqar Hasan. The Iris Architecture and Implementation // IEEE Trans. Knowledge and Data Eng.- 2, N 1.- 1990.- 63-75
  27. Sophie Cluet, Claude Delobel, Christophe Lecluse, Philippe Richard. RELOOP: An Algebra Based Query Language for an Object-Oriented Database System // Data and Knowledge Eng.- 5.- 1990.- 333-352
  28. Gail M. Shaw, Stanley B. Zdonik. A Query Algebra for Object-Oriented Databases // 6th Int. Conf. Data Eng., Los Angeles, Calif., USA, Febr. 5-9, 1990.- 154-162
  29. С. Д. Кузнецов. Методы оптимизации выполнения запросов в реляционных СУБД // "Вычислительные науки. Т.1 (Итоги науки и техники ВИНИТИ АН СССР)". М., ВИНИТИ АН СССР, 1989.- 76-153
  30. Stanley Zdonik. Directions in Object-Oriented Databases // COMPSAC'89 13th Annu. Int. Comput. Software and Appl. Conf., Orlando, Fla, Sept. 20-22, 1989.- 200
  31. J. C. Freytag. A Rule-Based View of Query Optimization // Proc. ACM SIGMOD Int. Conf. Manag. Data, San Francisco, Calif., USA, May 27-29, 1987.- 173-180
  32. F. W. M. Tompa, J. I. Icaza. Adaptive Selection of Query Execution Strategies by Learning Automata // Inf. Sci. (USA).- 50, N 3.- 1990.- 219-240