Механизм хэширования при объединении таблиц (Hash Joins).
Данная особенность, при выполнении операции объединения таблиц (join), основывается на использовании алгоритма хэширования, который совершенствуется в СУБД Teradata уже на протяжении 20 лет. Это позволяет более эффективно выполнять операции объединения таблиц и быстрее возвращать результат пользователю. В хранилищах данных это позволяет добиться увеличения производительности на 40%, в зависимости от типа запроса.
Пример:
Клиент хочет выполнить ряд сложных запросов, чтобы проанализировать результаты кампании по продвижению товаров на рынке. При этом он может не беспокоиться о возможностях своей системы "безболезненно" выполнить данные запросы, не оказывая влияния на производительность. Механизм хэширования при объединении таблиц позволяет эффективно производить сложные запросы. При этом результатом является высокая производительность и возможность быстро производить бизнес-анализ данных.
Высокая производительность выполнения запросов, агрегирующих данные
Пользователи, выполняющие какие-либо запросы, группирующие данные (в запросе используется предикат 'group by'), получают увеличение производительности, примерно на 20%, за счет модернизации механизма поиска данных в таблицах при выполнении операций по агрегированию.
Высокая производительность снижает потребности в создании таблиц, содержащих суммированные данные. Это также снижает затраты по администрированию и расход дисковой памяти, путем устранения необходимости хранить и обрабатывать лишнюю, избыточную информацию.
Пример:
В телекоммуникационной отрасли, клиент может сделать запрос на получение данных о звонках, сделанных между 6 и 8 вечера, в сентябре, из области с кодом 212 в несколько других областей, с соответствующими телефонными кодами. Результаты запроса могут быть сгруппированы в хронологическом порядке, по коду области, по абоненту и т.п. При выполнении такого запроса, СУБД возвращает пользователю суммированные данные, согласно тому по какому атрибуту он группирует данные. Отпадает необходимость делать несколько представлений (views) одной и той же информации, сгруппированной по различным атрибутам.
Объединение по индексам (Join Index)
Пользователи получат увеличение производительности при обработке сложных запросов, затрагивающих большие объемы данных и использующих операцию объединения по индексам (join index). Операция объединения по индексам представляет собой операцию объединения нескольких таблиц, содержащих столбцы, запрос по которым затрагивает большие объемы данных. СУБД Teradata позволяет, по мере обновления информации в ХД, обновлять все таблицы, участвующие в объединении по индексам, при этом значения индексов всегда остаются действительными и актуальными.
Пример:
Пользователь регулярно хочет анализировать продажи по конкретному поставщику товара. Для этого наилучшим методом будет спроектировать логическую структуру базы данных по схеме "звезда" (star-schema). Но при этом данная схема ограничивает гибкость в использовании. При помощи механизма объединения по индексам (join index), пользователь может определить в таблице фактов и таблицах измерений детализированную информацию. При последующих изменениях информации в таблицах, схема "звезда" будет поддерживаться автоматически. Механизм объединения по индексам (join index) обеспечивает функциональность схемы "звезда", гибкость нормализованной модели данных, а также автоматическую поддержку информации при обновлениях.
Назад | Содержание | Вперед