Кроме нейроускорителей на базе ПЛИС и DSP в последнее время все большее распространение находят нейроускорители на базе специализированных нейросигнальных и нейросетевых процессоров. Проанализируем особенности их реализации на конкретных приерах.
2х-процессорный встраиваемый модуль МЦ4.01 (NM1) НТЦ Модуль.
Рис.17. Модуль МЦ4.01
Встраиваемый модуль МЦ4.01 (NM1) цифровой обработки сигналов производства НТЦ "Модуль" [10] предназначен для решения различных задач нейронными и нейроподобными алгоритмами, а также задач цифровой обработки сигналов и ускорения векторно-матричных вычислений. Модуль выполнен на спроектированных и разработанных в НТЦ цифровых сигнальных процессорах NeuroMatrixR NM6403 и представляет собой одноплатный нейроускоритель. Конструктивно выполнен в виде платы, вставляемой в стандартный слот шины PCI (рис.17).
Рис.18. Структурная схема модуля МЦ4.01
Нейроускоритель содержит:
Производительность:
Конструктивное выполнение:
Нейроускоритель МЦ4.02 содержит один процессор NM6403 и обладает масштабируеой производительностью от 40 до 11.500 ММАС, обеспечивает обработку данных переенной разрядности от 1 до 64 бит. Модуль предназначен для работы в составе коплекса с системной шиной PCI, блок статической памяти модуля доступен для записи и чтения как со стороны процессора, так и со стороны шины PCI. На внешние разъемы модуля выведены два комуникационных порта, аппаратно совестимых с портаи TMS320C4x. Соединение коммуникационных портов нескольких одулей позволяет создавать мультипроцессорные систеы различной конфигурации. Сейчас ведутся разработки по созданию одулей на базе процессора NM6404.
Нейровычислители Synapse
Компания Siemens Nixdorf Informationssysteme (SNI) - дочернее предприятие концерна Siemens в сотрудничестве с Маннгеймским университетом создала нейрокомпьютер под названием "Синапс-1", который появился на рынке в середине 1994 г., в дальнейшем были выпущены нейроускорители Synaps 2 и Synaps 3. Таким образом, SNI стала первой европейской фирмой, выпустившей нейрокомпьютеры. В настоящее время нейроускорители распространяются французской фирой Tiga Technologies (gouimenou.tiga@wanadoo.fr).
Рис.19. Внешний вид Synapse 2.
Сфера применения нейроодулей - распознавание речи, изображений, образов, ускорение работы програмных эуляторов. Сложность моделирования на рабочей станции процесса самообучения для нейронных сетей до сих пор тормозило разработку нейронных применений, поскольку каждый шаг в обучении требует много времени. Что касается "Синапс", то за один час самообучения он достигает таких же результатов, что и нейронные сети в обычном компьютере за целый год. Эти системы обладают скалярной многопроцессорной архитектурой и наращиваемой памятью.
В состав Synaps 2 (рис.19) входит: один нейрочип МА16 (40Гц), управляющий сигнальный процессор TMS320C50 (55 МГц), одуль целочисленной обработки на базе TMS320C50 (55 МГц), память образцов (Y-memory), память весов (W-memory). Структурная схема нейроускорителя Synaps 2 представлена на рис.20.
Рис.20. Структурная схема Synapse 2
Серийно выпускаемые нейроускорители "Синапс-3" поставляются с двумя процессорами МА 16. Пиковая эффективность одной нейроплаты Synaps3 - 2.4 млрд.операций/сек. Программное обеспечение работает в среде UNIX/XWIND и реализовано на C++. Нейронная сеть тоже описывается на С++ или может вводится интерактивно с помощью графического интерфейса типа OSF/Motif, что позволяет визуализировать конфигурацию СБИС после отображения на нее структуры сети. Средства тестирования и эмуляции развиты очень хорошо.
Рис.21. Сравнительная диаграмма
Сравнительная диаграмма производительности нейроплат и Pentium200 на матричных операциях приведена выше.
Нейроплата CNAPS/PC-128 фирмы Adaptive Solutions.
Плата CNAPS/PC была анонсирована в США в ноябре 1995 года обладает рядом характеристик, которые на первый взгляд кажутся фантастическими. При обучении на сложных данных нейроплата превосходит ПК на базе Pentium по быстродействию в несколько сотен (на отдельных тестах - до 1000) раз. Нейроплата позволяет прогнозировать заведомо "гиблые" задачи - текущую ситуацию на мировом валютном рынке, динамику политических событий в регионах и даже исход футбольных матчей.
Старшая модель семейства имеет пиковое быстродействие 2,27млрд.соединений/сек, что позволяет сократить время аналитической обработки данных Для сравнения - при решении нейросетевых задач стандартные персональные компьютеры показывают следующее быстродействие :
486/ 50 MHz - 750 тыс.соед/сек.
Pentium / 90 MHz - 1980 тыс.соед/сек.
Конструктивно нейроплата CNAPS/PC представляет собой полноразмерную плату вставляемую в слот расширения PC (поддерживаются шины ISA и PCI). На плате размещены 2 либо 4 нейро БИС, реализующие 64 либо 128 нейропроцессоров соответственно. Кроме того, плата содержит 512 кбайт быстродействующей кэш-памяти и стандартный SIMM ОЗУ -4 Мб (может быть расширен до 36Мб).
ISA ускоритель с 16 x ZISC 036 (IBM).
Рис.22. Общий вид нейроускорителя ZISC 036.
ZISC/ISA предназначен для IBM PC совместимых компьютеров. Ускоритель построен на 16 ZISC036 процессорах и имеет 576 нейронов. Возможна установка нескольких карт, одна из которых работает в режиме Master, а другие Slave.
PCI ускоритель на ZISC 036
Рис.23. Общий вид PCI ускорителя на ZISC 036.
IBM PCI ZISC ускоритель - высокопроизводительный нейровычислитель, предназначенный для работы в PCI слоте.
Ускоритель может содержать - 1,7,13 или 19 ZISC036
Рассматривая подходы к аппаратной реализации нейровычислителей необходио отмечить, что не сотря на широкое распространение различных высокопараллельных ускорителей для различных задач, число моделей полнофункциональных нейрокомпьютеров невелико, а коерчески доступны из них единицы. Это и понятно, так как большинство из них реализованы для спецприенений. Наиболее яркими приерами нейрокомпьютеров являются [1,2]: Нейрокомпьютер Synaps 1 (Siemens, Герания), нейрокомпьютер "Силиконовый мозг" (созданный в США по программе "Электронный мозг", предназначен для обработки аэрокосмических изображений, производительность 80 петафлоп (80х1015 операций в секунду, объем равен объему озга человека, потребляеая мощность 20 Вт.), нейрокомпьютер Эмбрион (Россия).
SYNAPSE-1
Базовый комплект SYNAPSE1-N110 предполагает наличие главной ЭВМ - рабочей станции SUN SPARCSTATION 5 модели ТХ1 в качестве вспомогательного консолидирующего устройства, облегчающего процессы программирования, проектирования нейросетей, тестирования, управления внешними устройствами, вывода результатов и т.п. Главная ЭВМ сопрягается с аппаратурой SYNAPSE1 через шину VME.
Рис.24. Общий вид нейрокомпьютера Synapse1.
В архитектуре SYNAPS1 можно выделить четыре основные компоненты: матричный процессор, память весов, устройство управления и устройство данных со следующими характеристиками:
Все аппаратные средства размещаются в небольшом корпусе 667x398x680 мм.
Проводиые исследования показали, что по производительности выполнение нейросетевых операций на нейрокомпьютере Synaps 1 по крайней мере на три порядка превышают производительность традиционных вычислительных систем и позволяют моделировать нейросети с количество синапсов равным 64 милиоонов, а гибкость архитектуры практически не ограничивает разнообразность реализуемых нейросетевых парадиг.
Нейрокомпьютер "Эмбрион"
Нейрокомпьютер Эмбрион [12] разработан под руководством член-корреспондента МАИ, к.т.н. Владимира Дмитриевича Цыганкова (sinteg@mail.ru). На сегодня известно несколько модификаций данного нейрокомпьютера, для различных приложений: датчик случайных многомерных управляемых импульсных потоков "ЭМБРИОН-1", интерсенсорный перенос "глаз"-"рука", техническая диагностика неисправностей энергогенератора самолетной электростанции ("ЭМБРИОН-2"), управление нестационарным объектом (ЛА) в реальном масштабе времени ("ЭМБРИОН-3" и "ЭМБРИОН-4"), орган технического зрения ("ЭМБРИОН-5"), управление тактильно очувствленным адаптивным промышленным роботом "УНИВЕРСАЛ-5А" при обслуживании карусельной плавильной печи на стекольном заводе ("ПОИСК-1"), управление тактильно очувствленным адаптивным промышленным роботом "Р-2" с искусственными мышцами при сборке и покраске ("ПОИСК-2"), управление тактильно очувствленным мобильным автономным роботом "КРАБ-1" при взаимодействии с неориентированными предметами и др.
Рис.25. Общий вид различных модификаций нейрокомпьютера Эбрион.
Виртуальный нейрокомпьютер "ЭМБРИОН" - модель мозга человека [12], возбуждение квазинейронов в нем создает виртуальное квантовое когерентное волновое поле, которое имеет прямое отношение к проблеме создания КВАНТОВОГО НЕЙРОКОМПЬЮТЕРА (КНК). Нейрокомпьютер "ЭМБРИОН" представляет собою некоторую разновидность квантовой МАКРОсистемы или квантово-механической системы.
На Рис.26.[12] представлена структурная схема процесса генерации нейронной сети в НК "ЭМБРИОН". Сигналы из внешней среды (S) проецируются на Сенсорную Матрицу (СМ), которая в модели НК представляет некоторое подобие проекционной зоны коры мозга. Под воздействием активирующего потока импульсов из Блока Выдвижения Гипотез (БВГ) - подкорковой структуры мозга, ретикулярной формации или некоторого внутреннего генератора активности процессов в нейронной сети, информация из СМ переносится в Регистр внутренней памяти Ро и меняющиеся во времени его коды-состояния формируют виртуальную квазинейронную сеть (НС) и ее выходную реакцию .
Рис.26. Условия синтеза квазинейронной сети в нейрокомпьютере Эмбрион [12].
Нейрокомпьютер "ЭМБРИОН" - это система, основанная на коллективном спиновом резонансе. Число частиц в нейрокомпьютерной квантовой системе точно известно и определяется разрядностью n НК. Блок Выдвижения Гипотез (БВГ) представляет собою устройство, формирующее и управляющее последовательностью действий унитарных преобразований пространства кубитов. Протокол квантовой криптографии в НК или алгоритм U-кратного применения унитарного оператора-выстрела |U|=1 - это процесс переноса информации из S1-й строки сенсорной матрицы СМ в регистр внутренней памяти P0. Выполняется четвертое требование к КНК. Момент измерения результата Y - это момент времени t, когда Uk=Umax. Выполняется последнее из вышеприведенного перечня пятое требование к КНК.
НК "ЭМБРИОН" представляет собою квантовый когерентный нейрокомпьютер и требует для своего воплощения совершенно другой, по сравнению с обычным ПК, функциональной элементной базы или "мозговой массы".
Работа с нейроускорителями и нейрокомпьютерами дает в руки совреенного инженера-исследователя, аналитика мощное средство проведения вычислений в реальном масштабе времени, если раньше большая часть времени уходила на подготовку и проверку одной-единственной гипотезы, то теперь система обрабатывает данные и выдает заключения практически в реальном времени. Несмотря на свои впечатляющие возможности, нейровычислители не очень распространены на рынке вследствие высокой цены (от от единиц до десятков тысяч USD для нейроускорителей и от десятков до сотен тыс. USD для нейрокомпьютеров) и из-за специфики освоения. Основная причина отсутствия полнофункциональных нейровычислителей на рынке - закрытость разработок. Из сотен фирм, производящих специализированные нейрочипы, лишь единицы поставляют свою продукцию на массовый рынок. Остальные обслуживают военный комплекс либо создают единичные продукты для спецприложений.
К сожаление из-за ограничений в объемах в рамках одного обзора нет возожности рассказать подробно обо всех известных на сегодня нейровычислителях и нейрокомпьютерах, в дальнейшем мы постараемся переодически возвращаться к данной теме и обсуждать вопросы вновь появившехся архитектурно-схемотехнических решений и элементной базы нейровычислителей. Оперативную информацию по данному направлению вы всегда сможете получить на сервере "Новости с Российского рынка нейрокомпьютеров" (http://neurnews.iu4.bmstu.ru).
Материалы данного обзора являются основой курсов "Микропроцессоры в системах управления" и "Архитектура и схеотехника совреенных ЭВМ", читаемых на кафедре "Конструирование и технология производства электронной аппаратуры" МГТУ им.Н.Э.Баумана (http://iu4.bmstu.ru). Мы будем признательны разработчикам нейровычислителей и всем заинтересованным лицам за дополнения и обсуждение вопросов затронутых в данном обзоре, а также готовы к выполнению совместных проектов и внедрению Ваших нейросетевых разработок в учебный процесс МГТУ им.Н.Э.Баумана. На сегодня основными направлениями деятельности кафедры в области нейросетевых приложений являются: создание нейроадаптивных систем активного управления пространственными волновыи полями (акустика, вибрации), нейроадаптивные системы управления робототехническими технологическими комплексами, распознование изображений, обработка сигналов в системах неразрушающего контроля, создание систем интеллектуального управления трафиком в телекомуникационных системах, исследовательские работы в области нейроинформатики (экспертные системы, аналитические системы, контекстно-поисковые систеы и т.п.).