Тестирование серверных гигабитных сетевых адаптеров
Alacritech 1000x1 Server and Storage Accelerator
Данный адаптер построен на основе контроллера Alacritech IPP 1000X1. Этот контроллер, помимо взаимодействия с интерфейсом PCI и сетью Ethernet (MAC-уровень), реализует фирменную технологию SLIC (Session-Layer Interface Card интерфейсная карта уровня сессии). В ее основе лежит метод TOE (TCP Offload Engine механизм разгрузки TCP), то есть большая часть стека TCP/IP (от физического до уровня сессии, всего пять из семи) выполняется самим адаптером. Однако стек протоколов TCP/IP занимает, к примеру, в ОС FreeBSD более 20 тыс. строк кода на C. Понятно, что реализовать не слишком дорогой контроллер, выполняющий все протоколы на аппаратном уровне, невозможно. Поэтому часть работы по-прежнему выполняет центральный процессор, на который возлагаются обязанности по установлению и разрыву соединения, по обработке ошибок и пакетов, пришедших вне очереди. Основную же, рутинную часть работы берет на себя контроллер, установленный на сетевой карте.
Функции контроллера физического уровня выполняет микросхема 88E1000-RJJ производства фирмы Marvell. На плате также расположены три микросхемы SDRAM HY57V64322OCT-6, представляющие собой 64 Мбит ОЗУ с организацией 16 Мбитх4. Для буферизации пакетов выделено 16 Мбайт памяти.
Состояние канала связи и адаптера отображается посредством четырех светодиодных индикаторов. Один из них ACT мигает при приеме и передаче данных, остальные 10, 100 и 1000 загораются в соответствии со скоростью соединения.
Как уже отмечалось, адаптер Alacritech 1000x1 Server and Storage Accelerator с драйвером версии 5.43.0.0 показал рекордно высокие результаты во всех тестах.
При размерах запроса вплоть до 2 Кбайт в режимах приема и передачи данных и вплоть до 8 Кбайт в дуплексном режиме работы адаптер Alacritech 1000x1 Server and Storage Accelerator показывает линейный рост трафика (рис. 3). После этого в режиме приема наблюдается насыщение на уровне 850-900 Мбит/с. Примерно на том же уровне происходит насыщение и в режиме передачи, однако при размерах запросов 32 Кбайт и 128 Кбайт наблюдаются характерные провалы в трафике вплоть до 600 Мбит/с.
В режиме дуплексного обмена данными при размере запроса более 8 Кбайт отмечаются провалы и всплески трафика, так что о насыщении в данном случае говорить не приходится. Максимальный сетевой трафик в данном режиме наблюдается при размерах запросов 8, 256 и 512 Кбайт и составляет приблизительно 1690 Мбит/с.
Благодаря технологии SLIC утилизация процессора при размерах запросов более 8 Кбайт весьма невысока, что приводит к значительно более высокому индексу эффективной производительности P/E, чем у всех остальных адаптеров. Особенно выгодным в этом плане является режим приема данных, где в полной мере сказывается использование технологии SLIC (рис. 4). Рекордно высокое значение индекса P/E повлияло на наше решение присудить данному адаптеру специальный знак «Редакция рекомендует» и еще раз пожалеть об отсутствии на российском рынке оборудования такого класса. Более подробную информацию о данном адаптере можно получить на сайте компании: http://www.alacritech.com/.
Рис. 3. Зависимость сетевого трафика от размера запроса для адаптера Alacritech 1000x1 Server and Storage Accelerator в различных режимах работы
Рис. 4. Зависимость индекса эффективной производительности от размера запроса для адаптера Alacritech 1000x1 Server and Storage Accelerator в различных режимах работы
3Com 3C996B-T
Сетевой адаптер 3Com 3C996B-T выполнен на однокристальном чипе производства Broadcom: контроллере физического уровня (PHY) и контроллере PCI/MAC BCM5701. Контроллер BCM5701 соответствует спецификациям PCI v.2.2 и PCI-X и, следовательно, способен работать с шиной PCI шириной 32/64 бит с частотой 33/66/133 МГц. Контроллер соответствует спецификации PC-99: поддерживаются ACPI, PCI Hot Plug, Wake on LAN, статистика для SNMP MIB II. Согласно стандарту IEEE 802.3p, поддерживается до 16 уровней приоритетов (при отсутствии внешней памяти до 4).
Кроме того, адаптер поддерживает создание до 64 виртуальных локальных сетей, соответствующих стандарту IEEE 802.1Q, и объединение портов (IEEE 802.3ad). Управление доступом к среде и потоком данных осуществляется как по методу CSMA/CD, так и согласно спецификации IEEE 802.3x при помощи обмена пакетами «Пауза».
Объем буферной памяти составляет 96 Кбайт, что предотвращает утерю пакетов внутри сетевого адаптера. Естественно, поддерживаются прямой доступ к памяти Bus Mastering DMA (64 бит/с, 100 МГц) и функция горячей замены.
Кроме совместимости с различными стандартами, в адаптере используются технологии, позволяющие снизить загрузку центрального процессора. Так, вычисление контрольных сумм TCP/IP/UDP при получении пакетов выполняется в контроллере BCM5701 сетевого адаптера, а не в центральном процессоре. Применяется также технология объединения прерываний для высвобождения процессорных ресурсов за счет сокращения числа прерываний и группировки пакетов.
Среди различных решений, реализованных в адаптере 3Com 3C996B-T, отметим возможность объединять несколько каналов сервера в один логический канал, двунаправленное выравнивание нагрузки (входящий и исходящий трафик) при подключении к коммутаторам любых производителей. К тому же адаптер поддерживает технологию восстановления серверных связей (Resilient Server Links), что позволяет резервным сетевым адаптерам (или сетевому адаптеру на материнской плате компьютера) резервировать активные сетевые адаптеры, включая адаптеры сторонних производителей. Когда вышедшая из строя плата вновь становится исправной и возвращается к активному состоянию, программное обеспечение снова назначает ее главным сетевым интерфейсом.
Как контроллер физического уровня, BCM5701 объединяет в одном корпусе приемопередатчики спецификаций IEEE 802.3ab 1000Base-T, IEEE 802.3u 100Base-TX и IEEE 802.3 10Base-T. Поддерживается функция Auto-negotiation. К достоинствам контроллера физического уровня относится также его способность обнаруживать и устранять многие проблемы, связанные с прокладкой и расконцовкой кабеля, в том числе перепутанные пары и ошибки полярности подключения. Во время подключения контроллер производит анализ кабеля и подбирает коэффициенты фильтров, улучшая таким образом характеристики канала приема/передачи.
Среди оригинальных новшеств отметим присутствие на плате специального датчика тактовых импульсных сигналов. Он дает возможность станциям удаленного управления проверять наличие специального периодического сигнала, отсутствие которого может означать отключение сервера.
На планке адаптера имеются четыре светодиодных индикатора. Три из них 10, 100 и 1000 указывают на скорость, с которой установлено соединение, а индикатор ACT мигает при обмене данными по сети.
Драйвер адаптера для Windows 2000 поддерживает объединение разнородных адаптеров по технологии Load Balancing, что позволяет получить отказоустойчивое соединение сервера с сетью. Возможно также статическое объединение по стандарту IEEE 802.3ad.
При тестировании адаптер с драйвером версии 2.67.0.0 показал высокие результаты (рис. 5, 6), войдя в тройку лидеров.
Рис. 5. Зависимость сетевого трафика от размера запроса для адаптера 3Com 3C996B-T в различных режимах работы
Рис. 6. Зависимость индекса эффективной производительности от размера запроса для адаптера 3Com 3C996B-T в различных режимах работы
При малых размерах запросов (до 4 Кбайт, а в дуплексном режиме до 16 Кбайт) сетевой трафик возрастает пропорционально размеру запроса как для исходящего, так и входящего трафика, причем интенсивность трафика и в том и в другом случае приблизительно одинакова. Однако в этом режиме для исходящего трафика средняя загрузка процессора составляет 90%, что препятствует дальнейшему росту пропускной способности. При последующем увеличении размера запроса уровень входящего трафика насыщается на уровне 900 Мбит/с. Поведение исходящего трафика несколько иное: при размере запроса 32 Кбайт наблюдается провал в интенсивности трафика.
Наивысшая достигнутая производительность составляет 1258 Мбит/с при размере запроса равном 512 Кбайт и при утилизации процессора равной 62% в режиме дуплекса.
Allied Telesyn AT-2930T
Данный адаптер построен на основе контроллера PCI и Ethernet AC1000, разработанного фирмой Altima, ныне находящейся в собственности корпорации Broadcom. Этот контроллер поддерживает интерфейс PCI v2.2 32/64 бит с частотой 33/66 МГц, 10/100/1000Base-T, полный и полудуплексный MAC, интерфейс TBI (SERDES) для поддержки сетей на оптоволокне. Он имеет функцию Wake on LAN, что соответствует требованиям ACPI, 48 Кбайт буферной памяти, может работать с количеством виртуальных сетей до 64 по спецификации 802.1Q, поддерживает приоритезацию пакетов до четырех уровней, сбор статистики по SNMP MIB II, Ethernet-like MIB (802.3x clause 30).
Контроллер физического уровня реализован на микросхеме BCM5411 10/100/1000Base-T Transceiver производства Broadcom.
Состояние адаптера отображается при помощи четырех светодиодных индикаторов: ACTIVE, 10, 100 и 1000. Первый из них горит при наличии связи с коммутатором и мигает при приеме/передаче данных, а остальные показывают скорость работы.
Как показало тестирование адаптера с драйвером версии 2.93.0.0 (рис. 7), при размерах запроса вплоть до 4 Кбайт сетевой трафик возрастает пропорционально размеру запроса в режимах приема и передачи данных. После этого в режиме приема данных наступает насыщение трафика на отметке приблизительно 900 Мбит/с. В режиме передачи данных наблюдается характерный провал при размере запроса в 32 Кбайт, но при дальнейшем увеличении размера запроса трафик насыщается на уровне 880-890 Мбит/с.
В дуплексном режиме работы возрастание трафика происходит вплоть до размера запроса 8 Кбайт, после чего, как и в режиме передачи данных, имеется характерный провал трафика при размере запроса в 32 Кбайт. При запросах размером более 32 Кбайт сетевой трафик в дуплексном режиме возрастает и достигает максимального значения в 1035 Мбит/с при размере запроса в 512 Кбайт. Отметим также, что использование дуплексного режима не позволяет существенно увеличить сетевой трафик по сравнению с режимами приема и передачи данных.
Наиболее выгодным с точки зрения утилизации процессора оказывается режим приема данных (рис. 8). Соответственно в этом режиме достигается максимальное значение индекса эффективной производительности P/E при всех размерах запросов. В режиме передачи и в дуплексном режиме значение индекса эффективной производительности P/E примерно одинаково при всех размерах запросов.
Рис. 7. Зависимость сетевого трафика от размера запроса для адаптера Allied Telesyn AT-2930T в различных режимах работы
Рис. 8. Зависимость индекса эффективной производительности от размера запроса для адаптера Allied Telesyn AT-2930T в различных режимах работы
D-Link DGE-550T
Данный адаптер построен на базе микросхемы DL-2000 (разработка и производство фирмы Tamarack, Inc. (http://www.tamarack.com.tw/), которая одновременно является контроллером интерфейса PCI и контроллером Ethernet 100/1000 Мбит/с (MAC-уровень). Контроллер PCI выполнен в соответствии со спецификацией PCI V2.2 и способен работать в режимах 32/64 бит с частотой 33/66 МГц. Для ускорения работы с интерфейсом PCI-контроллер разделен на две части: одна для чтения, другая для записи, что позволяет разгрузить центральный процессор в режиме полного дуплекса.
Чип DL-2000 полностью соответствует спецификации IEEE 802.3 и поддерживает скорость обмена от 100 до 1000 Мбит/с, что дает возможность работать как с гигабитными, так и с традиционными сетями Ethernet.
Наличие стандартного интерфейса GMII/MII позволяет применять стандартные устройства связи с физическим уровнем (PHY), а интерфейс TBI (Ten-Bit Interface) обеспечивает универсальность чипа, позволяя использовать его для построения адаптеров, работающих с оптоволоконным кабелем.
Контроллер PCI разработан в соответствии со спецификациями ACPI v1.0, PC-97, PC-98 и PC-99; PCI Power Management Specification v1 и OnNow.
Согласно спецификации Wake on LAN (WOL) осуществляется управление при помощи «магических» пакетов, адресованных пакетов, ARP-пакетов, а также изменение состояния кабеля (Phy status change).
Управление потоком происходит по спецификации 802.3x (полный дуплекс), включая автоматическую передачу пакетов «Пауза» при переполнении буферной памяти, а аппаратный подсчет контрольных сумм IPv.4, пакетов IP, TCP и UDP снижает нагрузку на центральный процессор.
Поддерживается приоритезация по спецификациям 802.1p и 802.1q в направлениях как на прием, так и на передачу данных. Обеспечивается сбор статистики согласно спецификациям RFC 1213 (MIB II), RFC 1398 (Ether-like MIB), IEEE 802.3 LME, вследствие чего снижается загрузка центрального процессора задачами управления и мониторинга.
Адаптер имеет внутренний буфер размером 16 Кбайт для передаваемых и 32 Кбайт для принимаемых пакетов. Поддерживаются также прием и передача гигантских пакетов (Jumbo packets).
Загрузка конфигурации адаптера происходит по последовательному интерфейсу из EEPROM при включении или перезапуске компьютера.
Связь с физическим уровнем осуществляется при помощи снабженной радиатором микросхемы 88E1000 Alaska производства фирмы Marvell (http://www.marvell.com/). Данная микросхема представляет собой полнофункциональный приемопередатчик физического уровня (PHY) и может осуществлять взаимодействие с сетями, построенными на базе протоколов 10Base-T, 100Base-TX и 1000Base-T. Она способна работать по интерфейсу IEEE 802.u MII или IEEE 802.3z GMII. При этом обеспечиваются функция Auto-Negotiation и автоконфигурирование MDI/MDIX на любой скорости обмена.
Состояние адаптера отображают четыре светодиодных индикатора: Link/Activity, Full Duplex, 1000 Mbps и 100 Mbps. Первый из них горит при наличии связи с коммутатором и мигает при приеме/передаче данных, второй загорается при наличии полнодуплексного соединения, а третий и четвертый отображают скорость работы.
Как показали результаты нашего тестирования с драйвером версии 1.0.10504.0 (рис. 9), в режиме приема данных интенсивность сетевого трафика возрастает пропорционально размеру запроса вплоть до размера запроса в 4 Кбайт. Данный участок зависимости характеризуется близкой к 100% степенью утилизации процессора, что и является причиной относительно невысокого трафика. При больших размерах запросов наступает относительная стабилизация сетевого трафика на отметке приблизительно 900 Мбит/с. В этом режиме насыщения утилизация процессора уменьшается пропорционально размеру запросов, что соответственно приводит к возрастанию индекса эффективной производительности P/E (рис. 10).
Интенсивность исходящего трафика линейно растет до размера запроса 8 Кбайт вплоть до 674 Мбит/с и падает до 402 Мбит/с при размере запроса 16 Кбайт, после чего происходит постепенное возрастание сетевого трафика с ростом размера запроса.
В дуплексном режиме передачи сетевой трафик возрастает пропорционально размеру запроса вплоть до размера запроса 8 Кбайт. После этого наблюдается характерный провал при размере запроса в 32 Кбайт и насыщение сетевого трафика при размерах запросов свыше 64 Кбайт на уровне примерно 800 Мбит/с. Отметим также, что в дуплексном режиме работы сетевой трафик оказывается ниже, чем в режиме приема, причем при любых размерах запросов.
С позиции индекса эффективной производительности P/E наиболее выгодным оказывается режим приема данных, поскольку в нем достигается максимальный сетевой трафик при минимальной степени утилизации процессора на любых размерах запросов.
Рис. 9. Зависимость сетевого трафика от размера запроса для адаптера D-Link DGE-550T в различных режимах работы
Рис. 10. Зависимость индекса эффективной производительности от размера запроса для адаптера D-Link DGE-550T в различных режимах работы
Gigabyte GC-LC03
Гигабитный сетевой адаптер Gigabyte GC-L03 создан на основе новейшего однокристального контроллера PCI/MAC/PHY Broadcom BCM5703, который способен работать с интерфейсом PCI v2.2 и PCI-X разрядностью 32/64 бит и тактовой частотой 33/66/100/133 МГц. Для промежуточного хранения пакетов предусмотрена встроенная память объемом 96 Кбайт. Для ускорения обработки в контроллере имеются два высокоскоростных RISC-процессора: один для принимаемых пакетов, другой для отправляемых. Поддерживается технология адаптивных прерываний и аппаратное вычисление контрольных сумм пакетов протоколов TCP, IP и UDP.
Наличествуют также поддержка виртуальных сетей по спецификации IEEE 802.1q и четыре очереди различных приоритетов по спецификации IEEE 802.1p.
Состояние адаптера и канала связи отображается при помощи четырех светодиодных индикаторов: Active, 10, 100 и 1000. Первый из них горит при наличии связи с коммутатором и мигает при приеме/передаче данных, остальные показывают скорость работы.
По результатам тестирования с драйвером версии 2.67.0.0 (рис. 11) сетевой трафик возрастает пропорционально размеру запроса в режимах приема и передачи данных вплоть до размера запроса 4 Кбайт. Как и у большинства адаптеров, в режиме передачи наблюдается провал в трафике при размере запроса в 32 Кбайт, однако у адаптера Gigabyte GC-LС03 этот провал незначителен. При размерах запросов более 32 Кбайт сетевой трафик в режиме передачи и приема данных насыщается на уровнях 840 и 900 Мбит/с соответственно.
В дуплексном режиме работы сетевой трафик возрастает пропорционально размеру запроса вплоть до 32 Кбайт, после чего насыщается на отметке примерно 1260 Мбит/с.
Говоря об индексе эффективной производительности P/E, подчеркнем, что для данного адаптера наиболее выгодным является режим приема данных (рис. 12), что объясняется относительно низкой утилизацией процессора в данном режиме.
С учетом того, что адаптер Gigabyte GC-LC03 показал наивысший результат при тестировании в модели доступа «Web-сервер» как по индексу эффективной производительности P/E, так и по абсолютному значению сетевого трафика, ему был присужден знак «Выбор редакции» в номинации «Лучший адаптер для Web-сервера».
Рис. 11. Зависимость сетевого трафика от размера запроса для адаптера Gigabyte GC-LС03 в различных режимах работы
Рис. 12. Зависимость индекса эффективной производительности от размера запроса для адаптера Gigabyte GC-LС03 в различных режимах работы
Intel PRO/1000 MT (PWLA8490 MT)
В основе адаптера Intel PRO/1000 MT лежит микросхема 82545EM, выполняющая функции контроллера интерфейса PCI-X с шириной 32/64 бит и тактовой частотой 33/66/133 МГц, контроллера Ethernet 10/100/1000 Мбит/с и контроллера физического уровня.
Для связи с центральным процессором сервера используются как встроенные регистры команд и данных, так и общие области в системной памяти.
Контроллер способен кэшировать до 64 дескрипторов пакетов и имеет 64 Кбайт буферной памяти для временного хранения данных во время пиковых нагрузок.
Адаптер поддерживает технологии Adaptive Load Balancing, Gigabit EtherChannel, Intel Link Aggregation, IEEE 802.3ad и Adapter Fault Tolerance, позволяющие гибко объединять несколько сетевых карт Intel PRO 1000T в единое логическое устройство, при этом сетевое соединение, помимо высокой скорости обмена, приобретает дополнительную устойчивость.
Адаптер Intel PRO/1000 MT обеспечивает функцию Mixed Adapter Teaming, позволяющую агрегировать несколько адаптеров различных типов в один логический, с большей производительностью.
При условии поддержки со стороны материнской платы поддерживаются PCI Hot Plug/Active PCI.
Для управления потоком в сети согласно IEEE 802.3x используются как метод CSMA/CD, так и пакеты «Пауза».
При установке в сервер нескольких адаптеров управление ими осуществляется одним драйвером.
По результатам проведенного тестирования с драйвером версии 6.2.21.0 в режимах приема и передачи данных вплоть до размера запроса 4 Кбайт наблюдается рост сетевого трафика пропорционально размеру запроса (рис. 13). При больших размерах запросов в режиме приема данных происходит насыщение сетевого трафика на уровне приблизительно 900 Мбит/с. В режиме передачи данных, как и для большинства других адаптеров, наблюдается провал в трафике при размере запроса 32 Кбайт. При больших размерах запросов сетевой трафик насыщается примерно на том же уровне, что и в режиме приема данных.
В дуплексном режиме работы сетевой трафик возрастает пропорционально размеру запроса вплоть до размера, равного 16 Кбайт. При размере в 32 Кбайт проявляется небольшой провал в производительности, что вызвано соответствующим провалом в режиме передачи данных. При больших размерах запросов сетевой трафик увеличивается и достигает своего максимального значения 1229 Мбит/с при размере запроса 512 Кбайт.
Как и для большинства адаптеров, в режиме приема достигается максимальный индекс эффективной производительности P/E, что объясняется меньшей, по сравнению с другими режимами, степенью утилизации процессора (рис. 14).
С учетом того, что данный адаптер показал наилучший результат по индексу эффективной производительности P/E при тестировании в модели доступа «файл-сервер», ему был присужден знак «Выбор редакции» в номинации «Лучший адаптер для файл-сервера».
Рис. 13. Зависимость сетевого трафика от размера запроса для адаптера Intel PRO/1000 MT в различных режимах работы
Рис. 14. Зависимость индекса эффективной производительности от размера запроса для адаптера Intel PRO/1000 MT в различных режимах работы
LG LNIC-1000T (64)
В основу адаптера LG LNIC-1000T (64) положены две микросхемы National Semiconductor: контроллер интерфейса PCI и Ethernet 10/100/1000 Мбит/с (MAC-уровень) DP8320 и контроллер физического уровня DP83861.
Контроллер MAC-уровня имеет внутренний буфер размером 8 Кбайт для передаваемых и 32 Кбайт для принимаемых пакетов.
Контроллер PCI, интегрированный в микросхеме DP8320, выполнен в соответствии со спецификацией PCI 2.2 и способен работать в режимах 32/64 бит с частотой 33/66 МГц. При этом поддерживаются спецификации ACPI v1.0, PC-97, PC-98, PC-99, PCI Power Management Specification v1 и OnNow. Обмен данными и дескрипторами пакетов осуществляется в режиме мастера, и при этом контроллер может осуществлять пакетный обмен блоками размером до 1024 байт. Микросхема DP8320 полностью соответствует спецификации IEEE 802.3 и поддерживает скорость обмена 10, 100 и 1000 Мбит/с, что дает возможность работать как с гигабитными, так и с традиционными Ethernet-сетями.
В соответствии со спецификацией Wake оn LAN (WOL) осуществляется управление при помощи «магических» пакетов, адресованных пакетов, ARP-пакетов и путем изменения состояния кабеля.
Наличие стандартного интерфейса GMII/MII дает возможность применять стандартные устройства связи с физическим уровнем (PHY). Наличие TBI (Ten-Bit Interface) обеспечивает универсальность микросхемы DP8320, вследствие чего ее можно использовать для построения адаптеров, работающих с оптоволоконным кабелем.
Управление потоком происходит по спецификации 802.3x (полный дуплекс), включая автоматическую передачу пакетов «Пауза» при переполнении буферной памяти, а подсчет контрольных сумм IPv.4, пакетов IP, TCP и UDP снижает нагрузку на центральный процессор. Внутренний буфер на передачу данных имеет размер 8 Кбайт, а для принимаемых данных размер буфера составляет 32 Кбайт. Также существует режим приема и передачи гигантских пакетов (Jumbo packets).
Для снижения нагрузки на центральный процессор (что немаловажно при высоких скоростях потока) подсчет контрольных сумм пакетов IP, TCP и UDP реализуется контроллером самого адаптера.
Из дополнительных функций в адаптере LG LNIC-1000T реализована поддержка приоритезации по протоколу 802.1p и создание виртуальных сетей VLAN по протоколу 802.1Q. Кроме того, обеспечивается сбор статистики, что упрощает задачи управления и мониторинга сети, а поскольку функцию сбора статистики реализует на аппаратном уровне сам адаптер, снижается загрузка центрального процессора компьютера.
На планке адаптера расположены шесть светодиодных индикаторов и COL, что является своеобразным рекордом. Наличие столь развитой системы светодиодной индикации позволяет наблюдать и контролировать весь процесс приема и передачи данных. Первые три индикатора позволяют определять скорость устанавливаемого соединения. Индикатор ACT позволяет судить о наличии сетевой активности в сети, а индикаторы FDX и COL определяют режим работы адаптера (полнодуплексный или полудуплексный).
Тестирование адаптера LG LNIC-1000T (64) с драйвером версии 5.0.1.24 выявило, что наиболее выгодным с позиции максимального сетевого трафика (рис. 15) и индекса эффективной производительности (рис. 16) является режим приема данных. В нем сетевой трафик возрастает пропорционально размеру запроса вплоть до величины запроса 4 Кбайт. При дальнейшем росте размера запроса (как и для всех адаптеров) наступает насыщение сетевого трафика.
В режиме передачи данных насыщение сетевого трафика на уровне 230 Мбайт/с наступает при размере запроса более 1 Кбайт. Как показало более детальное исследование с помощью программы мониторинга (Performance), сдерживающим фактором в данном случае является очередь запросов на передачу данных (Output Queue Length), которая принимала очень высокие значения.
В дуплексном режиме работы сетевой трафик имеет примерно среднее значение между режимом приема и передачи данных.
Рис. 15. Зависимость сетевого трафика от размера запроса для адаптера LG LNIC-1000T (64) в различных режимах работы
Рис. 16. Зависимость индекса эффективной производительности от размера запроса для адаптера LG LNIC-1000T (64) в различных режимах работы
Micronet SP2610
Как и предыдущий адаптер, Micronet SP2610 собран на двух микросхемах производства National Semiconductor: контроллере интерфейса PCI и Ethernet 10/100/1000 Мбит/с (MAC-уровень) DP8320 и контроллере физического уровня DP83861. Соответственно и технические характеристики адаптера Micronet SP2610 аналогичны характеристикам адаптера LG LNIC-1000T (64). Так, адаптер поддерживает 64/32 интерфейс PCI 2.2 с частотой 33/66 МГц, а пакетный обмен осуществляется блоками размером до 1024 байт.
Размер внутреннего буфера на передачу данных равен 8 Кбайт, а для принимаемых данных размер буфера составляет 32 Кбайт. Поддерживается режим приема и передачи гигантских пакетов.
Для снижения нагрузки на центральный процессор (что немаловажно при высоких скоростях потока) подсчет контрольных сумм пакетов IP, TCP и UDP реализуется контроллером самого адаптера.
В адаптере Micronet SP2610 реализована поддержка приоритезации кадров по протоколу 802.1p и создание виртуальных сетей VLAN по протоколу 802.1Q.
На планке адаптера расположены два светодиодных индикатора, один из которых Link/Act загорается при наличии сетевого соединения на физическом уровне и мигает при наличии сетевой активности; другой Gigabit загорается, если соединение осуществляется на скорости 1000 Мбит/с.
По результатам проведенного тестирования с драйвером National Semiconductor 5.0.1.24 адаптер Micronet SP2610 продемонстрировал очень хорошие результаты в режимах приема и передачи данных (рис. 17, 18), обогнав в режиме приема все остальные адаптеры при размере запроса 64…256 Кбайт, а при размере запроса 128 Кбайт даже Alacritech 1000x1 Server and Storage Accelerator. В обоих режимах передачи сетевой трафик возрастает пропорционально размеру запроса вплоть до размера запроса 8 Кбайт. При дальнейшем увеличении размера запроса сетевой трафик насыщается как в режиме приема, так и в режиме передачи. Характерно, что, как и в большинстве протестированных адаптеров, в режиме передачи имеется провал в трафике при размере запроса 16…32 Кбайт.
При тестировании адаптера утилитой IOmeter, создающей стрессовый режим нагрузки, выяснилась несовместимость адаптера с конкретной утилитой в дуплексном режиме. Поэтому у нас нет данных о трафике и индексе P/E в дуплексном режиме работы. Впрочем, в режимах передачи и приема, а также в модели доступа «файл-сервер», где, кстати, также присутствует дуплексный обмен данными, адаптер не только смог работать, но и продемонстрировал прекрасные результаты. Результаты в модели доступа «файл-сервер» оказались рекордно высокими по абсолютному значению сетевого трафика.
Рис. 17. Зависимость сетевого трафика от размера запроса для адаптера Micronet SP2610 в различных режимах работы
Рис. 18. Зависимость индекса эффективной производительности от размера запроса для адаптера Micronet SP2610 в различных режимах работы
Multi-Co EN-1006N
В адаптере Multi-Co EN-1006N применена архитектура, ставшая классической для построения гигабитных сетевых карт среднего класса: сочетание контроллера интерфейса PCI и Ethernet 10/100/1000 Мбит/с DP8320 и контроллера физического уровня DP83861 производства National Semiconductor. Среди протестированных нами адаптеров данное сочетание микросхем является наиболее распространенным. Напомним, что в соответствии с характеристиками контроллера интерфейса PCI и Ethernet 10/100/1000 Мбит/с DP8320 и контроллера физического уровня DP83861 адаптер поддерживает 64/32-битный интерфейс PCI 2.2 с частотой 33/66 МГц, а обмен данными и дескрипторами пакетов в режиме мастера. Пакетный обмен осуществляется блоками размером до 1024 байт.
Адаптер Multi-Co EN-1006N полностью соответствует спецификациям IEEE 802.3 и поддерживает скорость обмена 10/100/1000 Мбит/с.
Управление потоком происходит по спецификации 802.3x (полный дуплекс), включая автоматическую передачу пакетов «Пауза» при переполнении буферной памяти. Внутренний буфер на передачу данных имеет размер 8 Кбайт, а для принимаемых данных размер буфера составляет 32 Кбайт. Также поддерживается режим приема и передачи гигантских пакетов.
Поддерживается спецификация Wake on LAN (WOL), которая позволяет осуществлять управление состоянием адаптера при помощи «магических» пакетов, адресованных пакетов, ARP-пакетов и посредством изменения состояния кабеля. Для снижения нагрузки на центральный процессор (а это весьма важно при высоких скоростях потока) подсчет контрольных сумм пакетов IP, TCP и UDP реализуется контроллером самого адаптера.
Из дополнительных функций следует назвать поддержку приоритезации по протоколу 802.1p и создание виртуальных сетей VLAN по протоколу 802.1Q.
Состояние адаптера отображается при помощи четырех светодиодных индикаторов: Active, 10, 100 и 1000. Первый из них горит при наличии связи с коммутатором и мигает при приеме/передаче данных, а остальные показывают скорость работы.
По результатам тестирования адаптера Multi-Co EN-1006N с драйвером National Semiconductor 5.0.1.24 в режимах приема и передачи данных происходит линейный рост трафика вплоть до размера запроса 8 Кбайт (рис. 19). При больших размерах запроса трафик насыщается в режиме приема данных на уровне примерно 900 Мбит/с. В режиме передачи характерен провал трафика при размерах запроса 16…32 Кбайт.
В дуплексном режиме передачи трафик возрастает вплоть до размера запроса, равного 16 Кбайт, а при размере в 32 Кбайт наблюдается незначительный провал в производительности. Насыщение сетевого трафика на уровне 1100 Мбит/с наступает при размерах запроса более 128 Кбайт.
Что касается индекса эффективной производительности P/E, то наиболее выгодным является режим приема данных, но при больших размерах запроса (более 128 Кбайт) индексы эффективной производительности в режиме приема и в дуплексном режиме примерно равны друг другу (рис. 20).
Рис. 19. Зависимость сетевого трафика от размера запроса для адаптера Multi-Co EN-1006N в различных режимах работы
Рис. 20. Зависимость индекса эффективной производительности от размера запроса для адаптера Multi-Co EN-1006N в различных режимах работы
SMC 9462TX
Адаптер SMC 9462TX, как и большинство протестированных нами адаптеров, основан на наборе двух микросхем National Semiconductor: контроллере интерфейса PCI и Ethernet 10/100/1000 Мбит/с (MAC-уровень) DP8320 и контроллере физического уровня DP83861. Соответственно и характеристики данного адаптера полностью идентичны характеристикам адаптеров, построенных на подобных наборах микросхем (см. выше).
На планке адаптера расположены пять светодиодных индикаторов, позволяющих определять режим работы (1000, 100 и 10 Мбит/с), а также сетевую активность и наличие связи.
При тестировании мы использовали последнюю версию драйвера 1.1.528.2001. Адаптер продемонстрировал типичную картину зависимости производительности от размера запроса (рис. 21). В режиме приема данных трафик возрастает пропорционально размеру запроса до 4 Кбайт, а при дальнейшем увеличении размера запроса наступает режим насыщения трафика на уровне примерно 900 Мбит/с. В режиме передачи рост трафика наблюдается до размера запроса 8 Кбайт, а при размере запроса 16 Кбайт отмечается характерный провал.
В дуплексном режиме передачи трафик возрастает до размера запроса 8 Кбайт, после чего наступает режим относительной стабилизации. Отметим, что при больших размерах запросов (более 32 Кбайт) трафик в дуплексном режиме лишь немного превосходит трафик в режиме приема, а при размерах запросов менее 32 Кбайт трафик в режиме приема превосходит трафик в дуплексном режиме передачи.
Что касается индекса эффективной производительности (рис. 22), то наиболее выгодным является режим приема данных, что достигается благодаря как высокому сетевому трафику, так и относительно низкой утилизации процессора в данном режиме работы.
Рис. 21. Зависимость сетевого трафика от размера запроса для адаптера SMC 9462TX в различных режимах работы
Рис. 22. Зависимость индекса эффективной производительности от размера запроса для адаптера SMC 9462TX в различных режимах работы
Surecom EP-320GTX (National Semiconductor)
Данный адаптер тоже собран на двух микросхемах производства National Semiconductor: контроллере интерфейса PCI и Ethernet 10/100/1000 Мбит/с (MAC-уровень) DP8320 и контроллере физического уровня DP83861. Характеристики данного адаптера совершенно такие же, как у других адаптеров, построенных на подобном наборе микросхем (см. выше).
Адаптер снабжен четырьмя светодиодными индикаторами: Act, 10, 100 и 1000, назначение которых понятно из их названий.
При тестировании с драйвером версии National Semiconductor 5.0.1.24 адаптер продемонстрировал зависимость сетевого трафика от размера запроса (рис. 23), типичную для данного набора микросхем. В режиме приема данных трафик возрастает пропорционально размеру запроса до 4 Кбайт, а при дальнейшем увеличении размера запроса наступает режим насыщения трафика на уровне примерно 900 Мбит/с. В режиме передачи рост трафика также наблюдается до размера запроса 4 Кбайт, а при размере запроса 16…32 Кбайт происходит характерный провал. Однако по сравнению с другими адаптерами падение сетевого трафика при размерах запросов 16 и 32 Кбайт невелико.
В дуплексном режиме передачи трафик тоже возрастает до размера запроса 32 Кбайт, после чего наступает режим относительной стабилизации на уровне 1200 Мбит/с. При размерах запросов более 8 Кбайт трафик в дуплексном режиме превосходит трафик в режиме приема, а при размерах запросов менее 8 Кбайт трафик в режиме приема превосходит трафик в дуплексном режиме передачи.
Говоря об индексе эффективной производительности P/E (рис. 24), следует отметить, что при размерах запросов менее 32 Кбайт наиболее выгодным является режим приема данных. При больших размерах запросов индексы эффективной производительности P/E в режиме приема и передачи данных примерно соответствуют друг другу.
Рис. 23. Зависимость сетевого трафика от размера запроса для адаптера Surecom EP-320GTX (National Semiconductor) в различных режимах работы
Рис. 24. Зависимость индекса эффективной производительности от размера запроса для адаптера Surecom EP-320GTX (National Semiconductor) в различных режимах работы
Surecom EP-320GTX (Realtek)
По-видимому, этот адаптер настолько новый, что даже упаковка для него еще не разработана. Установить тип адаптера невозможно, не открывая коробки, а на сайте компании-производителя (http://www.surecom.com.tw/) никаких объяснений на этот счет не дается. Адаптер Surecom EP-320GTX основан на новом чипе RTL8169 производства известной тайваньской компании Realtek (http://www.realtek.com.tw/) с поддержкой режимов работы 33/64 бит с частотой 33/66 МГц. Этот чип работает как контроллер MAC/PCI и требует наличия контроллера физического уровня (PHY). Контроллер RTL8169 имеет два независимых буфера: 8 Кбайт на передачу и 48 Кбайт на прием данных.
Контроллер полностью соответствует спецификациям IEEE 802.3, 802.3u, 802.3z и 802.3ab, поддерживает передачу данных на скоростях 10, 100 и 1000 Мбит/с, имеет интерфейс MII/GMII и 1000 Мбит/с TBI для поддержки сетей на оптоволокне. Поддерживается функция автоустановления скорости соединения (N-way Auto-Negotiation) на скоростях 10, 100 и 1000 Мбит/с. Имеются функции разгрузки процессора при подсчете контрольных сумм пакетов IP, TCP, UDP и сегментации. Реализована поддержка виртуальных сетей по спецификации IEEE 802.1Q VLAN.
В качестве устройства, осуществляющего связь с физическим уровнем (PHY), служит известная микросхема 88E1000T, производимая компанией Marvell.
Адаптер снабжен четырьмя светодиодными индикаторами: Act, 10, 100 и 1000, о назначении которых говорят их названия.
Тестирование адаптера с драйвером версии 5.100.610.2002 показало (рис. 25), что компания Realtek осталась верной своим традициям: ориентация на массовый недорогой контроллер при его средних показателях. В режиме передачи трафик растет примерно линейно до размера запроса 8 Кбайт, а при размере запроса 16 Кбайт отмечается характерный провал. В режиме приема трафик носит примерно такой же характер, однако наблюдается незначительный провал при запросах размером 32 Кбайт. В дуплексном режиме рост наблюдается до размера 8 Кбайт, а провал при 16 Кбайт весьма существенен.
Что касается индекса эффективной производительности P/E, то наиболее выгодным является режим приема данных (рис. 26). В дуплексном режиме и режиме передачи индекс эффективной производительности P/E примерно одинаков для всех размеров запросов.
Рис. 25. Зависимость сетевого трафика от размера запроса для адаптера Surecom EP-320GTX (Realtek) в различных режимах работы
Рис. 26. Зависимость индекса эффективной производительности от размера запроса для адаптера Surecom EP-320GTX (Realtek) в различных режимах работы
TRENDnet TEG-PCITX2
Данный адаптер также собран на наборе микросхем National Semiconductor: DP83820 и DP83861. Первая микросхема является контроллером интерфейса PCI и Ethernet 10/100/1000 Мбит/с (MAC-уровень), а вторая контроллером физического уровня. Характеристики данного адаптера полностью соответствуют характеристикам адаптеров, построенных на идентичных наборах микросхем.
Адаптер TRENDnet TEG-PCITX2 снабжен шестью (!) светодиодными индикаторами: 10, 100 и 1000 отображают скорость текущего соединения, ACT свидетельствует о наличии приема/передачи данных, FDX загорается при связи в полнодуплексном режиме, а COL мигает в случае возникновения коллизий в режиме полудуплекса.
По результатам тестирования адаптера с драйвером National Semiconductor 5.0.1.24 можно сделать следующие выводы. Интенсивность трафика в режиме приема определяется размером запроса, но при размерах более 4 Кбайт трафик насыщается на уровне 900 Мбит/с (рис. 27). Утилизация процессорной подсистемы сервера в режиме приема экспоненциально убывает по мере роста размера запроса от 70 до 56%. Интенсивность трафика в режиме передачи растет до размера запроса 4 Кбайт и стабилизируется на уровне 830 Мбит/с. Трафик в дуплексном режиме работы растет до размера запроса 32 Кбайт, после чего стабилизируется на уровне 1200 Мбит/с.
При размерах запросов менее 32 Кбайт индекс эффективной производительности P/E выше в режиме приема данных, а при больших размерах запроса в дуплексном режиме работы (рис. 28).
Рис. 27. Зависимость сетевого трафика от размера запроса для адаптера TRENDnet TEG-PCITX2 в различных режимах работы
Рис. 28. Зависимость индекса эффективной производительности от размера запроса для TRENDnet TEG-PCITX2 в различных режимах работы
Редакция выражает признательность компаниям, предоставившим сетевые адаптеры
для тестирования:
|