Академический Документы
Профессиональный Документы
Культура Документы
архитектура
маршрутизаторов и
ее особенности в
зависимости от их
назначения
Системный инженер Cisco Systems - Андрей Корж
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential 1
Цели сессии
2
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Содержание
3
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Содержание
4
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Что внутри маршрутизатора?
•
Обрабатывающие
элементы
•
control‐plane
–
OS
процессор
•
data‐plane
–
сетевой
процессор
•
Память
•
DRAM
для
OS
и
пакетных
буферов
•
SRAM
для
«кэшей»
различного
назначения
•
TCAM
для
быстрого
нахождения
и
доступа
•
соединения
•
шина
доступа
•
последовательный
линк
•
фабрика
коммутации
5
5
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Производительность или гибкость?
CPU
(Central
Processing
Unit)
•
процессоры
широкого
назначания
(CISC,
RISC)
•
высокая
гибкость
s/w
[недели
на
доп
функционал]
•
низкая
производительность[до
1Mpps]
•
применение:
маршрутизаторы
доступа
(ISR)
ASIC
(ApplicaKon
Specific
Integrated
Circuit)
•
одноцелевая
аппаратно
неизменная
функциональность
•
низкая
гибкость
реинжиниринга[2
года]
•
высокая
производительность[более
100
Mpps
сегодня]
•
применения:
коммутаторы
(Catalysts),
опорные
маршрутизаторы
NP
(Network
Processor)
=
“нечто
посредине”
•
производительность
+
программируемость,
наращиваемость,
параллельное
мультипроцессирование
•
умеренная
гибкость
s/w
[месяцы
на
доп
функционал]
•
умеренная
производительность
[4Mpps
–
40
Mpps+]
•
недешевы,
достаточно
энергоемки
•
уровни
программируемости–
u‐code,
C‐code
•
применение:
высокопроизводительные
функциональные
edge
и
агрегация
6
6
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Типы памяти
Сегодня
применяются
две
основных
технологии
памяти:
• StaKc
RAM
(SRAM,
SSRAM)
• Dynamic
RAM
(DRAM,
EDO
DRAM,
SDRAM,
DDR)
SRAM DRAM
7
7
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Типы памяти
(продолжение)
TCAM
(Ternary
Content
Addressable
Memory
Троичная Ассоциативная память)
SRAM
с
компаратором
для
каждой
ячейки
1
проход
–
очень
быстро,
но
очень
дорого
параллельное
выполнение
независимых
поисков
(ACL,
QoS,
Neflow,
FIB)
Содержимое и маска Адрес
. . .
192.168.100.xxx 801
192.168.200.xxx 802
192.168.300.xxx 803 Дерево
последовательных
поисков
. . .
8‐8‐8‐8
использует
в
IOS
в
большинстве
платформ
16‐8‐8
в
12000,
11‐8‐5‐8
‐
C10K
Альтернативные
подходы
–
192.168.200.111 802
8‐1‐1‐1‐1‐1‐1‐1‐1‐1‐1‐1...
(в
SRAM)
запрос результат
8
8
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved.
DENY
Cisco Confidential
Соединения
• шина
•
полудуплекс,
shared
medium
• Например
PCI
[800Mbps
до
25Gbps+
]
•
просто
и
дешево
•
Последовательный
линк
точка‐точка
•
выделенное,
одно
или
двух‐
направленное
соединение
•
например
SPI
[11.2Gbps+]
• синхронный,
с
кодированием
в
линии
•
Фабрика
коммутации(cross‐bar,
exchange)
• неблокируемая,
полный
дуплекс,
any‐to‐any
•
например
GSR,
ASR9k,
CRS
[40Gbps
to
9.6Tbps+
]
•
характеристики
•
cell
или
frame
коммутирующие
•
центральный
или
распределенный
арбитр
•
одно
или
двух
уровневая
коммутация
•
реплицирует
мультикаст
или
нет
9
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved.
•
есть
ли
реализация
QoS
в
с.
фабрике
Cisco Confidential
9
Содержание
10
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Эволюция маршрутизаторов
CPU
CPU and
Centralized ASIC
processing
7200 5500
Hybrid CPU
< 1Mppsprocessing
Unmatched< 1Mpps
Distributed ASIC
processing
flexibility
7500 Hybrid
Limited processing
NPU
flexibility,
< 1Mpps high
6500 Main High >10
Centralized
performance
CPU-ASIC-NPU
limit: Mpps
processing
(9xGE)
flexibility
performance
10000 Limited features
>1processing
ASIC-NPU
Distributed Mpps
Limited
Main
Main features
limit:
limit:
>50
Distributed bus bus
Mpps (resolved
speed in
architecture
processing
12000 NPU
7600 nextMain
Complex>50 limit:
hardware Mppscomplex
releases)
feature
Centralized
NPU
architecture
dependencies
Complex (before
feature
Massively >1 NPUMpps
distributed
Main limit: features
dependencies
Eng3/5)
In-line
>500features
Mpps with
распределенная
ASR1000 CRS performance
>50 architecture
Almost ideal Mpps
ASR9000 Main limits:
Main limits:
Единая performance,
complex
архитектура
Main architecture
complexity, 20G/slot
Mainlimits:
limits:centralized
price
Централиз. Полностью распред. РаспределеннаяОграничение: linecard NPU
NPU (QFP) NPU (CPP, QFAP) ASIC (EARL) +
NPU (EzChip)
11
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Содержание
12
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Выбор архитектуры или архитектура
выбора
Централизов
Catalyst 4500 250 320 анный 4 (no code) 2 500
1x1
Распределен
Cisco XR12000 240 300 ный. 250 (u-code) 25 6500
15x4
Централизов
Cisco ASR1000 16 20 анный 2000 (C code) 30 5000
1x40
13
13
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Инженерные ограничения
14
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Цена как ограничение
15
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Ватты и джоули
16
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Ватты и джоули(продолжение)
side-to-side
Требует более широкого шасси
front_top-to-back_bottom
Ограничивает размер линейных карт
18
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Габариты
19
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Производительность
1. Враждующий треугольник : Пропускная способность
- производительность forwarding (PPS) -
используемый функционал
2. Сохранение абсолютной скорости линейного
интерфейса(в pps) - дорого.
Линейные карты CRS поддерживают множество функционала
за счет дорогого процессора обработки (MSC), часто
предпочитаются менее производительные недорогие (FP)
21
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Инновационность и технологичность
23
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Коротко о дизайне чипов
1. Electronic design automation (EDA)
2. ULSI (Ultra Large Scale Integration)- >1M
транзисторов.
3. Функциональный дизайн(используя библиотеки)
– Размер, э/потребление, clocking speed
26
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Эволюция фабрик коммутации
• Шина ‐> 1‐ступ. фабрика ‐> 2‐ступ. фабрика
• Ac†ve/standby фабрика ‐> ac†ve/ac†ve фабрика
• STM‐4 ‐> STM‐16 ‐> 10GE ‐> STM‐256 ‐> 100GE
• входящая ‐> исходящая репликация mul†cast
• Fabric QoS (на уроках 76/12k!)
• Общий RX/TX ASIC‐> независимые RX и TX ASIC
27
27
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Что такое фабрика коммутации?
Egress
Fabric Channel Linecards
• addressable fabric port
• one big pipe
RX RX RX RX
1 2 3 4
Ingress
1 What capacity?
Linecards TX
4 канала @ 10Gbps
неблокируемая
2
TX
MULTICAST
to slots 2,3,4 Инженерное:
3 4 * 10 = 40Gbps fdx
TX
UNICAST Маркетинговое:
to slot 3
4 * 10 *2 = 80Gbps
4
TX
UNICAST
to slot 3
28
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Как выглядела бы идеальная фабрика
29
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Компромисы к дизайну фабрики
1. «Субпорты» и настоящая неблокируемость крайне
дорога
2. Попытка минимизировать :
Более высокая скорость обработки внутри фабрики чем
требуется линейным картам
дополнительная обработка очередей и управление
потоками внутри фабрики
30
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Cisco CRS-1 фабрика коммутации
50 Gbps
136 Bytes Cells 100 Gbps/LC(2)
Fabric (2.5X Speedup)
40 Gbps Chassis
8 of 8
8 16
S1 S2 S3
2 2 of 8
2
1 of 8
Line Card 1 1 Line Card
S1 S2 S3
31
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Почему нужен speedup?
1. Блокировка субпортов и speedup
10G
10G
10G
20G STM16
2,5G
0G
STM16
2,5G
0G
STM16
2,5G
0G
STM16
32
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Примеры фабрик
8x 2.5Gbps links
4x 2.5Gbps links
7+1 switch fabric
• Cisco CRS-1/16,
• 40G linecard, 18x18 matrix 40G TX RX 40G
• 1 fabric port на слот
• active/active redundancy
per-cell loadsharing
• cell-based (136B cell), more 8 planes = 80Gbps
- 8/10 code = 64Gbps
packets packed in a cell - cell tax = ~56 Gbps
Active RSP
2x 3.125Gbps links
4:4 switch fabric
• Cisco 7600, 720 Gbps
20G TX RX 20G
• 40G linecard, 18x18 matrix
• 2 fabric ports на слот
per-bit loadsharing • active/standby redundancy
4 planes = 25Gbps
- 8/10 code = 20Gbps • frame-based (64-9KB)
Standby RSP 33
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
“Non-Blocking”?
Ingress Egress
Linecards Linecards
TX
10G 10G RX
Port-to-Port трафик
• Нет потерь пакетов
TX
10G 10G RX
TX
10G 10G RX Any-to-Any трафик
• Voice/Video/Data
TX
10G 10G RX • Unicast/Multicast
• есть потери! Почему?
34
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Multicast репликация
репликация на выходе
Ingress RX
Linecards Хорошо:
Репликация на выходе
TX RX
• Cisco CRS, 12000
• Cisco ASR9K, 7600
TX RX
10Gbps of multicast
RX
eats 10Gbps fabric bw!
Неплохо:
Ingress RX
Ingress RX
Linecards Плохо:
TX RX
Репликация на входе
• один репликационный
чип
TX RX
10Gbps multicast
RX
съедает 160Gbps fabric bw!
(10G multicast невозможен)
RX
Ingress RX
RX
Достаточно неплохо:
RX
Linecards
бинарная репликация
TX
TX
TX
RX
RX
RX
на входе
TX RX
• примитивная фабрика
TX
TX
RX
RX
коммутации
TX RX
TX RX
10Gbps multicast
RX
съедает 80Gbp fabric bw!
RX
RX
RX (10G multicast
36
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
невозможен)
Binary Tree проблемы Egress LC’s
01
X
02
03
33
34
36
38
40
42
44
46
48
63
64
X
Ingress DPC X
OIR
пролема
•
при
извлечении
линейной
карты
потоки
видео
теряются
хаотически
37
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Cell tax - пояснения
cell Фикс. overhead [cell header, ~10%]
Пример формата hdr
cell payload
Относительный overhead [fabric header]
[48B]
ячейки: [5B]
изменяемый overhead [padding]
1100
100
200
300
400
500
600
700
800
900
1000
1200
1300
1400
1500
38
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved.
L3 Размер пакета [B]
Cisco Confidential
Cell tax невидимы трафику в CRS
140%
120%
100%
Percentage
of
Linerate
80%
60%
40%
20%
0%
40
100
200
300
400
500
600
700
800
900
1000
1100
1200
1300
1400
1500
L3
Размер
пакета[B]
cell
buffer
buffer
hdr
hdr
IP
Packet
1
hdr
IP
Packet
2
120%
100%
Процент
от
Linerate
80%
60%
40%
20%
0%
40
100
200
300
400
500
600
700
800
900
1000
1100
1200
1300
1400
1500
L3
Размер
пакета
[B]
40
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Cell tax ухудшение + 10% multicast
(за счет binary tree таксы на репликацию)
140%
120%
100%
Процент
от
Linerate
80%
60%
40%
20%
0%
40
100
200
300
400
500
600
700
800
900
1000
1100
1200
1300
1400
1500
L3
Размер
пакета
[B]
41
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Cell tax худший случай – при отказе одного
из модулей фабрики
140%
120%
100%
Процент
от
Linerate
80%
60%
40%
20%
0%
40
100
200
300
400
500
600
700
800
900
1000
1100
1200
1300
1400
1500
L3
Размер
пакета
[B]
42
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Избыточность фабрики – отказ fabric card
1. failed: 56G 49G 2x overspeed
2. failed: 49G 42G
CRS-1
• 40G eth. Неблокируема
при отказе 1 или 2 fabric
cards 40G TX RX 40G
CRS-3
• 100G eth. Неблокируема
при отказе 1 или 2 fabric
X
cards X
Active RSP
failed RSP: 180G 90G
ASR9000
TX RX • 80G Неблокируема при
80G 80G отказе RSP
TX Active RSP RX
• cell tax – не проблема
X (superframe-based fabric,
не cell based)
Standby RSP 43
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Избыточность фабрики – отказ fabric card
CRS-1: 56G 49G 42G 2x egress speedup
CRS-3: 141G 123G 106G
CRS-1
• 40G eth. Неблокируема
при отказе 1 или 2 fabric 40G TX RX 40G
cards 100G
100G
CRS-3
• 100G eth. Неблокируема
при отказе 1 или 2 fabric
X
cards X
Active RSP
failed RSP: 184G 92G
ASR9000 корректный
TX RX active/active
80G
80G
• 80G Неблокируема при
TX Active RSP RX
отказе RSP
X
• 2 х SFM/RSP’s (SF + RP) Active SFM
• blocking if only 1 SFM active x8
TX RX
50G
50G
Active SFM
x8
TX RX
80G
Active SF 80G
Вариант 2
X
RX
TX • 3rd SF (inactive control-plane)
TX RX
• no backward compatibility
RX
TX
Active SF
• blocking if only 2 SF’s active
45
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
HoLB (Head of Line Blocking)
решение:
Полосы по смягчение/решение:
направлениямs Есть место для разъезда
(= Virtual Output Queues) (= Overspeed)
Traffic Lights
(= Arbiter!)
46
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Хорошее HoLB решение
Планировщик + Backpressure + QoS
неявный backpressure +
Ingress Egress Linecard Queues (VOQ)
Linecards arbiter Linecards
grant • Cisco 12000 или ASR9000
10G 14G RX
TX
• VOQ (Virtual Output Queues)
IP ASIC cell ASIC no Grant = implicit backpressure на исходящий слот
10G 14G
8q
8q
TX RX A9K To-Fab: 266
Virtual Output Queues (IP)
A9K From-Fab 36
- 8 на ислодящий слот (IPP/
EXP)
- Voice: strict scheduling
Speedup Queues (packets)
- Multicast: separate queues - u’cast: strict EF, AF, BE
explicit
backpressure - m’cast: strict Hi, Lo
40G 112G
TX RX явный backpressure +
Fabric Queues
TX
40G 112G RX • Cisco CRS (1296 slots!)
S1
S2 S3
Input Q’s (IP) • 6144 destination queues
Destination Queues (packets) Fabric Queues (cells)
- configurable
- shaped
- u’cast: strict Hi, Lo - u’cast: strict Hi, Lo • 512 speedup queues
- m’cast: strict Hi, Lo - m’cast: strict Hi, Lo
• 4 очереди в каждой точке
(Hi/Lo UC/MC) + vital bit 47
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Ограниченный и недостаточные HoLB
обходы Virtual Output Queues и Backpressure
Ingress Egress
arbiter
Linecards Linecards Порог отбрасывание
grant
20G 20G низкоприоритетного
RX
TX
трафика
• Cisco 7600 clear-block
20G 20G RX
TX
• арбитр с backpressure
Fabric Queue Threshold • входной порог для
- drops data packets causing HoLB
- protects Voice/Video traffic! приоритетного трафика
Overspeed Queues
- Нет строгого планирования • защита voice/TV при
- Нет multicast очереди загрузке
arbiter
grant
10G 18G RX
бедный Fabric QoS дизайн
TX
request/grant loss • не-linerate распред. арбитр
voice/video loss!!! = high latency!!!
10G 18G RX
-увеличение задержки при
TX
нагрузках
Destination Queues • 2 равновесовые очереди
- no strict scheduling
- no multicast queues -отбрасывает и voice/video
48
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Пропускная способность фабрики и арбитр
Почему неблокируемые фабрики блокируются?
Egress
send to slot2
Arbiter Linecards
Ingress
TX Scheduler RX
Linecards GRANT CELL
Центральный
синхронный
CELL
TX RX арбитр
•
Cisco
12000,
7600,
ASR9K
TX RX
•
неблокируемая
арбитрация
TX
non‐blocking
RX
SF
загружается
на
100%
емкости.
Ingress Egress
Linecards grant
non‐blocking*)
arbiter Linecards
Асинхронный
TX RX
распределенный
арбитр
timeout arbiter
TX RX • Dual
grant
problems
2 requests(1 lost)
•
Dual
request
problem
2 grants (1 lost) arbiter
TX RX
SF
начинает
блокироваться
timeout arbiter
TX RX при
загрузке
>66%.
*)
if
not
loaded
too
much
49
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Что еще стоит заметить о
перспективных дизайнах фабрики
1. Универсальность фабрики?
2. Фабрика коммутации Cisco 12000 имела дизайн
позволяющий транспортировать АТМ ячейки.Эта
емкость фарики – на сейчас невсотребована.
3. Фабрики коммутаций новых платформ вполне
могут быть гибридными сочетая способность
обрабатывать фрэймы наряду с иными видами
коммутации.
50
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Содержание
51
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Почему не CPU?
Sponge
Metro
Sharq
Reindeer
QLink Bambi
54
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
Опросник к выбору оборудование под
практическое применение
Фабрика
Фабрика Фабрика Фабрика Forwarding
коммутации
Стоимость 10G коммутации коммутации коммутации процессор
масштабируенмос
ть арбитрация Multicast overspeed
Синхронная Репликация,
ASIC/NP -
Агрегация центральная отдельные
микрокод
очереди
Репликация,
SMP/NP - С
отдельные SMP/NP - С
Edge код
очереди код
55
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential
56
Presentation_ID © 2008 Cisco Systems, Inc. All rights reserved. Cisco Confidential