Escolhendo o módulo óptico 400g certo

Dec 17, 2025|

Otransceptor 400G ópticoocupa uma posição peculiar na evolução do datacenter-chegou tarde demais para algumas implantações, cedo demais para outras e, de alguma forma, já sente a pressão dos anúncios de 800G antes de alcançar o verdadeiro status de commodity. O IEEE 802.3bs padronizou as especificações elétricas e ópticas em 2017, mas a realidade prática da seleção desses módulos envolve navegar em um cenário fragmentado onde os debates sobre fatores de forma se cruzam com restrições térmicas, onde a modulação PAM4 introduz modos de falha que os engenheiros de 100G nunca encontraram e onde as promessas de compatibilidade com versões anteriores ocasionalmente colidem com a física.

QSFP-DD ou OSFP. Todo mundo tem opiniões. Os debates nas conferências da OFC esquentam de uma forma que surpreende os recém-chegados ao setor.

Esta é a realidade prática: QSFP-DD ganhou o jogo do volume. A compatibilidade retroativa com a infraestrutura QSFP28 existente provou ser irresistível para as equipes de compras que já haviam investido pesadamente em cabeamento 100G e chassis de switch. Você pode literalmente colocar um módulo QSFP28 em uma porta QSFP-DD e ele funciona. Essa história de migração vendeu muito hardware.

Os proponentes do OSFP dirão-corretamente-que seu formato lida melhor com as térmicas. O volume físico extra (aproximadamente 50% maior que o QSFP-DD) permite orçamentos de energia de 15-20W em vez do teto mais restrito de 12-14W contra o qual os módulos QSFP-DD lutam. Quando você está promovendo óptica ZR coerente para aplicações DCI metropolitanas, esse espaço é muito importante.

Mas aqui está o que ninguém menciona nos materiais de marketing: a maioria das implantações empresariais não precisa de ZR. Eles precisam de DR4 para os percursos de 500-metros de folha-espinha, talvez FR4 para os links de 2 km de construção-a{9}}construção. Nesses níveis de potência, o QSFP-DD funciona bem. As vantagens térmicas do OSFP tornam-se acadêmicas.

Observei organizações passarem meses debatendo essa escolha apenas para perceber que seu fornecedor de switch já havia tomado a decisão por elas. Juniper mudou para QSFP-DD. A Arista oferece suporte a ambos, mas claramente favorece QSFP-DD em suas plataformas de volume. Se sua pilha de rede vier de um ecossistema de fornecedor, sua “escolha” do formato será amplamente teórica.

SR4, DR4, FR4, LR4, ER4, ZR-a convenção de nomenclatura tecnicamente faz sentido depois que você a memoriza, mas observar um engenheiro júnior tentando especificar uma lista de materiais pela primeira vez é doloroso.

SR4 oferece 100 metros em multimodo. Usa VCSELs de 850 nm, conector MPO-12, funciona com a fibra OM3/OM4 que já está em seu piso elevado. Opção mais barata de longe. Isso é o que você implanta em um único edifício de datacenter quando as distâncias entre racks ficam abaixo de 100 metros.

O DR4 se estende até 500 metros em modo-único usando óptica paralela-quatro fibras separadas a 1310 nm, cada uma transportando 100 Gbps. Ainda usa MPO-12, mas agora você precisa de uma planta-monomodo. O ponto ideal para conectividade{11}}de folha a espinha em instalações maiores.

FR4 e LR4 usam multiplexação de comprimento de onda para comprimir todos os quatro canais em um único par de fibras. FR4 atinge 2 km, LR4 avança para 10 km. Conectores LC duplex. Eles custam mais porque a óptica CWDM4 e a multiplexação/demultiplexação adicionam complexidade.

A confusão que vejo com mais frequência? Alguém especificou DR4 quando realmente precisava de FR4 porque contou errado os fios de fibra. DR4 requer 8 fibras (4 TX, 4 RX). FR4 requer 2 fibras (1 TX, 1 RX). Se o conduíte entre-edifícios tiver apenas um tronco de 12 fios e você estiver planejando vários links de 400G, a matemática não funciona com o DR4.

E então há a questão emergente.

Um módulo DR4 de 400G-pode se transformar em conexões DR de 4x100G-. Em teoria, isso proporciona flexibilidade de migração-compre agora uma infraestrutura de 400G e use-a no modo 4x100G até que as demandas de tráfego justifiquem a operação completa de 400G.

O discurso de marketing parece ótimo. A realidade fica mais confusa.

Breakout requer configurações de fibra específicas. Seu breakout DR4-para 4x100G-DR precisa de 8 fibras no lado 400G espalhando-se em quatro pares duplex no lado 100G. Esse não é um patch cord que você tem na gaveta de cabos. É uma montagem personalizada, geralmente com breakout MPO-12 a 4xLC, e é melhor você solicitar a polaridade correta ou passará uma noite com um rastreador de fibra e muita frustração.

Também vi fugas criarem complicações no licenciamento de portas de switch. Algumas plataformas contam cada faixa de 100G como uma porta licenciada separada. Outros não. Leia as letras miúdas antes de presumir que seu switch 400G de 32 portas realmente oferece 128 portas utilizáveis no modo breakout.

O SR8 oferece ainda mais flexibilidade de breakout-8x50G ou 2x200G, mas agora você está lidando com conectores MPO-16 e padrões de cabeamento estruturado que a maioria das instalações empresariais não implantou. Os buildouts de cluster de IA greenfield usam SR8 extensivamente. Adaptando um datacenter existente com SR8? Provavelmente não vale a pena a dor de cabeça com cabeamento.

A óptica pré-400G usava modulação NRZ. Dois níveis de sinal. Simples. Confiável. O laser está ligado ou desligado, alto ou baixo. Os diagramas oculares pareciam limpos.

400G trouxe o PAM4: quatro níveis de sinal codificando dois bits por símbolo. Você obtém o dobro da taxa de dados sem dobrar a taxa de símbolos. Solução brilhante para um problema de física.

Exceto que o PAM4 mudou fundamentalmente as características de erro dos links ópticos.

Com o NRZ, você tinha aproximadamente 9,5dB de margem de ruído entre os níveis de sinal. Com o PAM4, isso cai para cerca de 4,8dB. A penalidade teórica de SNR é de aproximadamente 10dB-calculada como 20×log₁₀(1/3) se você quiser uma matemática precisa. Essa não é uma diferença sutil. Isso representa uma redução dramática na imunidade ao ruído.

É por isso que a correção direta de erros se tornou obrigatória para 400G. Não é opcional. Não é "recomendado para distâncias maiores". Obrigatório.

A sobrecarga de FEC adiciona latência-visada a cerca de 100 nanossegundos nas especificações 802.3-e consome a largura de banda extra que aumenta as taxas de linha reais para 425 Gbps em vez de 400 limpos. Mais importante ainda, significa que seu link de 400G está sempre funcionando com uma taxa de erro de bit FEC diferente de -pré{8}}que é corrigida para efetivamente zero pós-FEC.

Pré-FEC BER em torno de 2,4×10⁻⁴ é considerado aceitável para DR4. Isso teria sido catastrófico para um link de 100G. Para 400G com Reed{7}}Solomon FEC, tudo bem. A taxa de perda de quadros pós{9}}FEC ainda atinge a meta de 10⁻¹².

Mas aqui está o que chama a atenção das pessoas: quando o FEC não consegue acompanhar-quando os erros pré-do FEC excedem o que o algoritmo de correção pode lidar-a falha não é normal. O link não se degrada lentamente. Ele cai de um penhasco. Em um momento tudo parece bem no painel de monitoramento, no momento seguinte você vê erros de quadro incorrigíveis e perda de pacotes.

Conectores sujos que um link 100G toleraria? Eles matarão um link 400G. Fibra marginal com atenuação ligeiramente elevada? A mesma história. A correção de erros mascara os problemas até que, de repente, isso não acontece.

Um switch 400G de 32 portas totalmente preenchido com módulos FR4 gera 320-384 W de calor apenas dos transceptores. Isso antes de contar o switch ASIC, fontes de alimentação, ventiladores. A potência total do sistema pode chegar a 1.500-2.000 W em um chassi de 1RU.

Os cálculos de densidade de rack que funcionaram para implantações de 100G precisam de revisão completa.

Os próprios módulos têm faixas de temperatura operacional-normalmente de 0 a 70 graus para uso comercial. Parece razoável até você perceber que a "temperatura do módulo" é medida no gabinete e que o gabinete fica em qualquer fluxo de ar fornecido pelo switch. Em um chassi totalmente preenchido com as portas acima e abaixo ocupadas por módulos igualmente quentes, esse fluxo de ar não é grande.

Já vi implantações em que os módulos no centro do painel frontal ficam de 8 a 10 graus mais quentes do que os módulos nas bordas. Mesmo ambiente, mesma carga de tráfego, condições térmicas dramaticamente diferentes com base puramente na posição física.

O design do dissipador de calor com aletas do OSFP ajuda aqui. As aletas aumentam a área de superfície para resfriamento convectivo, e o OSFP MSA especifica os requisitos de fluxo de ar que os projetistas de switches devem atender. QSFP-DD depende mais do design térmico do fornecedor do switch, que varia muito em qualidade.

Algumas das implantações de cluster de AI/ML migraram para refrigeração líquida exatamente por esse motivo. Loops de resfriamento direto-para{2}}o chip ou configurações de imersão total eliminam totalmente as restrições de fluxo de ar. Mas essa é uma decisão fundamental de infraestrutura, e não algo que você resolve escolhendo óticas diferentes.

Os transceptores OEM da Cisco ou da Juniper custam de três a cinco vezes o custo dos módulos equivalentes-de terceiros. Às vezes mais. A diferença de preço é significativa o suficiente para aparecer nas discussões de aquisição, mesmo em organizações que normalmente padronizam fornecedores únicos.

Terceiros-funcionam bem na maioria das vezes. As especificações MSA existem precisamente para permitir a interoperabilidade de vários-fornecedores. Um módulo QSFP-DD compatível é um módulo QSFP-DD compatível, independentemente do logotipo que aparece na etiqueta.

Na maioria das vezes.

Os casos extremos farão você questionar essa confiança. Alterne as atualizações de firmware que sinalizam repentinamente dispositivos ópticos de terceiros-em funcionamento-anteriormente como não suportados. Dados DOM/DDM preenchidos incorretamente porque o mapeamento da EEPROM não corresponde exatamente ao que o switch espera. Flaps de link intermitentes que acontecem apenas com determinadas combinações de fornecedores sob padrões de tráfego específicos.

A situação de suporte agrava a incerteza técnica. Ligue para o Cisco TAC com um problema de link e eles perguntarão sobre sua óptica. Se você estiver executando módulos-de terceiros, a conversa geralmente termina aí. “Substitua por transceptores suportados e ligue novamente se o problema persistir” é uma resposta frustrante, mas totalmente previsível.

Minha recomendação, custe o que custar: use-terceiros no laboratório, tenha muito cuidado na produção. A economia de custos de 70 a 80% parece menos atraente quando você está solucionando problemas às 2 da manhã e não pode descartar a óptica como uma variável.

Depois de todos os detalhes técnicos, a seleção do módulo geralmente se resume a algumas questões práticas:

Que distância você realmente precisa percorrer? Seja específico. Meça os trechos de fibra. Adicione margem para patches e emendas. Em seguida, escolha o tipo de módulo mais barato que atenda a essa distância e com espaço de sobra.

Que planta de fibra existe? Multimodo no edifício, o modo-único entre edifícios é o padrão comum. Não lute contra a sua infra-estrutura existente, a menos que tenha razões convincentes.

Qual é a sua plataforma de switch? O tipo de porta provavelmente já está decidido. QSFP-DD para a maioria das implantações empresariais, OSFP para alguns aplicativos de hiperescala e telecomunicações.

Quanto você confia em seu cabeamento? 400G é menos tolerante do que 100G. Se o seu cabeamento estruturado for questionável,-fibra antiga, terminações suspeitas, patches que foram reconectados dezenas de vezes-pode haver problemas. Limpe tudo. Teste tudo. O medidor de potência óptica e o escopo de inspeção não são mais opcionais.

400g Optical Module

Você precisa de flexibilidade de breakout? Se sim, leve isso em consideração na seleção do módulo e no projeto do cabeamento desde o início. A capacidade de retrofit de breakout é cara e perturbadora.

As construções de IA/ML já estão avançando em direção a 800G. Algumas organizações estão questionando se o 400G faz sentido como meta de implantação ou se deveriam esperar. Não existe uma resposta universal. Se o crescimento do seu tráfego justificar o investimento agora e o período de retorno funcionar financeiramente, implante 400G. Se você conseguir ampliar sua infraestrutura 100G por mais um ciclo de atualização, talvez o ecossistema 800G esteja pronto quando você precisar dele.

O conselho enfadonho geralmente é o certo: combine a tecnologia com os requisitos reais, compre de fornecedores em quem você confia o suficiente para apoiá-lo quando algo quebrar e lembre-se de que a opção mais barata geralmente não é barata quando você leva em conta o tempo de solução de problemas.

Ninguém nunca foi demitido por especificar transceptores que simplesmente funcionassem.

← Um par de: Compreendendo o módulo óptico 400g

O próximo artigo: Os transceptores 10GBASE LR atendem aos padrões de fibra →

Enviar inquérito

Escolhendo o módulo óptico 400g certo

A questão do fator de forma que não morre

Alcance variantes e o problema da sopa de letrinhas

Modos de breakout: úteis até que não sejam

PAM4 mudou tudo (nem sempre para melhor)

Pesadelos térmicos

A questão-do transceptor de terceiros

O que realmente importa na seleção