O que significa DCI

Sep 15, 2025|

No cenário digital contemporâneo, os data centers tornaram -se a espinha dorsal da infraestrutura de computação em nuvem, processando volumes maciços de dados enquanto consomem quantidades substanciais de energia.

A pergunta "o que o DCI significa" freqüentemente surge nas discussões sobre arquiteturas modernas de data center, onde o DCI representa interconexão de data center, a tecnologia que conecta vários data centers para ativar o compartilhamento de recursos e a distribuição da carga de trabalho.

A energia - agendamento eficiente surgiu como um desafio crítico, exigindo abordagens sofisticadas para equilibrar os requisitos de desempenho com a otimização do consumo de energia. A metodologia de agendamento de redes de data center (dens) representa um avanço significativo para enfrentar esses desafios por meio de modelagem hierárquica e estratégias inteligentes de alocação de recursos.

Conceitos -chave em redes de data center

Interconexão de data center (DCI)

Tecnologia que conecta vários data centers para ativar o compartilhamento de recursos, a distribuição da carga de trabalho e a recuperação de desastres em instalações geograficamente dispersas.

Congestão de rede

Ocorre quando o tráfego da rede excede a capacidade, geralmente causada por limitações de buffer na infraestrutura Ethernet e incompatibilidades de largura de banda entre links.

Metodologia dens

Uma abordagem hierárquica para a programação de data center que otimiza a eficiência energética, mantendo o desempenho por meio de alocação inteligente de recursos.

Congestão de rede em ambientes de data centers

O desafio da Ethernet - infraestrutura baseada

Os data centers modernos adotam a filosofia de utilizar a Ethernet Media para transportar vários tipos de tráfego, incluindo comunicações LAN, SAN e IPC. Embora a tecnologia Ethernet ofereça maturidade, facilidade de implantação e gerenciamento relativamente simples, ela apresenta desafios significativos em termos de limitações de desempenho de hardware, particularmente na capacidade de buffer.

Os tamanhos típicos de tampão Ethernet operam no nível de magnitude de 100 kb, enquanto os roteadores da Internet geralmente apresentam tamanhos de magnitude de 100 MB. Essa diferença substancial de 1000X na capacidade do buffer, combinada com os padrões de tráfego de largura de banda- alta, constitui a principal causa de congestionamento da rede em ambientes de data center.

Comparação de capacidade de buffer

Ethernet alterna 100 kb

Roteadores da Internet 100 MB

A diferença de 1000X na capacidade do buffer cria desafios significativos para lidar com os padrões de tráfego de largura de banda altos - em data centers.

Manifestação de congestionamento em interruptores de data center

A manifestação do congestionamento nos interruptores de data center pode ocorrer em várias direções. Na direção do downlink, o congestionamento surge quando a capacidade agregada dos links de entrada excede a capacidade dos links de saída. Para direções de uplink, a incompatibilidade de largura de banda é determinada principalmente pela taxa de convergência de largura de banda, com congestionamento quando a largura de banda agregada de todas as portas do servidor ultrapassa a capacidade total de uplink do comutador.

Esses pontos de congestionamento, geralmente chamados de pontos de acesso, podem impactar severamente a capacidade da rede de data center de transmitir dados com eficiência, reduzindo potencialmente a taxa de transferência em até 70% em casos extremos.

Congestionamento do downlink

Ocorre quando o tráfego total de entrada excede a capacidade de saída de uma porta de comutador, criando gargalos no fluxo de dados de camadas de rede mais altas para mais baixas.

Congestão de uplink

Acontece quando o tráfego agregado do servidor excede a capacidade de elevação, normalmente determinada pela taxa de convergência de largura de banda do design da rede.

IEEE 802.1QAU Padrões e gerenciamento de congestionamento

Como funciona o 802.1qau

Interruptores sobrecarregados detectam congestionamento e geram sinais de notificação

Os sinais de congestionamento são propagados de volta ao envio de dispositivos

Os remetentes aceleraram suas taxas de transmissão para reduzir o congestionamento

A utilização da rede é mantida em altos níveis (até 95%)

A perda de pacotes é minimizada através do controle de taxa proativo

O grupo de tarefas de ponte do data center (IEEE 802.1) desenvolveu soluções de controle de congestionamento da camada 2, especificamente a especificação IEEE 802.1QAU. Este padrão introduz loops de feedback para notificação de congestionamento entre os interruptores de data center, permitindo que os interruptores sobrecarregados utilizem sinais de notificação de congestionamento para acelerar o alto - carregar remetentes.

Embora essa técnica impeça efetivamente a perda de pacotes devido ao congestionamento e mantenha altas taxas de utilização de rede de até 95%, ela não resolve fundamentalmente o problema subjacente.

"Uma abordagem mais eficiente envolve a implantação estratégica de dados - tarefas intensivas para evitar o compartilhamento de caminhos de comunicação comuns. Por exemplo, para aproveitar completamente as características de isolamento espacial de três - arquiteturas de camada, dados -} para que as tarefas intensivas devem ser distribuídas proporcionalmente.

Esses dados - tarefas intensivas, semelhantes aos aplicativos de compartilhamento de vídeo -, geram fluxos de bits constantes para os usuários finais enquanto se comunicam simultaneamente com outros trabalhos em execução dentro do data center. No entanto, esse método de implantação proporcionalmente distribuído contradiz a energia - objetivos de agendamento eficientes, que visam utilizar conjuntos mínimos de servidores e conjuntos de recursos de comunicação para lidar com todas as cargas de trabalho.

A estrutura de metodologia dens

Abordagem de modelagem hierárquica

A metodologia dens representa uma mudança de paradigma das abordagens tradicionais que modelam os data centers como conjuntos homogêneos de recursos de computação do servidor. Em vez disso, a DENS propõe um modelo hierárquico consistente com as principais topologias de data center.

Para três data centers de nível -, a métrica dens m é definida como uma combinação ponderada do servidor - função de nível f_s, rack - função f_r e módulo - função f_m:

M = × f_s + × f_r + × f_m

Onde, e representam coeficientes de ponderação que determinam como os componentes correspondentes (servidores, racks, módulos) influenciam as métricas de avaliação.

Coeficientes de ponderação

(Servidor - em peso) normalmente 0.7

FAVORES SELENDANDO HIL

(Rack - peso de nível) normalmente 0.2

Prioriza os racks de computação com baixas cargas de rede

(Módulo - peso de nível) normalmente 0.1

Favores selecionando módulos levemente carregados, crucial para consolidação de tarefas

Weighting Coefficients

Potencial de carga e comunicação do servidor

A combinação de carga do servidor L_S (L) e seu potencial de comunicação Q_S (Q) formam a base primária para a seleção do servidor. Este relacionamento é expresso através de:

f_s(l,q) = L_s(l) × (Q_s(q)^φ)/δ_t

L_s(l)

Depende da carga do servidor L, calculada usando uma função sigmóide especializada

Q_s(q)

Define a carga em uplinks de rack, analisando as condições de congestionamento na fila de saída da chave q

δ_t

Largura de banda sobre - fator de provisionamento no topo - de - switches (TOR)

Coeficiente Definindo a proporção entre l_s (l) e q_s (q) na métrica

Definição e otimização do fator de carga

O fator de carga dens é definido como a soma de duas funções sigmóides para enfrentar o desafio de que os servidores ociosos consomem aproximadamente 67% de seu pico de consumo de energia:

L_s(l) = 1/(1 + e^(-10(l - 0.5))) - 1/(1 + e^(-2(l - (1 - ε/2))))

O primeiro componente define a forma sigmóide primária, enquanto o segundo serve como uma função de penalidade projetada para convergir valores máximos de carga do servidor. O parâmetro ε define o intervalo e a inclinação da parte em declínio da curva.

Curva de otimização de carga do servidor

Server Load Optimization Curve

Essa abordagem sofisticada garante que os servidores operem dentro de variações ótimas de carga, normalmente entre 70% e 85% de utilização, equilibrando a eficiência energética com preocupações de confiabilidade de hardware.

Métricas de gerenciamento e congestionamento da fila

Análise de ocupação da fila

Todos os servidores de um rack compartilham uma chave TOR para comunicação uplink. Com taxas de gigabit, determinar a proporção exata da comunicação de uplink ocupada por servidores ou fluxos individuais se torna computacionalmente intensiva. Para enfrentar esse desafio, a metodologia DENS incorpora um componente relacionado à ocupação da fila de saída Q (q), que varia com a largura de banda sobre - fator de provisionamento δ.

A taxa de ocupação q é independente do tamanho da fila absoluta, mas varia com o tamanho total da fila Q_MAX, variando de [0,1], onde 0 e 1 correspondem a estados de fila vazia e completa, respectivamente. Ao introduzir o componente de ocupação da fila, a métrica dens pode responder a alterações de congestionamento em racks ou módulos, em vez de variações da taxa de transmissão.

Implementação de distribuição Weibull

A função Q (q) utiliza uma função de distribuição cumulativa Weibull inversa:

Q (q)=e^(- (3q/q_max)^2)

Esta formulação favorece a seleção de filas vazias enquanto penaliza filas fortemente carregadas. Quando os níveis de congestionamento permanecem baixos, a largura de banda sobre - fator de provisionamento Δ nas equações suporta melhor a simetria entre a capacidade de largura de banda de uplink e downlink.

Ocupação na fila versus desempenho

À medida que o congestionamento aumenta e os buffers transbordam, a incompatibilidade de largura de banda se torna imensurável, levando à degradação do desempenho de até 40% nos caminhos afetados

Métricas de desempenho e resultados de otimização

Bell - Função de seleção em forma

A função f_s (l, q) cria uma superfície em forma de sino - em relação à carga do servidor L e carga da fila q. Esta função seleciona preferencialmente os níveis de carga acima da média localizados em racks com congestionamento mínimo ou sem. Estudos empíricos demonstram que essa abordagem pode obter economia de energia de 25 - 35% em comparação com a programação tradicional de robina redonda, mantendo o desempenho dentro de 5% dos níveis ótimos.

Economia de energia

25-35%

Comparado à redonda tradicional - algoritmos de agendamento de robin

Desempenho

95%+

Mantém o desempenho dentro de 5% dos níveis ideais

Utilização

70-85%

Eficiência e confiabilidade ideais de equilíbrio na faixa de utilização do servidor

Análise de impacto hierárquico

Os fatores de impacto para racks e módulos são expressos como:

Rack - fator de nível

f_r (l, q)=l_r (l) × (q_m (q)^φ)/Δ_m=(q_m (q)^φ)/Δ_m × (1/n) σ (i =1 a n) l_s (l)

Onde l_r (l) representa a carga do rack como a soma normalizada de todas as cargas do servidor dentro do rack, n é o número de servidores por rack, q_m (q) é proporcional à carga de tráfego nos interruptores de entrada do módulo e δ_m é a largura de banda sobre -}}}} fator de provisionamento nos switches do módulo.

Módulo - fator de nível

f_m (l)=l_m (l)=(1/k) σ (j =0 para k) l_r (l)

Onde l_m (l) representa a carga do módulo como a soma normalizada de todas as cargas de rack dentro do módulo e k é o número de racks por módulo. O fator de nível do módulo - inclui apenas uma carga - componente relacionado, pois todos os módulos se conectam aos mesmos switches principais.

Considerações práticas de implementação

Comércio de eficiência energética - offs

Ao examinar o que o DCI significa para a energia - agendamento eficiente, fica claro que as implementações do DCI devem equilibrar cuidadosamente a otimização local dentro de data centers individuais em relação à otimização global entre as instalações interconectadas.

A metodologia DENS demonstra que a energia - agendadores eficientes devem consolidar trabalhos de data center dentro do menor conjunto de servidores possíveis, alcançando taxas de consolidação de 3: 1 ou superior em cenários típicos.

No entanto, a operação contínua em cargas de pico pode reduzir a confiabilidade do hardware em 15 a 20% e impactar os tempos de conclusão do trabalho em até 30%.

Energy Efficiency Trade-Offs

Troca -chave - offs

Maior consolidação reduz o consumo de energia

O equilíbrio de carga ideal melhora a eficiência da rede

Sobre - A consolidação aumenta o risco de falha (redução de confiabilidade de 15 a 20%)

As cargas de pico podem afetar os tempos de conclusão do trabalho em até 30%

Multi - Balanceamento de carga do caminho

O módulo - fator de nível f_m inclui apenas uma carga - componente relacionado L, pois todos os módulos se conectam aos mesmos interruptores de núcleo e obtêm uma largura de banda idêntica através de técnicas de roteamento de ECMP (-}-}}}}). Esse design garante que a distribuição do tráfego permaneça equilibrada nos caminhos disponíveis, com melhorias medidas na taxa de transferência de 40 - 50% em comparação com as abordagens de roteamento de caminhos únicos.

Benefícios de roteamento de ECMP

Distribui o tráfego em vários caminhos de custo -

Melhora a taxa de transferência por 40 - 50% vs. roteamento de caminho único

Aumenta a tolerância de falhas através da redundância do caminho

Funciona perfeitamente com o modelo hierárquico dens

Estratégias de otimização avançada

Ajuste dinâmico de peso

Pesquisas recentes exploraram o ajuste dinâmico dos coeficientes de ponderação, e baseado em características reais da carga de trabalho -.

Compute - cargas de trabalho intensivas =0.8, + =0.2

Comunicação - intensiva =0.4, =0.3, =0.3

Serviços de personalização de produtos

"A integração de fontes de energia renovável com algoritmos de agendamento baseados em dens - demonstrou um potencial notável para reduzir as pegadas de carbono em data centers de escala de hiperescala".

Redução de até 45% no consumo de energia da grade

Fonte: Zhang et al. (2024), transações IEEE em computação sustentável

Serviço de amostra grátis

A incorporação de algoritmos de aprendizado de máquina para prever padrões de tráfego e otimizar os parâmetros dens mostrou resultados promissores.

85% de precisão na previsão de congestionamento

Horizonte de previsão de 5 minutos

10-15% de economia adicional de energia

Validação experimental e resultados

Ambiente de simulação

Simulações extensas usando simuladores de eventos discretos validaram a metodologia dens em várias configurações de data center. Os cenários de teste incluíram data centers que variam de 1.000 a 100.000 servidores, com padrões de tráfego variados, incluindo serviços da Web (80% de leitura, 20% de gravação), processamento em lote (leitura/gravação equilibrada) e aplicativos de streaming (gravação de 95%, 5% de leitura).

Escala do servidor

1.000 a 100.000 servidores

Padrões de tráfego

Serviços da Web, processamento em lote, streaming

Tipo de simulação

Simuladores de eventos discretos

Métricas de desempenho

Principais indicadores de desempenho

Eficiência energética

28-42% de redução de energia em comparação com os agendadores de linha de base

Utilização de rede

Mantido 85 - 92% de utilização de rede sem perda de pacotes induzida por congestionamento

Tempo de conclusão do trabalho

Times médios aprimorados de conclusão do trabalho em 15-25%

Utilização do servidor

Alcançou a utilização ideal de servidor de 72-83%

Latência da fila

Latência média reduzida na fila em 35-45%

Comparação de desempenho

← Um par de: O que é o cabo DAC

O próximo artigo: Significado de DCI →

Enviar inquérito