Um ex-engenheiro da NASA e especialista em nuvem do Google explica por que construir um centro de dados no espaço é uma ideia completamente impraticável, cheia de desafios em vários aspectos, desde energia, dissipação de calor até resistência à radiação. Este artigo é baseado em um texto de Taranis, organizado, traduzido e redigido pela Dongqu. (Resumo: Este homem quer enviar equipamentos de mineração de Bitcoin para o espaço: luz solar infinita + custo de resfriamento zero é o paraíso da mineração de BTC) (Contexto adicional: Mover a Barragem das Três Gargantas para o espaço) A China planeja construir uma usina de energia solar no espaço, a humanidade terá liberdade energética?) Para esclarecer, sou um ex-engenheiro/cientista da NASA, com doutorado em eletrônica espacial. Também trabalhei no Google por 10 anos, passando por vários departamentos da empresa, incluindo o YouTube e o departamento de nuvem responsável pela implementação de capacidades de computação em IA, então estou qualificado para opinar sobre este assunto. Em resumo: definitivamente é uma ideia péssima, realmente não faz sentido. As razões são muitas, mas em uma palavra, o equipamento eletrônico necessário para operar um centro de dados, especialmente aqueles que implantam capacidades de computação em IA na forma de GPUs e TPUs, simplesmente não é adequado para operar no espaço. Se você nunca trabalhou nesse campo antes, eu gostaria de avisá-lo para não assumir por intuição, porque a realidade de fazer hardware espacial operar no espaço não é necessariamente óbvia. Energia A principal razão pela qual as pessoas querem fazer isso parece ser que há muita energia no espaço. A realidade não é essa. Basicamente, você tem duas opções: energia solar e energia nuclear. Energia solar significa implantar uma matriz de painéis solares com células fotovoltaicas — basicamente equivalente ao equipamento que eu tenho no telhado da minha casa na Irlanda, só que no espaço. Pode realmente funcionar, mas não vai magicamente ser melhor do que instalar painéis solares na superfície — você perde energia através da atmosfera, mas não tanto, então a intuição sobre a área necessária é aproximadamente correta. A maior matriz de energia solar implantada no espaço é o sistema da Estação Espacial Internacional (ISS), que pode fornecer um pouco mais de 200kW de energia em pico. É importante mencionar que implantar esse sistema requer várias missões de ônibus espaciais e muito trabalho — sua área é de cerca de 2.500 metros quadrados, mais da metade do tamanho de um campo de futebol americano. Tomando a NVIDIA H200 como referência, a demanda de potência de cada dispositivo GPU é de cerca de 0,7kW por chip. Eles não podem operar sozinhos e a conversão de energia não é 100% eficiente, então, na verdade, 1kW por GPU pode ser uma referência melhor. Assim, uma enorme matriz do tamanho da ISS pode alimentar cerca de 200 GPUs. Isso parece muito, mas vamos manter alguma perspectiva: o centro de dados que a OpenAI está prestes a construir na Noruega pretende acomodar 100.000 GPUs, cada uma possivelmente consumindo mais energia que a H200. Para alcançar essa capacidade, você precisaria lançar 500 satélites do tamanho da ISS. Em comparação, um único rack de servidor (como os vendidos pré-configurados pela NVIDIA) acomodaria 72 GPUs, então cada satélite gigante equivale a cerca de três racks. A energia nuclear também não ajuda. Não estamos falando de um reator nuclear — estamos falando de geradores termoelétricos de isótopos radioativos (RTG), cuja potência típica é de cerca de 50W – 150W. Portanto, não é nem mesmo suficiente para operar uma única GPU, mesmo se você conseguisse convencer alguém a lhe dar uma porção de plutônio subcrítico e não se importar em ter centenas de chances de espalhá-la em uma ampla área quando o veículo de lançamento se autodestroi explosivamente. Dissipação de Calor ISS Sistema avançado de controle térmico (Boeing) Eu vi muitas pessoas comentando sobre esse conceito dizendo: “Bem, o espaço é frio, então o resfriamento deve ser fácil, certo?” Uh… não… realmente não é. O resfriamento na Terra é relativamente simples. A convecção do ar funciona muito bem — deixando o ar passar por uma superfície, especialmente uma dissipadora de calor projetada com uma grande relação área-volume, pode transferir calor da dissipadora para o ar de forma bastante eficaz. Se você precisar de uma densidade de potência maior que a resfriamento direto (e GPUs de alta potência definitivamente se enquadram nessa categoria), você pode usar resfriamento líquido para transferir o calor do chip para dissipadores de calor maiores em outro lugar. Em centros de dados na Terra, normalmente, são estabelecidos ciclos de resfriamento, onde as máquinas são resfriadas por um fluido refrigerante (geralmente água), que é bombeado ao redor do rack, extraindo calor e devolvendo o refrigerante ao ciclo. Normalmente, o refrigerante é resfriado por convecção para o ar, então de qualquer forma, assim é como funciona na Terra. No espaço, não há ar. O ambiente é próximo ao vácuo absoluto, sem diferença prática, então a convecção simplesmente não ocorre. Em engenharia espacial, geralmente consideramos gerenciamento térmico, não apenas resfriamento. A verdade é que o espaço em si não tem temperatura. Somente a matéria tem temperatura. Isso pode te surpreender, mas no sistema Terra-Lua, a temperatura média de quase qualquer coisa é basicamente a mesma que a temperatura média da Terra, porque é por isso que a Terra tem essa temperatura específica. Se o satélite estiver girando, um pouco como um frango em uma grelha, ele tende a manter uma temperatura consistente, aproximadamente semelhante à superfície da Terra. Se não estiver girando, o lado oposto ao sol ficará gradualmente frio, devido à limitação do fundo cósmico de micro-ondas, cerca de 4 kelvins, ligeiramente acima do zero absoluto. No lado ensolarado, a situação pode ficar bastante quente, atingindo várias centenas de graus Celsius. Portanto, o gerenciamento térmico precisa de um design muito cuidadoso para garantir que o calor seja cuidadosamente direcionado para onde precisa ir. Porque no vácuo não há convecção, isso só pode ser alcançado através de condução ou algum tipo de bomba térmica. Eu projetei hardware espacial que voou no espaço. Em um caso específico, projetei um sistema de câmera que precisava ser muito compacto e leve, enquanto ainda fornecendo capacidade de imagem em nível científico. O gerenciamento térmico foi fundamental no processo de design. Tinha que ser, porque a energia é escassa em pequenas naves espaciais, e o gerenciamento térmico deve ser realizado enquanto minimiza o peso. Então, para mim, não havia bombas térmicas ou coisas sofisticadas: eu segui outra direção, projetando um sistema que consome no máximo cerca de 1 watt em pico, e quando a câmera está ociosa, cai para cerca de 10%. Todo esse poder se transforma em calor, então se eu só consumir 1 watt ao capturar imagens e, em seguida, desligar imediatamente o sensor de imagem após os dados entrarem na RAM, posso reduzir o consumo pela metade e, então, quando as imagens são baixadas para o computador de voo, posso desligar a RAM, reduzindo a potência para um nível relativamente pequeno. O único gerenciamento térmico necessário era fixar as bordas da placa de circuito ao rack, para que as camadas de cobre dentro da placa pudessem transferir qualquer calor gerado. O resfriamento mesmo de um único H200 seria um pesadelo absoluto. É óbvio que dissipadores de calor e ventiladores não funcionariam, mas há uma versão líquida do H200. Supondo que essa versão seja utilizada. Esse calor precisa ser transferido para a placa de dissipação — isso não é como o radiador do seu carro, lembre-se de que não há convecção? — ele precisa irradiar calor para o espaço. Supondo que possamos direcioná-lo para longe do sol. O sistema de controle térmico ativo da ISS (ATCS) é um exemplo desse tipo de sistema de controle térmico. É um sistema muito complexo que utiliza circuitos de resfriamento de amônia e grandes sistemas de placas radiativas. Seu limite de dissipação de calor é de 16kW, então cerca de 16 GPUs H200, ligeiramente mais do que um quarto de um rack terrestre. O sistema de placas radiativas tem um tamanho de 13,6m x 3,12m, ou cerca de 42,5 metros quadrados. Se tomarmos 200kW como base e supusermos que toda essa energia será fornecida para as GPUs, precisaríamos de um sistema grande 12,5 vezes maior, ou cerca de 531 …
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Ex-engenheiro da NASA: Construir um centro de dados no espaço é a pior ideia que já ouvi.
Um ex-engenheiro da NASA e especialista em nuvem do Google explica por que construir um centro de dados no espaço é uma ideia completamente impraticável, cheia de desafios em vários aspectos, desde energia, dissipação de calor até resistência à radiação. Este artigo é baseado em um texto de Taranis, organizado, traduzido e redigido pela Dongqu. (Resumo: Este homem quer enviar equipamentos de mineração de Bitcoin para o espaço: luz solar infinita + custo de resfriamento zero é o paraíso da mineração de BTC) (Contexto adicional: Mover a Barragem das Três Gargantas para o espaço) A China planeja construir uma usina de energia solar no espaço, a humanidade terá liberdade energética?) Para esclarecer, sou um ex-engenheiro/cientista da NASA, com doutorado em eletrônica espacial. Também trabalhei no Google por 10 anos, passando por vários departamentos da empresa, incluindo o YouTube e o departamento de nuvem responsável pela implementação de capacidades de computação em IA, então estou qualificado para opinar sobre este assunto. Em resumo: definitivamente é uma ideia péssima, realmente não faz sentido. As razões são muitas, mas em uma palavra, o equipamento eletrônico necessário para operar um centro de dados, especialmente aqueles que implantam capacidades de computação em IA na forma de GPUs e TPUs, simplesmente não é adequado para operar no espaço. Se você nunca trabalhou nesse campo antes, eu gostaria de avisá-lo para não assumir por intuição, porque a realidade de fazer hardware espacial operar no espaço não é necessariamente óbvia. Energia A principal razão pela qual as pessoas querem fazer isso parece ser que há muita energia no espaço. A realidade não é essa. Basicamente, você tem duas opções: energia solar e energia nuclear. Energia solar significa implantar uma matriz de painéis solares com células fotovoltaicas — basicamente equivalente ao equipamento que eu tenho no telhado da minha casa na Irlanda, só que no espaço. Pode realmente funcionar, mas não vai magicamente ser melhor do que instalar painéis solares na superfície — você perde energia através da atmosfera, mas não tanto, então a intuição sobre a área necessária é aproximadamente correta. A maior matriz de energia solar implantada no espaço é o sistema da Estação Espacial Internacional (ISS), que pode fornecer um pouco mais de 200kW de energia em pico. É importante mencionar que implantar esse sistema requer várias missões de ônibus espaciais e muito trabalho — sua área é de cerca de 2.500 metros quadrados, mais da metade do tamanho de um campo de futebol americano. Tomando a NVIDIA H200 como referência, a demanda de potência de cada dispositivo GPU é de cerca de 0,7kW por chip. Eles não podem operar sozinhos e a conversão de energia não é 100% eficiente, então, na verdade, 1kW por GPU pode ser uma referência melhor. Assim, uma enorme matriz do tamanho da ISS pode alimentar cerca de 200 GPUs. Isso parece muito, mas vamos manter alguma perspectiva: o centro de dados que a OpenAI está prestes a construir na Noruega pretende acomodar 100.000 GPUs, cada uma possivelmente consumindo mais energia que a H200. Para alcançar essa capacidade, você precisaria lançar 500 satélites do tamanho da ISS. Em comparação, um único rack de servidor (como os vendidos pré-configurados pela NVIDIA) acomodaria 72 GPUs, então cada satélite gigante equivale a cerca de três racks. A energia nuclear também não ajuda. Não estamos falando de um reator nuclear — estamos falando de geradores termoelétricos de isótopos radioativos (RTG), cuja potência típica é de cerca de 50W – 150W. Portanto, não é nem mesmo suficiente para operar uma única GPU, mesmo se você conseguisse convencer alguém a lhe dar uma porção de plutônio subcrítico e não se importar em ter centenas de chances de espalhá-la em uma ampla área quando o veículo de lançamento se autodestroi explosivamente. Dissipação de Calor ISS Sistema avançado de controle térmico (Boeing) Eu vi muitas pessoas comentando sobre esse conceito dizendo: “Bem, o espaço é frio, então o resfriamento deve ser fácil, certo?” Uh… não… realmente não é. O resfriamento na Terra é relativamente simples. A convecção do ar funciona muito bem — deixando o ar passar por uma superfície, especialmente uma dissipadora de calor projetada com uma grande relação área-volume, pode transferir calor da dissipadora para o ar de forma bastante eficaz. Se você precisar de uma densidade de potência maior que a resfriamento direto (e GPUs de alta potência definitivamente se enquadram nessa categoria), você pode usar resfriamento líquido para transferir o calor do chip para dissipadores de calor maiores em outro lugar. Em centros de dados na Terra, normalmente, são estabelecidos ciclos de resfriamento, onde as máquinas são resfriadas por um fluido refrigerante (geralmente água), que é bombeado ao redor do rack, extraindo calor e devolvendo o refrigerante ao ciclo. Normalmente, o refrigerante é resfriado por convecção para o ar, então de qualquer forma, assim é como funciona na Terra. No espaço, não há ar. O ambiente é próximo ao vácuo absoluto, sem diferença prática, então a convecção simplesmente não ocorre. Em engenharia espacial, geralmente consideramos gerenciamento térmico, não apenas resfriamento. A verdade é que o espaço em si não tem temperatura. Somente a matéria tem temperatura. Isso pode te surpreender, mas no sistema Terra-Lua, a temperatura média de quase qualquer coisa é basicamente a mesma que a temperatura média da Terra, porque é por isso que a Terra tem essa temperatura específica. Se o satélite estiver girando, um pouco como um frango em uma grelha, ele tende a manter uma temperatura consistente, aproximadamente semelhante à superfície da Terra. Se não estiver girando, o lado oposto ao sol ficará gradualmente frio, devido à limitação do fundo cósmico de micro-ondas, cerca de 4 kelvins, ligeiramente acima do zero absoluto. No lado ensolarado, a situação pode ficar bastante quente, atingindo várias centenas de graus Celsius. Portanto, o gerenciamento térmico precisa de um design muito cuidadoso para garantir que o calor seja cuidadosamente direcionado para onde precisa ir. Porque no vácuo não há convecção, isso só pode ser alcançado através de condução ou algum tipo de bomba térmica. Eu projetei hardware espacial que voou no espaço. Em um caso específico, projetei um sistema de câmera que precisava ser muito compacto e leve, enquanto ainda fornecendo capacidade de imagem em nível científico. O gerenciamento térmico foi fundamental no processo de design. Tinha que ser, porque a energia é escassa em pequenas naves espaciais, e o gerenciamento térmico deve ser realizado enquanto minimiza o peso. Então, para mim, não havia bombas térmicas ou coisas sofisticadas: eu segui outra direção, projetando um sistema que consome no máximo cerca de 1 watt em pico, e quando a câmera está ociosa, cai para cerca de 10%. Todo esse poder se transforma em calor, então se eu só consumir 1 watt ao capturar imagens e, em seguida, desligar imediatamente o sensor de imagem após os dados entrarem na RAM, posso reduzir o consumo pela metade e, então, quando as imagens são baixadas para o computador de voo, posso desligar a RAM, reduzindo a potência para um nível relativamente pequeno. O único gerenciamento térmico necessário era fixar as bordas da placa de circuito ao rack, para que as camadas de cobre dentro da placa pudessem transferir qualquer calor gerado. O resfriamento mesmo de um único H200 seria um pesadelo absoluto. É óbvio que dissipadores de calor e ventiladores não funcionariam, mas há uma versão líquida do H200. Supondo que essa versão seja utilizada. Esse calor precisa ser transferido para a placa de dissipação — isso não é como o radiador do seu carro, lembre-se de que não há convecção? — ele precisa irradiar calor para o espaço. Supondo que possamos direcioná-lo para longe do sol. O sistema de controle térmico ativo da ISS (ATCS) é um exemplo desse tipo de sistema de controle térmico. É um sistema muito complexo que utiliza circuitos de resfriamento de amônia e grandes sistemas de placas radiativas. Seu limite de dissipação de calor é de 16kW, então cerca de 16 GPUs H200, ligeiramente mais do que um quarto de um rack terrestre. O sistema de placas radiativas tem um tamanho de 13,6m x 3,12m, ou cerca de 42,5 metros quadrados. Se tomarmos 200kW como base e supusermos que toda essa energia será fornecida para as GPUs, precisaríamos de um sistema grande 12,5 vezes maior, ou cerca de 531 …