Início Notícias Otimizando a infraestrutura de IA: Bridging It e HPC para sistemas de...

Otimizando a infraestrutura de IA: Bridging It e HPC para sistemas de IA escaláveis ​​e de alto desempenho

9
0

À medida que as aplicações de inteligência artificial crescem em complexidade e demanda, a otimização da infraestrutura de IA permite a escala perfeita, garantindo que os sistemas possam lidar com o aumento das cargas de trabalho sem a degradação do desempenho.

Reconhecendo que a potencial dependência da IA ​​depende da força de sua infraestrutura subjacente, a Penguin Solutions Inc. está adotando uma abordagem proativa, oferecendo um Modelo operacional sustentável projetado para melhorar a produtividade e a escalabilidade, de acordo com Trey Layton (foto), vice -presidente de software e gerenciamento de produtos da Penguin Solutions.

“O mundo da computação de alto desempenho precisa entender os problemas, e o mundo de TI precisa entender os problemas da computação de alto desempenho”, disse ele. “Nisso, temos uma convergência dessas duas habilidades, e o futuro engenheiro de infraestrutura de inteligência artificial é aquele que recebe os dois mundos. Quando acomodamos essas duas coisas construindo uma infraestrutura modular, você está adquirindo parcerias com organizações que entendem como lidar com a complexidade e a escala simultaneamente. ”

Layton conversou com o de TheCube Dave Vellante no “Dominando ai: as novas regras de infraestrutura” eventoAssim, Durante uma transmissão exclusiva no TheCube, o estúdio de transmissão ao vivo da Siliconangle Media. Eles discutiram por que a otimização da infraestrutura de IA deve ser o topo de espírito no cenário digital moderno. (* Divulgação abaixo.)

Através da otimização da lente de infraestrutura de IA

A otimização da infraestrutura de IA aumenta o desempenho, reduz os custos, garante escalabilidade e melhora a sustentabilidade. Como resultado, domar a lacuna de habilidades é necessária para eficiente Gerenciamento de cargas de trabalho de IAde acordo com Layton.

“Quando estamos construindo um ambiente de inteligência artificial, estamos realmente falando sobre a construção de um carro F1 projetado para correr em torno de uma faixa e você precisa de um conjunto diferente de ferramentas para poder construir essa solução altamente especializada para poder fornecer esses resultados”, disse ele.

No mundo de TI, alcançar o desempenho máximo é um marco ocasional, enquanto a infraestrutura de IA opera com eficiência de pico continuamente, exigindo habilidades e ferramentas distintas, acrescentou Layton. Este contraste destaca a necessidade em evolução de conhecimentos especializados e tecnologias adaptativas para otimizar os dois ambientes de maneira eficaz.

Como o HPC e o Avançado formam a base da IA ​​moderna, eles são absolutamente cruciais. Eles servem como força motriz por trás da otimização da infraestrutura de IA, de acordo com Layton.

“Se você pensa no engenheiro moderno do HPC, ele precisará ser versado em Kubernetes e microsserviços, onde eles são amplamente experimentados em tecnologias de processamento baseadas em lote como Slurm e coisas assim”, disse ele. “Considerando que a pessoa de TI tem sido hábil em virtualização e tecnologias em nuvem, e agora ela terá que aprender tecnologias de armazenamento, como sistemas de arquivos paralelos e como executar resultados agrupados massivamente escaláveis. Esses dois mundos estão colidindo e as habilidades são exclusivas para cada ambiente em particular. ”

Mitigando Ai falha Envolve planejamento proativo, monitoramento e refino de sistemas de IA para garantir precisão, confiabilidade e uso ético. Isso explica por que a otimização da infraestrutura de IA é necessária para mitigar erros, de acordo com Layton.

“Nosso próprio relatório Análise interna mostra que as GPUs falham cerca de 33 vezes a taxa de uma CPU de uso geral”, disse ele. “Se você voltar para a analogia do carro, quando estiver dirigindo um carro de corrida em torno de uma pista, e o motor está funcionando com RPMs completos o tempo todo, às vezes os pneus vão soprar, às vezes os cilindros vão soprar, e é o que acontece nessas soluções de infraestrutura de IA é que estamos executando todos os dispositivos no desempenho máximo o tempo todo. Como você constrói o ambiente para acomodar essas condições de falha? ”

Aqui está a entrevista completa em vídeo, parte da cobertura de Siliconangle e TheCube Research do “Dominando ai: as novas regras de infraestrutura” evento:

https://www.youtube.com/watch?v=mys0GrxtCly

Assista ao episódio completo do evento aqui:

https://www.youtube.com/watch?v=iwrm2f9d4je

(* Divulgação: o TheCube é um parceiro de mídia pago para a “AI masterização: as novas regras de infraestrutura” evento. Nem a Penguin Solutions Inc., o patrocinador da cobertura de eventos do TheCube, nem outros patrocinadores têm controle editorial sobre o conteúdo do TheCube ou Siliconangle.)

Foto: Siliconangle

Seu voto de apoio é importante para nós e nos ajuda a manter o conteúdo livre.

Um clique abaixo suporta nossa missão de fornecer conteúdo gratuito, profundo e relevante.

Junte -se à nossa comunidade no YouTube

Junte -se à comunidade que inclui mais de 15.000 especialistas em #Cubealumni, incluindo o CEO da Amazon.com, Andy Jassy, ​​o fundador e CEO da Dell Technologies, Michael Dell, o CEO da Intel Pat Gelsinger e muito mais luminárias e especialistas.

“O TheCube é um parceiro importante para o setor. Vocês realmente fazem parte de nossos eventos e nós realmente apreciamos que você venha e eu sei que as pessoas apreciam o conteúdo que você cria também ” – Andy Jassy

OBRIGADO

fonte