Como resultado de uma colaboração contínua com a Intel e o Google Cloud a fim de acelerar a pesquisa genômica, o Broad Institute of MIT and Harvard otimizou seus fluxos de trabalho para instâncias rápidas e econômicas do Google N1 e N2. Em comparação com a implementação inicial de cargas de trabalho no Google Cloud, a colaboração resultou em uma redução de 85% no custo de processamento de dados após a otimização.
"Sabíamos que a nuvem permitiria um nível totalmente novo em termos de federação e colaboração de dados, e que poderíamos trabalhar com outros para criar um ecossistema de dados baseado na nuvem, onde os pesquisadores poderiam combinar seus fluxos de trabalho em muito mais do que os dados que geraram com outros conjuntos em experiências computacionais mais ricas e mais poderosas", explica Geraldine Van der Auwera, diretora de comunicação do Data Sciences Platform no Broad Institute of MIT and Harvard.
Para adaptar-se a um aumento dramático na geração de dados genômicos e na demanda de pesquisa computacional, o Broad Institute migrou suas cargas de trabalho para instâncias do Google Cloud N2. Ao modularizar os fluxos de trabalho do pipeline, ajustando as instâncias de nuvem para o tamanho correto com base nas necessidades da carga de trabalho e implementando os processadores escaláveis Intel Xeon, os usuários do Broad Institute podem executar seus fluxos de trabalho genômicos no Google Cloud de forma 25% mais rápida e a um custo 34% mais baixo, implantando em instâncias N2 com processadores escaláveis Xeon.
A Intel vem trabalhando em parceria com o Broad Institute desde 2017, ajudando a otimizar o pipeline do instituto e sua ferramenta Genomics Analysis Toolkit (GATK) com a biblioteca Intel, incluindo a Genomics Kernel Library da Intel®. Juntos, eles também gerenciam o Intel-Broad Center for Genomic Data Engineering, um projeto que permite que pesquisadores e engenheiros de software de todo o mundo construam, otimizem e compartilhem amplamente novas ferramentas e infra-estrutura que ajudarão os cientistas a integrar e processar dados genômicos.
A Intel trabalhou com o Broad Institute para ajudar a otimizar seus pipelines no Google Cloud. Um exemplo são os núcleos específicos do kit de ferramentas de análise de genoma que são otimizados para operações vetoriais com as Advanced Vector Extensions 512 da Intel® (Intel® AVX-512). Algumas funções otimizadas de armazenamento usam a Intelligent Storage Acceleration Library da Intel (Intel ISA-L).
Buscando realizar uma visão mais ampla dos ecossistemas da área de ciências da vida, o Broad Institute, a Microsoft e a Verily co-desenvolveram a plataforma Terra, uma plataforma escalonável e segura para pesquisadores biomédicos de todo o mundo, onde podem acessar dados, executar ferramentas de análise e colaborar entre si. A plataforma Terra foi construída sobre uma infra-estrutura de nuvem, permitindo ao Broad Institute escalonar com facilidade e capacitar a comunidade de pesquisa com novas capacidades para o benefício da pesquisa de soluções para doenças humanas.
Os estudos do genoma humana mudaram a forma como enxergamos as ciências biológicas. Com a ajuda da Intel e do Google Cloud, o Broad Institute está na vanguarda da inovação, possibilitando e ajudando a acelerar a pesquisa genômica. Ao migrar para a nuvem e otimizar as cargas de trabalho para as instâncias do Google Cloud, o Broad Institute resolveu seus desafios de capacidade de armazenamento e de capacidade computacional de uma forma escalonável e voltada para o futuro. A co-construção da plataforma Terra permitiu ainda que o Broad Institute capacitasse não apenas suas equipes de pesquisa, mas cientistas do mundo todo, permitindo que usem as ferramentas e pipelines otimizados e para possibilitar um ecossistema de dados federado que abre inúmeras possibilidades para a pesquisa biomédica.