banner-blog-novidades-aws-data-maio-#4

Novidades da AWS: Data – 19 de abril a 23 de maio

Os #cloudspecialists da Darede reuniram as principais novidades de Data da AWS! Confira quais são elas e como elas podem te ajudar!

31/05/2022
Por Luana Farinazzo

Todos os dias a AWS lança uma série novidades e atualizações em seus produtos que visam melhorar a vida de seus usuários. Reunimos algumas delas que fazem mais sentido para nosso mercado e que certamente aplicaremos em nosso dia a dia. Confira as últimas novidades sobre Data!

AWS Glue – Novas APIs no Glue Studio

O AWS Glue Studio é uma ferramenta gráfica utilizada para criar, rodar e monitorar Jobs de ETL no AWS Glue, tornando acessível para quem não tem experiência de codificação no Apache Spark, e acelerando o trabalho para aqueles que tem experiência.
A novidade disponibiliza APIs para criar, ler, atualizar e deletar Jobs do Glue Studio.

Amazon Redshift – Suporte a algoritmo de aprendizagem linear

O Amazon Redshift ML traz a possibilidade de utilizar modelos de machine learning (SageMaker) nos dados armazenados no Redshfit através de comandos SQL.
Agora o Redshift ML suporta o algoritmo de aprendizado linear para resolver problemas de regressão logística e linear.
Um cenário aplicado ao nosso dia a dia é utilizar o modelo de regressão linear para realizar o planejamento de capacidade de um sistema.

AWS Glue – Suporte a autenticação SASL para Apache Kafka

O AWS Glue suporta streams de dados através do Kinesis e Kafka, aplicando transformações e cargas “in-flight” dentro de data stores para analytics e Machine Learning.
A partir de agora, a conexão do Glue ao Apache Kafka suporta SASL (Simple Authentication and Security Layer) usando SCRAM (Salted Challenge Response Authentication Mechanism) ou GSSAPI (Kerberos).

Amazon Athena – Suporte a views no Apache Hive metastores

O Apache metastore é utilizado como um catálogo comum de metadados para ambientes de big data. Nele é possível criar views, sendo estas definidas utilizando HiveQL, não completamente compatível com SQL.
A partir de agora é possível utilizar o Athena para consultar as views do Apache Hive metastores. Por baixo dos panos o Athena trata as diferenças de sintaxe entre o SQL e o HiveQL.

Amazon SageMaker- Data Wrangler com suporte adicional às instâncias M5 and R5

Com o Amazon SageMaker Data Wrangler, é possível simplificar o processo de preparação de dados e engenharia de recursos, além de executar cada etapa do fluxo de trabalho de preparação de dados, incluindo seleção, limpeza, exploração e visualização de dados em uma só interface visual.
O Data Wrangler executa, por default, em instâncias ml.m5.4xlarge. Agora é possível rodar o SageMaker Data Wrangler em instâncias M5 e R5 com mais memória e CPU.

Amazon SageMaker – Data Wrangler com suporte a insights

A partir de agora o SageMaker Data Wrangler possui a feature de insights, em que é possível gerar o Data Quality e insights report já contendo uma análise automática de qualidade de dados e detecção de anomalias, facilitando o trabalho do cientista de dados.

Amazon ElastiCache – Nova console

Está disponível uma nova console para gestão do Amazon ElasticCache para Redis e para Memcached.

Amazon RDS for PostgreSQL – Maior capacidade de read réplicas em cascata

A partir do PostgreSQL 14 é possível ter 3 níveis de read réplicas em cascata, 5 réplicas por instância, suportando até 155 réplicas de leitura por instância de origem, aumentando bastante a capacidade para workloads com consumo pesado de leitura.

Amazon RDS – Performance Insights novas features de visualização de métricas

O Performance Insights é uma importante ferramenta utilizada na monitoração de performance de serviços RDS, muito útil em cenários de troubleshooting.
Agora é possível visualizar a performance e o comportamento de instâncias RDS em intervalos específicos de tempo. Anteriormente só era possível escolher intervalos relativos como, 1 hora, últimas 24 horas.

AWS Outposts – Suporte a storage autoscaling para RDS

AWS Outposts é um serviço gerenciado da AWS que permite que você utilize a infraestrutura, serviços, APIs e ferramentas da AWS em datacenters, colocations ou facility on-premises.
A partir de agora é possível configurar o autoscalling de storage para RDS em Outposts.

Amazon RDS – Suporte a IPV6

A partir de agora o RDS suporta a utilização de IPV6 em instâncias existentes e novas.

Amazon RDS – Recurso que publica métricas de uso para o CloudWatch

O RDS agora publica métricas de uso para o CloudWatch. Com isso é possível monitorar se os limites do serviço do RDS já foram alcançados a nível de conta.
Foram criadas as seguintes 11 métricas: AllocatedStorage, DBInstances, DBClusters, DBSecurityGroups, ReservedDBInstances, DBClusterParameterGroups, DBParameterGroups, ManualSnapshots, ManualClusterSnapshots, DBSubnetGroups, OptionGroups.

Amazon RDS for PostgreSQL, MySQL e MariaDB – Suporte a novos tamanhos das instâncias M6i and R6i

PostgreSQL acima da versão 11, MySQL versão 8 e MariaDB acima da versão 10.4 agora possuem novos tamanhos de instâncias da sexta geração (AWS Nitro System). O novo tamanho 32xlarge tem 128 vCPUs e 512 GB de memória para a família M6i e 1024 GB de memória para a família R6i.
Ainda não disponível para São Paulo.

Amazon ElastiCache – Data tiering disponível em novas regiões

Agora é possível utilizar tiering de dados para o Elasticache for Redis com o intuito de diminuir os custos, armazenando os dados em drivers de baixo custo.

AWS Glue – Detecção de Personal Identifiable Information (PII)

A partir de agora, durante a execução de jobs no Glue, é possível detectar Personal Identifiable Information (PII) e outros dados sensíveis, tanto em nível de colunas quanto células.
Além da detecção, é possível tomar ações sobre estes dados, possibilitando, por exemplo, que um dado sensível seja alterado antes de ser armazenado no Data Lake.

Amazon Athena – 10 novos conectores
Disponibilização de 10 novos conectores para o Athena, são eles:
AP HANA (Express Edition),
Teradata,
Cloudera,
Hortonworks,
Snowflake,
Microsoft SQL Server,
Oracle,
Azure Data Lake Storage (ADLS) Gen2, A
zure Synapse, e
Google BigQuery

AWS Glue – Autoscaling disponível para produção

Agora é possível fazer o scaling dinâmico de recursos do AWS Glue.

Quer saber as últimas novidades da AWS? Leia nosso blog!

E acompanhe toda segunda-feira em nosso canal do Youtube nossa live sobre as Novidades da AWS.

foto-luana-farinazzo

Luana Farinazzo
Technical Account Manager
luana.farinazzo@darede.com.br

Luana Farinazzo atua como Technical Account Manager, e tem vasta experiência com Tecnologia da Informação trabalhando na função de Project Manager, SDM , pré-vendas, entre outros. Ela também possui diversas certificações sendo a última AWS Solutions Architect Associate.

OUTRAS PUBLICAÇÕES

O que é Open Banking?

2020 foi um ano muito importante para o setor bancário brasileiro. Dois sistemas que prometem mudar a forma de como nos relacionamos com os serviços

Nós usamos cookies para garantir e oferecer a melhor experiência de navegação em nosso site! Mais informações