Neste último TDC em São Paulo fui a trilha de HPC e vou dar uma resumida por aqui nas palestras que pude acompanhar!

MapReduce e Hadoop, história e prática – Luca Bastos ( @lucabastos )
Nessa primeira palestra o Luca Bastos (@lucabastos), que atualmente está na Thoughtworks (@thoughtworks) deu uma breve introdução ao Hadoop, passando primeiramente pela teoria de Map Reduce, explicando esse modelo criado pela Google e que o Hadoop o implementa. Exemplificou o tipo de problema que essa abordagem resolve e o que também não resolve ( necessidade de processamento de dados em tempo real, por exemplo ).

Foi um bom embasamento para  contextualizar o tema para as próximas palestras!
Veja os Slides dessa palestra:

Cloud Computing e Apache Cassandra na Chaordic Systems – Ivan Linhares ( @ivanlinhares)

Essa foi uma das palestras mais interessantes da trilha HPC! O foco foi a transição/migração de MySql para o Apache Cassandra que a Chaordic fez num dos produtos deles: o Chaordic OnSite. Segundo o Ivan, a empresa estava crescendo e quase que de “uma hora pra outra” a plataforma de dados iria passar de milhões para bilhões de requisições mensais e a abordagem utilizada originalmente não suportaria tal crescimento sem a perda da alta disponibilidade ( muito importante para o produto deles ). Aí ele foi pontuando tudo que fizeram ( por exemplo trocando tomcat por jetty ) , posturas que tiveram que mudar ( desenvolvedores se transformando em DevOps )… mencionou também que não teriam conseguido passar com sucesso por esta migração sem testes automatizados e integração contínua!
O interessante foi a forma que resolveram transformar os Devs em DevOps: da noite pro dia! Era tão importante isso que até atrasaram o RoadMap do produto para fazer essa transformação!

E por fim ele listou as ferramentas que os ajudam no trabalho:

Puppet: Ferramenta para a gestão automática de configuração dos servidores ( http://projects.puppetlabs.com/projects/puppet )

New Relic: Ferramenta para o monitoramento da aplicação. ( http://newrelic.com/ )

Librato: Uma ferramenta que permite criar dashboards com vários tipos de gráficos para acompanhar a sua aplicação ( https://metrics.librato.com/  )

Logentries: Ferramenta para agregação e monitoramento dos logs. ( https://logentries.com/ )

Tio Patinhas:  Um projeto que eles mesmos criaram para gerenciar as instâncias spots da amazon( https://github.com/chaordic/tiopatinhas )

Conheçam a Chaordic: http://www.chaordic.com.br/ 

Apache Zookeeper – Conectando aplicações – Diego Oliveira ( @lokimad )

Na sua palestra, o Diego mostrou um pouco do Apache Zookeper, que basicamente é um serviço para coordenar sistemas distribuídos.

Explicou quais são as principais utilizações e fez uma pequena demonstração de como funciona.
O Zookeper era um subprojeto do Hadoop, mas acabou ganhando importância e agora é um projeto “First Class”.
Parece ser bem interessante e vale a pena dar uma olhada!

http://zookeeper.apache.org/ )

Slides dessa apresentação: Apache ZooKeeper

4ª Palestra : Computação Manycore: uma arquitetura muito além do multicore!  – Luciano Palma ( @LucianoPalma )

Nessa palestra, o Luciano falou pra nós sobre arquitetura Manycore, dizendo que a capacidade computacional evoluiu mas o software não acompanhou. Falou de programação paralela pra conseguir fazer uso dessa capacidade! Mostrou um video com o Xeon Phi, que é a solução “Manycore” de Hardware da Intel e deu uma breve explicação da parte eletrônica também! Vale a pena dar uma olhada nos slides da palestra!

Veja os Slides dessa palestra: Computação Paralela

5ª e 7ª Palestras : Patterns & Best Practices para uma Arquitetura Baseada em In-Memory Data Grid -Ricardo Ferreira ( @jricardoferreir )

Eu somente tinha ouvido falar sobre In-Memory Data Grid até esta palestra! 😀
O Ricardo ( que começou o a palestra no 5 slot e acabou no 7 ) falou um pouco pra nós sobre a arquitetura para se trabalhar com In-Memory Data Grid. Mostrou tb o Coherence, que é a solução da Oracle pra esse caso.

Deu dois cases onde mostrou como conseguiram diminuir muito a quantidade de instâncias necessárias de uma aplicação usando essa solução baseada em Data Grids em memória e fez uns demos para mostrar ao vivo como essa tecnologia funciona! Muito interessante! Pena que ele não disponibilizou os slides ( assim como a maioria…. 🙁 )

6ª Palestra: Fast Data e Predictive Analytics – Alexandre Alves

Essa palestra foi dada pelo Alex que é Chief Architect na Oracle e membro do comitê Event Processing Technical Society (EPTS).  Para chegar no que se entende por Fast Data, ele explicou CEP ( Complex Event Processess ) que trata-se de uma forma de analisar dados em streaming para conseguir identificar patterns e gerar eventos para serem tratados.

Fast Data combina a análise em Real Time de Event Processing com a todo potencial de análise de massa de dados de Big Data! É uma tecnologia ainda recente, mas que é o nova palavra do momento em se falando de HPC!

Pra mim que não conhecia muito sobre o assunto ( na verdade quase nada… rs ), achei o tema e a trila do HPC muito interessante!

Espero que essa trilha continue no TDC 2014!
É isso aí!
Autor

Douglas Grava é desenvolver na Bluesoft há mais de 9 anos. Atualmente, ele lidera uma grande equipe de desenvolvedores que atua no módulo Tributário e Contábil do software da Bluesoft.

Deixe aqui o seu comentário