Integração de dados é tema de palestra no Itec

Palestra apresenta o Pentaho Data Integration

33e97b31f7f1473b08265f33c8ce0df5_L
Ferramenta contribui com os relatórios de feedback das organizações, facilitando a tomada de decisões. Kleber Lopes

“Informação é poder” é uma frase bastante conhecida, seja esse poder político, econômico ou de qualquer outra natureza. No âmbito empresarial, esta afirmação tem sido mais impactante do que nunca. O grande desafio hoje das organizações é realizá-la, convertendo dados brutos em informações úteis e, por vezes, também valiosas, em formatos organizados e de fácil leitura, consulta e compreensão. Esse desafio triplica quando os dados se encontram em fontes e formatos distintos.

 1305-ITEC

A ferramenta Pentaho Data Integration ou Kettle, que foi tema da palestra da Sexta do Conhecimento desta semana, tem esse objetivo: extrair dados, transformá-los em informação, armazená-los para consulta e integrá-los, dando-lhe um sentido, contribuindo com os relatórios de feedback das organizações, para a tomada da melhor decisão possível e, consequentemente, para o poder citado na frase inicial.

O responsável por ministrar a palestra sobre esta suíte do programa Pentaho foi o analista de sistemas Robson Pastor. Como sempre, a Sexta do Conhecimento é transmitida via Google Hangouts e fica disponível no Youtube para quem se interessar em assistir depois.

Pentaho Data Integration, ou pode chamá-lo de Kettle

O Pentaho Data Integration (Pdi) ou Kettle é um dos componentes do programa gratuito Pentaho, que, por sua vez, é um software livre de código aberto (livre para que os usuários executem, copiem, modifiquem e aperfeiçoem o programa). O Pentaho é utilizado geralmente no que podemos chamar de inteligência empresarial.

O Pdi é responsável pelos processos de ETL (Extract, Transformation, Load – Extração, Transformação e Carga). Esse processo consiste em extrair dados do sistema de origem, transformá-los (o que envolve traduzir valores codificados, cálculos, junção, transposição) e armazená-los, geralmente nos chamados data warehouses, armazéns de dados integradores de várias bases, que possibilitam o depósito e análise de grandes volumes de dados, e criam e organizam relatórios através de históricos, facilitando as tomadas de decisão nas organizações.

Com o Pdi, é possível desenhar soluções de carga de data warehouses, seu principal propósito, carregar dados de fontes distintas e tratá-los, simultaneamente, além de tratar arquivos de remessa e retorno bancário. A ferramenta ainda é capaz de ler dados de fontes diversas como: bancos de dados, arquivos txt, planilhas Excel e outros, os transformando e carregando em destinos tão diversos quanto. O Itec já utiliza o Data Integration desde o ano passado.

“O Pdi vem sendo utilizado pelo Itec nas cargas do Portal da Transparência. Através dele, foi possível automatizar o processo de carga dos arquivos gerados pelo Siafem e pela Folha de Pagamento. É uma ferramenta robusta, consolidada e difundida no mercado, segura na execução das tarefas a que se propõe. A integração se dá através dos diversos formatos de entradas e saídas de dados suportados pela ferramenta. Além disso, é possível mesclar estas entradas e intervir nas transformações dos dados através de programação”, explicou Robson Pastor.

Além da integração e data warehouses, o Pdi também serve para migração de dados entre bases, integração de aplicações legadas e envio de relatórios por e-mail de forma automática e agendada.

A palestra da próxima Sexta do Conhecimento, no dia 20 de maio, terá como tema “Um laboratório sobre a importância da Ux e o funcionamento de recursos de responsividade” e será ministrada pelo técnico do Itec, Tyago Goulart.

Isaac Moraes – Agência Alagoas

Artigos relacionados