domingo, 10 de julio de 2011

Pentaho Data Integration 4 Cookbook

Finalmente, el Pentaho Data Integration Cookbook fue publicado a fines de Junio.

Tal como anticipé en el post anterior les debo una reseña de este nuevo libro, así como una comparativa con el Beginner's.

Mientras que el Beginner's como el nombre lo indica es para gente que no conoce la herramienta, el cookbook asume un mínimo manejo del Spoon, así como también de bases de datos. Sin embargo las diferencias no se limitan al nivel de experiencia con Kettle.

Aquí una breve comparativa:
  • Uso del libro: El Beginner's está pensado para aprender a utilizar la herramienta. Es un libro para leerlo mientras se va aprendiendo con la computadora. El Cookbook es un libro de consulta para tenerlo a mano siempre que estamos desarrollando. En algún momento tenemos una duda (cómo hago para adjuntar este archivo?, cómo paso datos de una transformación a otra?, etc.). Y ahí está el libro,  siempre con una receta lista para ayudarnos a resolver esa duda o problema.
  • Versión de Kettle: El Beginner's está basado en Kettle 3.2. Esto no implica que una persona sin conocimientos no pueda aprender a utilizar Kettle 4 con este libro, pero sin dudas hay características de Kettle 4 que quedaron afuera. El Cookbook explica muchas de estas características y funcionalidades.
  • Enfoque: Hay temas que están explicados en ambos libros pero con un enfoque diferente. Mientras que el Beginner's explica paso a paso la forma de realizar una tarea, el Cookbook explica el mismo tema en una forma más sintética, pero complementa esa explicación con casos de uso más avanzados. Por ejemplo: El Beginner's explica cómo crear una subtransformación. El Cookbook incorpora la implementación de subtransformaciones con varios streams de entrada y salida. El Beginner's explica cómo leer un archivo XML simple. El Cookbook tiene un capítulo entero dedicado a estructuras XML, donde se explica tanto la lectura como la escritura de estructuras XML simples y complejas.
  • Temas tratados: Además de la explicación de job entries o steps nuevos en Kettle 4, el Cookbook desarrolla algunos temas no tratados en el Beginner's, ya sea por falta de espacio o por el nivel de complejidad de los temas. Algunos de ellos son: Distintos casos de uso del result filelist (lista de nombres de archivo en memoria), diferentes formas de pasar argumentos o parámetros a transformaciones o jobs, el uso de Kettle integrado con otras herramientas de la plataforma como por ejemplo Pentaho Reporting, uso de algunos steps avanzados como por exemplo Synchronize after Merge o Dynamic SQL row.
  • Scripting: El Beginner's tiene un capítulo íntegramente dedicado a JavaScript. El Cookbook cuenta con una receta dedicada al UDJC (User Defined Java Class) step. La receta explica en detalle el uso de este step, y además explica las diferentes opciones de scripting disponibles, incluyendo la de utilizar JavaScript.
y no son las únicas diferencias. Podría seguir escribiendo y no terminaría nunca. Mejor véanlo por ustedes mismos,
:)
Saludos y hasta la próxima.
María Carina

1 comentario:

  1. Felicitaciones Maria Carina!!! Sin duda otro grandísimo aporte al mundo OSBI.

    Ya tengo mi propio e-book, así que espero con ansias ponerme a leerlo y probar las recetas.

    Salud y buen provecho.
    Dario

    ResponderEliminar