domingo, 10 de julio de 2011

Pentaho Data Integration 4 Cookbook

Finalmente, el Pentaho Data Integration Cookbook fue publicado a fines de Junio.

Tal como anticipé en el post anterior les debo una reseña de este nuevo libro, así como una comparativa con el Beginner's.

Mientras que el Beginner's como el nombre lo indica es para gente que no conoce la herramienta, el cookbook asume un mínimo manejo del Spoon, así como también de bases de datos. Sin embargo las diferencias no se limitan al nivel de experiencia con Kettle.

Aquí una breve comparativa:
  • Uso del libro: El Beginner's está pensado para aprender a utilizar la herramienta. Es un libro para leerlo mientras se va aprendiendo con la computadora. El Cookbook es un libro de consulta para tenerlo a mano siempre que estamos desarrollando. En algún momento tenemos una duda (cómo hago para adjuntar este archivo?, cómo paso datos de una transformación a otra?, etc.). Y ahí está el libro,  siempre con una receta lista para ayudarnos a resolver esa duda o problema.
  • Versión de Kettle: El Beginner's está basado en Kettle 3.2. Esto no implica que una persona sin conocimientos no pueda aprender a utilizar Kettle 4 con este libro, pero sin dudas hay características de Kettle 4 que quedaron afuera. El Cookbook explica muchas de estas características y funcionalidades.
  • Enfoque: Hay temas que están explicados en ambos libros pero con un enfoque diferente. Mientras que el Beginner's explica paso a paso la forma de realizar una tarea, el Cookbook explica el mismo tema en una forma más sintética, pero complementa esa explicación con casos de uso más avanzados. Por ejemplo: El Beginner's explica cómo crear una subtransformación. El Cookbook incorpora la implementación de subtransformaciones con varios streams de entrada y salida. El Beginner's explica cómo leer un archivo XML simple. El Cookbook tiene un capítulo entero dedicado a estructuras XML, donde se explica tanto la lectura como la escritura de estructuras XML simples y complejas.
  • Temas tratados: Además de la explicación de job entries o steps nuevos en Kettle 4, el Cookbook desarrolla algunos temas no tratados en el Beginner's, ya sea por falta de espacio o por el nivel de complejidad de los temas. Algunos de ellos son: Distintos casos de uso del result filelist (lista de nombres de archivo en memoria), diferentes formas de pasar argumentos o parámetros a transformaciones o jobs, el uso de Kettle integrado con otras herramientas de la plataforma como por ejemplo Pentaho Reporting, uso de algunos steps avanzados como por exemplo Synchronize after Merge o Dynamic SQL row.
  • Scripting: El Beginner's tiene un capítulo íntegramente dedicado a JavaScript. El Cookbook cuenta con una receta dedicada al UDJC (User Defined Java Class) step. La receta explica en detalle el uso de este step, y además explica las diferentes opciones de scripting disponibles, incluyendo la de utilizar JavaScript.
y no son las únicas diferencias. Podría seguir escribiendo y no terminaría nunca. Mejor véanlo por ustedes mismos,
:)
Saludos y hasta la próxima.
María Carina

viernes, 25 de febrero de 2011

Próximo lanzamiento: Pentaho Data Integration 4 Cookbook

Poco tiempo después de publicado el Beginner's book, Packt me ofreció escribir un nuevo libro.
La decisión no fue fácil. Si bien la escritura de aquel libro fue una excelente experiencia, fue también agotadora.
Dos fueron los motivos para aceptar: El reconocimiento de la comunidad Pentaho y el ofrecimiento de Adrian para hacer este proyectos juntos.

Finalmente, el libro Pentaho Data Integration 4 Coookbook ya está en sus últimas etapas, es de un nivel intermedio, y requiere conocimientos basicos de Kettle. No obstante, cualquier persona interesada en la herramienta pero sin experiencia, puede sacar también algun provecho del libro aunque desde ya le va a ser un poco más dificultoso.

El libro tiene fecha de publicacion en Junio. Más cerca de la fecha, estaré haciendo una síntesis de los contenidos para despejar todas las dudas y sobre todo explicar las diferencias y semejanzas con el libro anterior.
saludos
Maria Carina

lunes, 1 de noviembre de 2010

Pentaho Kettle Solutions

Hace pocos días recibí el libro Pentaho Kettle Solutions por Roland Bouman, Jos van Dongen y Matt Casters.
Si bien apenas estoy comenzando a leerlo (leerlo en su totalidad puede llevar bastante tiempo dado su tamaño), me gustaría aportar una opinión inicial.

Disfruto el libro principalmente por el hecho de ser un libro sobre Kettle; herramienta de la que podria decirse que soy bastante fanática.
Lo primero que destaco del libro (como antigua usuaria de la herramienta) es que por primera vez estoy leyendo información bien documentada de temas como:
  • arquitectura de logging
  • performance tuning
  • escalabilidad (clustering and partitioning)
  • Kettle API
  • creacion de plugins
Todos estos temas son avanzados y es difícil o imposible encontrar documentación relacionada en la wiki o en el foro de Pentaho. Aún cuando no tenga intención de configurar un cluster dinámico o desarrollar un plugin, es muy interesante la lectura de estos temas.

En cuanto a los temas relacionados con datawarehousing, los cuales ocupan una parte considerable del libro, los mismos están orientados a personas con conocimientos o experiencia previa en el área. Para aquel que no los tiene y que igualmente está interesado, recomiendo fuertemente acompañar la lectura con otra bibliografía, incluyendo Pentaho Solutions, Pentaho 3.2 Data Integration: Beginner's Guide y The Data Warehouse Toolkit.

Finalmente, aquel que apenas escuchó hablar de Kettle y quiere aprender, no dude que este libro puede ser un interesante complemento del libro Beginner's.

miércoles, 15 de septiembre de 2010

Bem-vindos ao encontro Pentaho!

En pocos días se va a realizar el tercer encuentro europeo de la comunidad Pentaho. Esta vez se realiza en Lisboa, y está organizado por mis colegas de Webdetails. El encuentro se trata de un evento informal de gente de la comunidad Pentaho proveniente principalmente de distintos países de Europa, para discutir las últimas novedades sobre la plataforma.

Como no podía ser de otra manera, Webdetails no sólo está en la organización del encuentro, sino que va a estar a cargo de varias charlas.
Nuno Moreira, autor de todas las maravillosas creaciones gráficas de Webdetails, va a presentar Pentaho Dashboards.
El recientemente lanzado CDA (Community Data Access) va a ser presentado por uno de los expertos del equipo: Pedro Pinheiro.
Otro experto desarrollador, Nelson Sousa, va a presentar el CDE (Community Dashboard Editor)
Finalmente, Pedro Alves viene con la frutilla de la torta: los CCC (Community Charting Components)

Para más información, pueden visitar la página del evento en la Wiki.

miércoles, 2 de junio de 2010

CDA al rescate

A quién no le gustaría leer los gastos mensuales desde un cubo utilizando MDX, compararlos con los estimados que casualmente están en un archivo XML, calcular qué tan por arriba están los gastos sobre el estimado, y generar una planilla Excel con el resultado, todo "on the fly", desde la consola de Pentaho? Eso es sólo el principio!