Sqoop es una aplicación con interfaz de línea de comando para transferir datos entre bases de datos relacionales y Hadoop.[1]​ Soporta cargas incrementales de una sola tabla o de una consulta SQL en formato libre así como trabajos almacenados que pueden ser ejecutados múltiples veces para importar las actualizaciones realizadas en una base de datos desde la última importación. Las importaciones también pueden poblar tablas en Hive o HBase.[2]​ Las exportaciones pueden utilizarse para transferir datos desde Hadoop hacia a una base de datos relacional. El nombre Sqoop viene de fusionar las palabras sql y hadoop. Sqoop se convirtió en un proyecto Apache de nivel superior en marzo de 2012.[3]​ Sqoop viene con una amplia documentación para usuarios y desarrolladores[4]

Apache Sqoop
Información general
Tipo de programa gestión de datos
Desarrollador Apache Software Foundation
Lanzamiento inicial 21 de septiembre de 2014
Licencia Apache License 2.0
Estado actual Activo
Información técnica
Programado en Java
Plataformas admitidas máquina virtual Java
Versiones
Última versión estable 1.4.6 ( 11 de mayo de 2015 (8 años, 11 meses y 23 días))
Enlaces

Pentaho incluye pasos de conexión como código abierto basados en Sqoop, Sqoop Import[5]​ y Sqoop Export, en su suite ETL de integración de datos a partir de la versión 4.5 del software.[6][7]Microsoft utiliza un conector basado en Sqoop para facilitar la transferencia de datos entre SQL Server y Hadoop.[8]Couchbase, Inc. también ofrece un conector Couchbase Server-Hadoop mediante Sqoop.[9]

El API de extensión de Sqoop permite desarrollar nuevos conectores con otras bases de datos y así manejar las pequeñas diferencias que puede haber en el lenguaje de consultas de un proveedor de bases de datos específico.[4]

Referencias editar

  1. «Hadoop: Apache Sqoop». Consultado el 7 de junio de 2016. 
  2. «Apache Sqoop - Overview». Consultado el 7 de junio de 2016. 
  3. «Apache Sqoop Graduates from Incubator». Consultado el 7 de junio de 2016. 
  4. a b «Sqoop Documentation (v1.4.6)». Consultado el 8 de junio de 2016. 
  5. «Sqoop Import». Pentaho. 10 de diciembre de 2015. Archivado desde el original el 10 de diciembre de 2015. Consultado el 7 de junio de 2016. «The Sqoop Import job allows you to import data from a relational database into the Hadoop Distributed File System (HDFS) using Apache Sqoop.» 
  6. «Sqoop Export». Pentaho. 10 de diciembre de 2015. Archivado desde el original el 10 de diciembre de 2015. Consultado el 7 de junio de 2016. «The Sqoop Export job allows you to export data from Hadoop into an RDBMS using Apache Sqoop.» 
  7. «Big Data Analytics Vendor Pentaho Announces Tighter Integration with Cloudera; Extends Visual Interface to Include Hadoop Sqoop and Oozie». Database Trends and Applications (dbta.com). 27 de julio de 2012. Consultado el 7 de junio de 2016. «Pentaho’s Business Analytics 4.5 is now certified on Cloudera’s latest releases, Cloudera Enterprise 4.0 and CDH4. Pentaho also announced that its visual design studio capabilities have been extended to the Sqoop and Oozie components of Hadoop.» 
  8. «Microsoft SQL Server Connector for Apache Hadoop». Consultado el 7 de junio de 2016. 
  9. «Couchbase Hadoop Connector». Archivado desde el original el 25 de agosto de 2012. Consultado el 7 de junio de 2016.