全国咨询/投诉热线:400-618-4000

什么是Sqoop,Sqoop在开发中起到什么作用?

更新时间:2020年10月16日17时53分 来源:传智播客 浏览次数:

  Sqoop是Apache旗下的一款开源工具,该项目开始于2009年,最早是作为Hadoop的一个第三方模块存在,后来为了让使用者能够快速部署,也为了让开发人员能够更快速的迭代开发,并在2013年,独立成为Apache的一个顶级开源项目。

  Sqoop主要用于在Hadoop和关系数据库或大型机之间传输数据,可以使用Sqoop工具将数据从关系数据库管理系统导入(import)到Hadoop分布式文件系统中,或者将Hadoop中的数据转换导出(export)到关系数据库管理系统,其功能如图1所示。

  图1 Sqoop功能

  目前Sqoop主要分为Sqoop1和Sqoop2两个版本,其中,版本号为1.4.x属于Sqoop1,而版本号为1.99.x的属于Sqoop2。这两个版本开发时的定位方向不同,体系结构具有很大的差异,因此它们之间互不兼容。

  Sqoop1功能结构简单,部署方便,提供命令行操作方式,主要适用于系统服务管理人员进行简单的数据迁移操作;Sqoop2功能完善、操作简便,同时支持多种访问模式(命令行操作、Web访问、Rest API),引入角色安全机制增加安全性等多种优点,但是结构复杂,配置部署更加繁琐。由于本书只用到Sqoop解决数据迁移问题,因此使用Sqoop1就可以完成基本的需求。


猜你喜欢:

HDFS是什么?HDFS的演变过程?

点对点消息传递模式与发布订阅消息传递模式【大数据培训】

Spark有什么特点?【大数据培训】

如何通过ECharts js实现数据可视化面板[大数据培训视频教程]