02 使用Sqoop完成mysql与hdfs之间的数据交换

    技术2022-07-10  134

    本节将演示使用Sqoop完成mysql与hdfs之间的数据交换。

    1、前提约束

    已安装Sqoop https://www.jianshu.com/p/c0f8d7ac4ae0 已安装Hadoop并启动 https://www.jianshu.com/p/b7ae3b51e559 已安装mysql并启动 https://www.jianshu.com/p/9a4976b23495 假设虚拟机所在的Centos服务器ip为192.168.100.141,且已关闭防火墙 假设sqoop安装目录为 /root/sqoop-1.4.7.bin__hadoop-2.6.0 假设hadoop安装目录为 /root/hadoop-2.5.2 假设mysql的账号密码为 root/zhangli

    2、操作步骤

    (1) 把mysql中的数据导入HDFS

    在mysql中初始化数据,执行以下命令: mysql -uroot -pzhangli create database test; use test; create table t_info(id int,name varchar(20),age int); insert into t_info(id,name,age) values(1,'ali',20); insert into t_info(id,name,age) values(2,'xiaoli',3); exit; 在hdfs中创建文件夹 cd /root/hadoop-2.5.2 ./hdfs dfs -mkdir /data 把t_info表导入到hdfs cd /root/sqoop-1.4.7.bin__hadoop-2.6.0/bin ./sqoop import --connect jdbc:mysql://localhost:3306/test --username root --password zhangli --query 'select id, name,age from t_info where $CONDITIONS LIMIT 100' --target-dir /data --delete-target-dir --num-mappers 1 --direct --fields-terminated-by ' ' # 查看hdfs中导入的文件 cd /root/hadoop-2.5.2/bin ./hdfs dfs -ls /data

    (2)将hdfs中的数据导入到mysql hdfs的/data文件夹下有文档,内容如下:

    1 ali 20 2 xiaoli 3

    执行以下命令:

    mysql -uroot -pzhangli create database test; use test; create table t_info(id int,name varchar(20),age int); exit; cd /root/sqoop-1.4.7.bin__hadoop-2.6.0/bin ./sqoop export --connect jdbc:mysql://localhost:3306/test --username root --password zhangli --table t_info --export-dir /data --input-fields-terminated-by ' ' 执行完毕,查看mysql数据库实例test中的t_info表,便能看到数据已经被导入该表。 以上就是使用Sqoop完成mysql与hdfs之间的数据交换。
    Processed: 0.011, SQL: 9