国产亚洲精品福利在线无卡一,国产精久久一区二区三区,亚洲精品无码国模,精品久久久久久无码专区不卡

當前位置: 首頁 > news >正文

網站建設與管理電子教程廣告公司是做什么的

網站建設與管理電子教程,廣告公司是做什么的,網站動態(tài)logo怎么做,廈門微信公眾號開發(fā)sqoop安裝教程及sqoop操作 文章目錄sqoop安裝教程及sqoop操作上傳安裝包解壓并更名添加jar包修改配置文件添加sqoop環(huán)境變量啟動sqoop操作查看指定mysql服務器數據庫中的表在hive中創(chuàng)建一個teacher表跟mysql的mysql50庫中的teacher結構相同將mysql中mysql50庫中的sc數據導出到h…

sqoop安裝教程及sqoop操作


文章目錄

  • sqoop安裝教程及sqoop操作
  • 上傳安裝包
  • 解壓并更名
  • 添加jar包
  • 修改配置文件
  • 添加sqoop環(huán)境變量
  • 啟動
  • sqoop操作
    • 查看指定mysql服務器數據庫中的表
    • 在hive中創(chuàng)建一個teacher表跟mysql的mysql50庫中的teacher結構相同
    • 將mysql中mysql50庫中的sc數據導出到hdfs指定的文件目錄中
      • sqoop -m 參數
    • 帶條件過濾
    • 帶條件過濾,指定查詢列
    • query使用
    • 將mysql50中sc表導入到hive bigdata庫中
    • 重寫,原數據會被覆蓋
    • 增量導入


上傳安裝包

這里兩個安裝包 sqoop-1.4.7 bin_hadoop-2.6.0.tar.gz和sqoop-1.4.7.tar.gz
因為hadoop版本為3.1.3 所以sqoop的版本太低,需要自行配置
在這里插入圖片描述

在這里插入圖片描述
在這里插入圖片描述

解壓并更名

# 解壓
[root@hadoop install]# tar -zxf sqoop-1.4.7.tar.gz -C ../soft/
# 切換目錄
[root@hadoop install]# cd ../soft/
# 更名
[root@hadoop soft]# mv sqoop-1.4.7/ sqoop147

在這里插入圖片描述

添加jar包

切換目錄到 /opt/soft/sqoop147/lib/
添加avro-1.8.1.jar
在這里插入圖片描述

# 將hive312/lib下的兩個jar包拷貝過來
[root@hadoop lib]# cp /opt/soft/hive312/lib/hive-common-3.1.2.jar ./
[root@hadoop lib]# cp /opt/soft/hive312/lib/mysql-connector-java-8.0.29.jar ./

在這里插入圖片描述

將sqoop-1.4.7.jar 拷貝到 /opt/soft/sqoop147/

在這里插入圖片描述
在這里插入圖片描述

修改配置文件

切換到cd /opt/soft/sqoop147/conf

# 將配置文件復制并更名
[root@hadoop conf]# cp sqoop-env-template.sh sqoop-env.sh
# 編輯 sqoop-env.sh
[root@hadoop conf]# vim ./sqoop-env.sh 22 #Set path to where bin/hadoop is available23 export HADOOP_COMMON_HOME=/opt/soft/hadoop31324 25 #Set path to where hadoop-*-core.jar is available26 export HADOOP_MAPRED_HOME=/opt/soft/hadoop31327 28 #set the path to where bin/hbase is available29 #export HBASE_HOME=30 31 #Set the path to where bin/hive is available32 export HIVE_HOME=/opt/soft/hive31233 export HIVE_CONF_DIR=/opt/soft/hive312/conf34 35 #Set the path for where zookeper config dir is36 export ZOOCFGDIR=/opt/soft/zk345/conf

在這里插入圖片描述
在這里插入圖片描述

添加sqoop環(huán)境變量

# 編輯/etc/profile
[root@hadoop conf]# vim /etc/profile
# SQOOP_HOME
export SQOOP_HOME=/opt/soft/sqoop147
export PATH=$PATH:$SQOOP_HOME/bin
# 刷新文件
[root@hadoop conf]# source /etc/profile

在這里插入圖片描述

啟動

[root@hadoop conf]# sqoop version

在這里插入圖片描述

sqoop操作

\ 符號為連接符

查看指定mysql服務器數據庫中的表

[root@hadoop ~]# sqoop list-databases --connect jdbc:mysql://192.168.95.130:3306 --username root --password root 

在這里插入圖片描述

在hive中創(chuàng)建一個teacher表跟mysql的mysql50庫中的teacher結構相同

[root@hadoop ~]# sqoop create-hive-table --connect jdbc:mysql://192.168.95.130:3306/mysql50 --username root --password root --table teacher --hive-table teacher

在這里插入圖片描述

將mysql中mysql50庫中的sc數據導出到hdfs指定的文件目錄中

[root@hadoop ~]# sqoop import --connect jdbc:mysql://192.168.95.130:3306/mysql50 --username root --password root --table sc --target-dir /tmp/mysql50/sc --fields-terminated-by '\t' -m 1

sqoop -m 參數

sqoop并行化是啟多個map task實現的,-m(或–num-mappers)參數指定map task數,默認是四個。當指定為1時,可以不用設置split-by參數,不指定num-mappers時,默認為4,當不指定或者num-mappers大于1時,需要指定split-by參數。并行度不是設置的越大越好,map task的啟動和銷毀都會消耗資源,而且過多的數據庫連接對數據庫本身也會造成壓力。在并行操作里,首先要解決輸入數據是以什么方式負債均衡到多個map的,即怎么保證每個map處理的數據量大致相同且數據不重復。–split-by指定了split column,在執(zhí)行并行操作時(多個map task),sqoop需要知道以什么列split數據,其思想是:

1、先查出split column的最小值和最大值2、然后根據map task數對(max-min)之間的數據進行均勻的范圍切分

帶條件過濾

[root@hadoop ~]# sqoop import --connect jdbc:mysql://192.168.95.130:3306/mysql50 --username root --password root --table sc --where "SID='01'" --target-dir /tmp/mysql50/sid01 -m 1

帶條件過濾,指定查詢列

[root@hadoop ~]# sqoop import --connect jdbc:mysql://192.168.95.130:3306/mysql50 --username root --password root --table sc --columns "CID,score" --where "SID='01'" --target-dir /tmp/mysql50/sid01column -m 1

query使用

[root@hadoop ~]# sqoop import --connect jdbc:mysql://192.168.95.130:3306/mysql50 --username root --password root --target-dir /tmp/mysql50/scquery --query 'select * from sc where $CONDITIONS and CID="02" and score>80 ' --fields-terminated-by '\t' -m 1

注意:如果使用–query這個命令的時候,需要注意的是where后面的參數, AND $ CONDITIONS 這個參數必須加上而且存在單引號與雙引號的區(qū)別,如果–query后面使用的是雙引號,那么需要在$CONDITIONS前加上 \即 \ $ CONDITIONS
如果設置map數量為1個時即-m 1,不用加上–split-by ${tablename.column},否則需要加上

將mysql50中sc表導入到hive bigdata庫中

[root@hadoop ~]# sqoop import --connect jdbc:mysql://192.168.95.130:3306/mysql50 --username root --password root --table sc --hive-import --hive-database bigdata -m 1

重寫,原數據會被覆蓋

[root@hadoop~]# sqoop import --connect jdbc:mysql://192.168.95.130:3306/mysql50 --username root --password root --table sc --hive-import --hive-overwrite --hive-database bigdata -m 1

增量導入

[root@hadoop ~]# sqoop import --connect jdbc:mysql://192.168.95.130:3306/mysql50 --username root --password root --table sc --hive-import --incremental append --hive-database bigdata -m 1
http://aloenet.com.cn/news/27885.html

相關文章:

  • 酒店網站開發(fā)合同哈爾濱最新信息
  • 甘肅網站建設開發(fā)百度大搜推廣開戶
  • 古典asp網站源碼百度客服中心人工在線電話
  • 石家莊做外貿網站seo搜索引擎優(yōu)化關鍵詞
  • seo全套視頻教程信息流優(yōu)化
  • 電商購物網站建設杭州網站優(yōu)化流程
  • 網站設計如何做策劃黃頁推廣平臺有哪些
  • 豐臺網站建設推廣seo優(yōu)化關鍵詞的方法
  • 剛做的網站怎么在百度搜到西安霸屏推廣
  • 怎樣開發(fā)游戲app軟件優(yōu)化推廣網站怎么做最好
  • 如何建英文網站全網營銷式網站
  • 電子商務網站建設商城網站百度網站推廣一年多少錢
  • 中企動力做的網站被鏡像怎么能在百度上做推廣
  • 招聘網站的SEO怎么做大數據營銷經典案例
  • 網站備案需要花錢嗎東莞網絡推廣平臺
  • 網站開發(fā)的就業(yè)寧波網絡推廣軟件
  • 云南做網站多少錢市場調研方案怎么寫
  • 營銷技巧第三季在線觀看鄭州厲害的seo優(yōu)化顧問
  • 寫網站編程需要什么百度快照替代
  • 會計可以做網站么真實的網站制作
  • 新鄉(xiāng)網站推廣公司微信運營
  • 中國建設銀行行網站谷歌優(yōu)化的最佳方案
  • 做漁具最大的外貿網站營銷方案案例范文
  • 做教育網站多少錢淘寶推廣引流方法有哪些
  • 網站開發(fā)技術教程百度搜索指數是怎么計算的
  • 企業(yè)網站制作機構排名怎樣進行關鍵詞推廣
  • 微信公眾平臺客服谷歌seo培訓
  • 做商城網站需要什么資質海南網站制作
  • 做網站和做推廣有什么區(qū)別站內推廣
  • 新鄉(xiāng)網站建設哪家好seo包年服務