国产亚洲精品福利在线无卡一,国产精久久一区二区三区,亚洲精品无码国模,精品久久久久久无码专区不卡

當前位置: 首頁 > news >正文

個體營業(yè)執(zhí)照可以做網(wǎng)站嘛微商軟文

個體營業(yè)執(zhí)照可以做網(wǎng)站嘛,微商軟文,織夢源碼網(wǎng),醫(yī)院網(wǎng)站建設臺賬本文介紹如何在 Doris 中導入 CSV 格式的數(shù)據(jù)文件。Doris 支持靈活的 CSV 格式配置,包括自定義分隔符、字段包圍符等,并提供多種導入方式以滿足不同場景的數(shù)據(jù)導入需求。 導入方式? Doris 支持以下方式導入 CSV 格式數(shù)據(jù): Stream LoadBro…

本文介紹如何在 Doris 中導入 CSV 格式的數(shù)據(jù)文件。Doris 支持靈活的 CSV 格式配置,包括自定義分隔符、字段包圍符等,并提供多種導入方式以滿足不同場景的數(shù)據(jù)導入需求。

導入方式?

Doris 支持以下方式導入 CSV 格式數(shù)據(jù):

  • Stream Load
  • Broker Load
  • Routine Load
  • MySQL Load
  • INSERT INTO FROM S3 TVF
  • INSERT INTO FROM HDFS TVF

參數(shù)配置?

參數(shù)支持情況?

下表列出了各種導入方式支持的 CSV 格式參數(shù):

參數(shù)默認值Stream LoadBroker LoadRoutine LoadMySQL LoadTVF
行分隔符\nline_delimiterLINES TERMINATED BY不支持LINES TERMINATED BYline_delimiter
列分隔符\tcolumn_separatorCOLUMNS TERMINATED BYCOLUMNS TERMINATED BYCOLUMNS TERMINATED BYcolumn_separator
包圍符enclosePROPERTIES.enclosePROPERTIES.enclosePROPERTIES.encloseenclose
轉(zhuǎn)義符\escapePROPERTIES.escapePROPERTIES.escapePROPERTIES.escapeescape
跳過行數(shù)0skip_linesPROPERTIES.skip_lines不支持IGNORE LINESskip_lines
裁剪雙引號falsetrim_double_quotes不支持PROPERTIES.trim_double_quotes不支持trim_double_quotes
壓縮格式plaincompress_typePROPERTIES.compress_type不支持不支持compress_type

注意

  1. Stream Load:參數(shù)直接通過 HTTP Header 指定,如:-H "line_delimiter:\n"
  2. Broker Load:參數(shù)通過 SQL 語句指定,其中:
    • 分隔符通過?COLUMNS TERMINATED BY,?LINES TERMINATED BY?指定
    • 其他參數(shù)通過?PROPERTIES?指定,如:PROPERTIES("compress_type"="gz")
  3. Routine Load:參數(shù)通過 SQL 語句指定,其中:
    • 分隔符通過?COLUMNS TERMINATED BY?指定
    • 其他參數(shù)通過?PROPERTIES?指定,如:PROPERTIES("enclose"="\"")
  4. MySQL Load:參數(shù)通過 SQL 語句指定,其中:
    • 分隔符通過?LINES TERMINATED BY,?COLUMNS TERMINATED BY?指定
    • 其他參數(shù)通過?PROPERTIES?指定,如:PROPERTIES("escape"="\\")
  5. TVF:參數(shù)通過 TVF 語句指定,如:S3("line_delimiter"="\n")

參數(shù)說明?

行分隔符?
  • 作用:指定導入文件中的換行符
  • 默認值:\n
  • 特點:支持多個字符組合作為換行符
  • 使用場景和示例:
    • Linux/Unix 系統(tǒng)文件:
      數(shù)據(jù)文件:
      張三,25\n
      李四,30\n參數(shù)設置:
      line_delimiter:\n (默認值,可不設置)
      

    • Windows 系統(tǒng)文件:
      數(shù)據(jù)文件:
      張三,25\r\n
      李四,30\r\n參數(shù)設置:
      line_delimiter:\r\n
      

    • 特殊程序生成文件:
      數(shù)據(jù)文件:
      張三,25\r
      李四,30\r參數(shù)設置:
      line_delimiter:\r
      

    • 自定義多字符分隔符:
      數(shù)據(jù)文件:
      張三,25||
      李四,30||參數(shù)設置:
      line_delimiter:||
      

列分隔符?
  • 作用:指定導入文件中的列分隔符
  • 默認值:\t(制表符)
  • 特點:
    • 支持可見和不可見字符
    • 支持多字符組合
    • 不可見字符需要使用?\x?前綴的十六進制表示
  • MySQL 協(xié)議特殊處理:
    • 不可見字符需要額外增加反斜線
    • 如 Hive 的?\x01?在 Broker Load 中需要寫成?\\x01
  • 使用場景和示例:
    • 常見可見字符:
      數(shù)據(jù)文件:
      張三,25,北京
      李四,30,上海參數(shù)設置:
      column_separator:,
      

    • 制表符(默認):
      數(shù)據(jù)文件:
      張三    25    北京
      李四    30    上海參數(shù)設置:
      column_separator:\t (默認值,可不設置)
      

    • Hive 文件(Stream Load):
      數(shù)據(jù)文件:
      張三\x0125\x01北京
      李四\x0130\x01上海參數(shù)設置:
      column_separator:\x01
      

    • Hive 文件(Broker Load):
      數(shù)據(jù)文件:
      張三\x0125\x01北京
      李四\x0130\x01上海參數(shù)設置:
      PROPERTIES("column_separator"="\\x01")
      

    • 多字符分隔符:
      數(shù)據(jù)文件:
      張三||25||北京
      李四||30||上海參數(shù)設置:
      column_separator:||
      

包圍符?
  • 作用:保護包含特殊字符的字段,防止被錯誤解析
  • 限制:僅支持單字節(jié)字符
  • 常用字符:
    • 單引號:'
    • 雙引號:"
  • 使用場景和示例:
    • 字段包含列分隔符:
      數(shù)據(jù):a,'b,c',d
      列分隔符:,
      包圍符:'
      解析結(jié)果:3個字段 [a] [b,c] [d]
      

    • 字段包含行分隔符:
      數(shù)據(jù):a,'b\nc',d
      列分隔符:,
      包圍符:'
      解析結(jié)果:3個字段 [a] [b\nc] [d]
      

    • 字段既包含列分隔符又包含行分隔符:
      數(shù)據(jù):a,'b,c\nd,e',f
      列分隔符:,
      包圍符:'
      解析結(jié)果:3個字段 [a] [b,c\nd,e] [f]
      

轉(zhuǎn)義符?
  • 作用:轉(zhuǎn)義字段中與包圍符相同的字符
  • 限制:僅支持單字節(jié)字符,默認為?\
  • 使用場景和示例:
    • 字段包含包圍符:
      數(shù)據(jù):a,'b,\'c',d
      列分隔符:,
      包圍符:'
      轉(zhuǎn)義符:\
      解析結(jié)果:3個字段 [a] [b,'c] [d]
      

    • 字段包含多個包圍符:
      數(shù)據(jù):a,"b,\"c\"d",e
      列分隔符:,
      包圍符:"
      轉(zhuǎn)義符:\
      解析結(jié)果:3個字段 [a] [b,"c"d] [e]
      

    • 字段包含轉(zhuǎn)義符本身:
      數(shù)據(jù):a,'b\\c',d
      列分隔符:,
      包圍符:'
      轉(zhuǎn)義符:\
      解析結(jié)果:3個字段 [a] [b\c] [d]
      

跳過行數(shù)?
  • 作用:跳過 CSV 文件的前幾行

  • 類型:整數(shù)類型

  • 默認值:0

  • 特殊說明:

    • 當 format 為?csv_with_names?時,系統(tǒng)會自動跳過首行(列名),忽略 skip_lines 參數(shù)
    • 當 format 為?csv_with_names_and_types?時,系統(tǒng)會自動跳過前兩行(列名和類型),忽略 skip_lines 參數(shù)
  • 使用場景和示例:

    • 跳過標題行:
      數(shù)據(jù)文件:
      姓名,年齡,城市
      張三,25,北京
      李四,30,上海參數(shù)設置:
      skip_lines:1
      結(jié)果:跳過標題行,導入后續(xù)數(shù)據(jù)
      

    • 跳過注釋行:
      數(shù)據(jù)文件:
      # 用戶信息表
      # 創(chuàng)建時間: 2024-01-01
      張三,25,北京
      李四,30,上海參數(shù)設置:
      skip_lines:2
      結(jié)果:跳過注釋行,導入后續(xù)數(shù)據(jù)
      

    • 使用 csv_with_names 格式:
      數(shù)據(jù)文件:
      name,age,city
      張三,25,北京
      李四,30,上海參數(shù)設置:
      format:csv_with_names
      結(jié)果:系統(tǒng)自動跳過首行列名
      

    • 使用 csv_with_names_and_types 格式:
      數(shù)據(jù)文件:
      name,age,city
      string,int,string
      張三,25,北京
      李四,30,上海參數(shù)設置:
      format:csv_with_names_and_types
      結(jié)果:系統(tǒng)自動跳過前兩行的列名和類型信息
      

裁剪雙引號?
  • 作用:裁剪掉 CSV 文件每個字段最外層的雙引號
  • 類型:布爾類型
  • 默認值:false
  • 使用場景和示例:
    • 裁剪雙引號:
      數(shù)據(jù)文件:
      "張三","25","北京"
      "李四","30","上海"參數(shù)設置:
      trim_double_quotes:true
      結(jié)果:
      張三,25,北京
      李四,30,上海
      

壓縮格式?
  • 作用:指定導入文件的壓縮格式
  • 類型:字符串, 忽略大小寫
  • 默認值:plain
  • 支持的壓縮格式:
    • plain:不壓縮(默認)
    • bz2:BZIP2 壓縮
    • deflate:DEFLATE 壓縮
    • gz:GZIP 壓縮
    • lz4:LZ4 Frame 格式壓縮
    • lz4_block:LZ4 Block 格式壓縮
    • lzo:LZO 壓縮
    • lzop:LZOP 壓縮
    • snappy_block:SNAPPY Block 格式壓縮
  • 注意事項:
    • tar 是一種文件打包格式,不屬于壓縮格式,因此不支持 .tar 文件
    • 如需使用 tar 打包的文件,請先解包后再導入

使用示例?

本節(jié)展示了不同導入方式下的 CSV 格式使用方法。

Stream Load 導入?

# 指定分隔符
curl --location-trusted -u root: \-H "column_separator:," \-H "line_delimiter:\n" \-T example.csv \http://<fe_host>:<fe_http_port>/api/test_db/test_table/_stream_load# 處理帶引號的數(shù)據(jù)
curl --location-trusted -u root: \-H "column_separator:," \-H "enclose:\"" \-H "escape:\\" \-T example.csv \http://<fe_host>:<fe_http_port>/api/test_db/test_table/_stream_load# 導入壓縮文件
curl --location-trusted -u root: \-H "compress_type:gz" \-T example.csv.gz \http://<fe_host>:<fe_http_port>/api/test_db/test_table/_stream_load

Broker Load 導入?

-- 指定分隔符
LOAD LABEL test_db.test_label
(DATA INFILE("s3://bucket/example.csv")INTO TABLE test_tableCOLUMNS TERMINATED BY ","LINES TERMINATED BY "\n"
)
WITH S3
(...
);-- 處理帶引號的數(shù)據(jù)
LOAD LABEL test_db.test_label
(DATA INFILE("s3://bucket/example.csv")INTO TABLE test_tablePROPERTIES("enclose" = "\"","escape" = "\\")
)
WITH S3
(...
);-- 導入壓縮文件
LOAD LABEL test_db.test_label
(DATA INFILE("s3://bucket/example.csv.gz")INTO TABLE test_tablePROPERTIES("compress_type" = "gz")
)
WITH S3
(...
);

Routine Load 導入?

-- 指定分隔符
CREATE ROUTINE LOAD test_db.test_job ON test_table
COLUMNS TERMINATED BY ","
FROM KAFKA
(...
);-- 處理帶引號的數(shù)據(jù)
CREATE ROUTINE LOAD test_db.test_job ON test_table
COLUMNS TERMINATED BY ","
PROPERTIES
("enclose" = "\"","escape" = "\\"
)
FROM KAFKA
(...
);

MySQL Load 導入?

-- 指定分隔符
LOAD DATA LOCAL INFILE 'example.csv'
INTO TABLE test_table
COLUMNS TERMINATED BY ','
LINES TERMINATED BY '\n';-- 處理帶引號的數(shù)據(jù)
LOAD DATA LOCAL INFILE 'example.csv'
INTO TABLE test_table
COLUMNS TERMINATED BY ','
LINES TERMINATED BY '\n'
PROPERTIES
("enclose" = "\"","escape" = "\\"
);-- 跳過表頭
LOAD DATA LOCAL INFILE 'example.csv'
INTO TABLE test_table
COLUMNS TERMINATED BY ','
LINES TERMINATED BY '\n'
IGNORE 1 LINES;

TVF 導入?

-- 指定分隔符
INSERT INTO test_table
SELECT *
FROM S3
("uri" = "s3://bucket/example.csv","format" = "csv","column_separator" = ",","line_delimiter" = "\n"...
);-- 處理帶引號的數(shù)據(jù)
INSERT INTO test_table
SELECT *
FROM S3
("uri" = "s3://bucket/example.csv","format" = "csv","column_separator" = ",","enclose" = "\"","escape" = "\\"...
);-- 導入壓縮文件
INSERT INTO test_table
SELECT *
FROM S3
("uri" = "s3://bucket/example.csv.gz","format" = "csv","compress_type" = "gz"...
);

http://aloenet.com.cn/news/33194.html

相關文章:

  • 房地產(chǎn)怎么做網(wǎng)站推廣子域名網(wǎng)址查詢
  • 網(wǎng)站建設品牌公司一鍵優(yōu)化免費下載
  • 搭建一個微信小程序要多少錢快速整站優(yōu)化
  • 響水網(wǎng)站建設公司外貿(mào)網(wǎng)站推廣服務
  • 中文網(wǎng)站做google廣告怎么樣北京企業(yè)網(wǎng)站推廣哪家公司好
  • 江都網(wǎng)站建設外鏈平臺
  • windows系統(tǒng)做ppt下載網(wǎng)站搜索引擎營銷的主要模式
  • 網(wǎng)頁設計教程孟憲寧課后題答案seo實戰(zhàn)培訓王乃用
  • 像芥末堆做內(nèi)容的網(wǎng)站百度上怎么發(fā)布作品
  • 用服務器ip怎么做網(wǎng)站百度官方推廣
  • php網(wǎng)站開發(fā)最新需求商家聯(lián)盟營銷方案
  • 網(wǎng)站建設公司價seo營銷軟件
  • 做網(wǎng)站的成本有多少網(wǎng)絡媒體軟文案例
  • 幫人做網(wǎng)站賺錢小程序開發(fā)制作
  • 南寧建站軟件小廣告公司如何起步
  • 網(wǎng)站備案信息查詢百度小說排行榜2020前十名
  • 怎么做用戶調(diào)研網(wǎng)站軟文
  • 大理網(wǎng)站設計如何讓百度收錄網(wǎng)址
  • 河南推廣網(wǎng)站的公司怎樣在網(wǎng)上推廣自己的產(chǎn)品
  • 打開汽車之家網(wǎng)頁版網(wǎng)絡seo外包
  • 怎么做素材網(wǎng)站上海最新政策
  • 2016年做網(wǎng)站好不好qq推廣鏈接生成
  • 網(wǎng)站舉報平臺12315怎樣制作網(wǎng)頁設計
  • 男人和女人晚上做污污的視頻大網(wǎng)站ip子域名大全
  • 企業(yè)查詢平臺免費廣州網(wǎng)站優(yōu)化頁面
  • 七臺河新聞頭條最新消息網(wǎng)站優(yōu)化排名易下拉穩(wěn)定
  • 俄羅斯外貿(mào)常用網(wǎng)站海淀區(qū)seo搜索引擎
  • 源代碼管理網(wǎng)站百度推廣優(yōu)化方案
  • 佛山外貿(mào)網(wǎng)站設計高手優(yōu)化網(wǎng)站
  • 四川高速公路建設集團網(wǎng)站網(wǎng)站設計與開發(fā)