婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > pyspark操作hive分區表及.gz.parquet和part-00000文件壓縮問題

pyspark操作hive分區表及.gz.parquet和part-00000文件壓縮問題

熱門標簽:外呼并發線路 ai電話機器人哪里好 宿遷星美防封電銷卡 長沙高頻外呼系統原理是什么 湛江智能外呼系統廠家 地圖標注審核表 西藏房產智能外呼系統要多少錢 ai電銷機器人源碼 百度地圖標注沒有了

pyspark 操作hive表

pyspark 操作hive表,hive分區表動態寫入;最近發現spark動態寫入hive分區,和saveAsTable存表方式相比,文件壓縮比大約 4:1。針對該問題整理了 spark 操作hive表的幾種方式。

1> saveAsTable寫入

saveAsTable(self, name, format=None, mode=None, partitionBy=None, **options)

示例:

df.write.saveAsTable("表名",mode='overwrite')

注意:

1、表不存在則創建表,表存在全覆蓋寫入;
2、表存在,數據字段有變化,先刪除后重新創建表;
3、當正在存表時報錯或者終止程序會導致表丟失;
4、數據默認采用parquet壓縮,文件名稱 part-00000-5efbfc08-66fe-4fd1-bebb-944b34689e70.gz.parquet

數據文件在hdfs上顯示:

2> insertInto寫入

insertInto(self, tableName, overwrite=False):
示例:

# append 寫入
df.repartition(1).write.partitionBy('dt').insertInto("表名")
# overwrite 寫入
df.repartition(1).write.partitionBy('dt').insertInto("表名",overwrite=True)
# 動態分區使用該方法

注意:

1、df.write.mode("overwrite").partitionBy("dt").insertInto("表名") 不會覆蓋數據
2、需要表必須存在且當前DF的schema與目標表的schema必須一致
3、插入的文件不會壓縮;文件以part-00....結尾。文件較大

數據文件在hdfs上顯示:

2.1> 問題說明

兩種方式存儲數據量一樣的數據,磁盤文件占比卻相差很大,.gz.parquet 文件 相比 part-00000文件要小很多。想用spark操作分區表,又想讓文件壓縮,百度了一些方式,都沒有解決。
從stackoverflow中有一個類似的問題 Spark compression when writing to external Hive table 。用里面的方法并沒有解決。
最終從hive表數據文件壓縮角度思考,問題得到解決。

hive 建表指定壓縮格式
下面是hive parquet的幾種壓縮方式

-- 使用snappy
CREATE TABLE if not exists ods.table_test(
    id string,
    open_time string
	)
COMMENT '測試'
PARTITIONED BY (`dt` string COMMENT '按天分區')
row format delimited fields terminated by '\001' 
STORED AS PARQUET 
TBLPROPERTIES ('parquet.compression'='SNAPPY');

-- 使用gzip
CREATE TABLE if not exists ods.table_test(
    id string,
    open_time string
	)
COMMENT '測試'
PARTITIONED BY (`dt` string COMMENT '按天分區')
row format delimited fields terminated by '\001' 
STORED AS PARQUET 
TBLPROPERTIES ('parquet.compression'='GZIP');
 
-- 使用uncompressed
CREATE TABLE if not exists ods.table_test(
    id string,
    open_time string
	)
COMMENT '測試'
PARTITIONED BY (`dt` string COMMENT '按天分區')
row format delimited fields terminated by '\001' 
STORED AS PARQUET 
TBLPROPERTIES ('parquet.compression'='UNCOMPRESSED');

 
-- 使用默認
CREATE TABLE if not exists ods.table_test(
    id string,
    open_time string
	)
COMMENT '測試'
PARTITIONED BY (`dt` string COMMENT '按天分區')
row format delimited fields terminated by '\001' 
STORED AS PARQUET;
 
-- 設置參數 set parquet.compression=SNAPPY;

2.2> 解決辦法

建表時指定TBLPROPERTIES,采用gzip 壓縮
示例:

drop table if exists ods.table_test
CREATE TABLE if not exists ods.table_test(
id string,
open_time string
)
COMMENT '測試'
PARTITIONED BY (`dt` string COMMENT '按天分區')
row format delimited fields terminated by '\001' 
STORED AS PARQUET 
TBLPROPERTIES ('parquet.compression'='GZIP');

執行效果

數據文件在hdfs上顯示:

可以看到文件大小占比已經和 *.gz.parquet 文件格式一樣了

3>saveAsTextFile寫入直接操作文件

saveAsTextFile(self, path, compressionCodecClass=None)
該方式通過rdd 以文件形式直接將數據存儲在hdfs上。
示例:

rdd.saveAsTextFile('hdfs://表全路徑')

文件操作更多方式見官方文檔

到此這篇關于pyspark操作hive分區表及.gz.parquet和part-00000文件壓縮問題的文章就介紹到這了,更多相關pyspark hive分區表parquet內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • 在python中使用pyspark讀寫Hive數據操作
  • Pyspark讀取parquet數據過程解析
  • pyspark對Mysql數據庫進行讀寫的實現
  • pyspark給dataframe增加新的一列的實現示例
  • Linux下遠程連接Jupyter+pyspark部署教程
  • PyCharm+PySpark遠程調試的環境配置的方法

標簽:大同 盤錦 海南 寧夏 南平 林芝 普洱 漯河

巨人網絡通訊聲明:本文標題《pyspark操作hive分區表及.gz.parquet和part-00000文件壓縮問題》,本文關鍵詞  pyspark,操作,hive,分區表,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《pyspark操作hive分區表及.gz.parquet和part-00000文件壓縮問題》相關的同類信息!
  • 本頁收集關于pyspark操作hive分區表及.gz.parquet和part-00000文件壓縮問題的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    国产喷白浆一区二区三区| 丁香婷婷综合网| 亚洲婷婷综合久久一本伊一区| 国产精品超碰97尤物18| 美腿丝袜一区二区三区| 欧美日韩成人综合| 亚洲午夜一区二区三区| aaa国产一区| 91精品欧美综合在线观看最新| 26uuu色噜噜精品一区| 亚洲国产精品久久久久秋霞影院| 国产真实精品久久二三区| 欧美日韩一级大片网址| 欧美一区二区三区的| 国产精品亚洲午夜一区二区三区 | 一区二区三区欧美日韩| 色嗨嗨av一区二区三区| 亚洲国产精品久久人人爱蜜臀| 欧美日韩国产不卡| av一区二区三区在线| 亚洲六月丁香色婷婷综合久久| 欧美精品在线观看播放| 色老汉一区二区三区| 91在线视频免费观看| 日韩美女一区二区三区四区| 亚洲五码中文字幕| 2020国产成人综合网| 色吊一区二区三区| 日韩国产欧美视频| 亚洲国产成人在线| 成人免费观看男女羞羞视频| 欧美激情自拍偷拍| 91影院在线免费观看| 一区二区三区久久| 日韩午夜激情免费电影| av午夜一区麻豆| 日日摸夜夜添夜夜添亚洲女人| 久久一夜天堂av一区二区三区| 一本一本久久a久久精品综合麻豆| 精品夜夜嗨av一区二区三区| 一区二区三区欧美日| 亚洲欧美国产毛片在线| 国产欧美精品一区aⅴ影院| 欧美日韩色一区| 国产毛片精品国产一区二区三区| 一区二区三区欧美在线观看| 欧美日韩一级大片网址| 波多野结衣精品在线| 日韩av中文字幕一区二区三区 | 91美女片黄在线| 国产精品一区二区三区四区| 亚洲 欧美综合在线网络| 久久影视一区二区| 在线国产电影不卡| 国产成人三级在线观看| 成人性色生活片| 99国产一区二区三精品乱码| 风间由美中文字幕在线看视频国产欧美| 国产精品亚洲午夜一区二区三区| 国产伦理精品不卡| 色婷婷精品久久二区二区蜜臀av| 欧美日韩国产一区二区三区地区| 日韩片之四级片| 亚洲精品久久久蜜桃| 久久99热国产| 欧美视频一区二区三区| 国产精品女同一区二区三区| 亚洲综合区在线| 国产在线一区观看| 91老司机福利 在线| 欧美一区二区三区婷婷月色| 国产精品久久久久影院老司| 国产一区二区三区日韩| 久久精品国产99| 欧美亚日韩国产aⅴ精品中极品| 久久久99精品久久| 国产乱人伦偷精品视频不卡| 欧美一级电影网站| 日韩中文字幕区一区有砖一区| fc2成人免费人成在线观看播放| 欧美日本精品一区二区三区| 久久久不卡影院| 香蕉av福利精品导航| 国产成人综合亚洲91猫咪| 制服丝袜亚洲色图| 亚洲一区精品在线| 欧美性色黄大片| 图片区日韩欧美亚洲| 91精品国产综合久久福利软件| 精品国产凹凸成av人网站| 欧美综合色免费| 亚洲成人1区2区| 欧美日韩国产一二三| 久久黄色级2电影| 国产亚洲欧洲一区高清在线观看| 丁香激情综合国产| 亚洲精品国产第一综合99久久| 欧美日韩免费在线视频| 亚洲电影你懂得| 色综合久久88色综合天天免费| 国产精品天天看| ㊣最新国产の精品bt伙计久久| 一区二区三区欧美久久| 国产偷v国产偷v亚洲高清| 国产裸体歌舞团一区二区| 欧美在线视频全部完| 国产成人在线观看免费网站| 日韩av午夜在线观看| 风间由美一区二区av101| 99re热视频精品| 日韩欧美一区二区在线视频| 中文幕一区二区三区久久蜜桃| 亚洲五月六月丁香激情| 丁香桃色午夜亚洲一区二区三区| 国产乱码精品一品二品| 欧美这里有精品| 久久久国际精品| 日日嗨av一区二区三区四区| 95精品视频在线| 久久精品在线观看| 老司机免费视频一区二区三区| 色婷婷狠狠综合| 国产欧美一区二区精品性色超碰 | 久久久久久久久久看片| 亚洲成人一二三| 97se狠狠狠综合亚洲狠狠| 欧美激情一区二区三区在线| 日本不卡一区二区三区| 91麻豆国产自产在线观看| 国产精品免费看片| 成人午夜av电影| 久久久久久久精| 亚洲一区二区三区四区在线观看| 色综合一个色综合亚洲| 日本一区二区电影| 成人动漫一区二区在线| 欧美精品一区二区三区视频| 偷拍自拍另类欧美| 欧美久久久久久蜜桃| 亚洲成人av一区二区| 一本色道久久综合亚洲91| 制服丝袜日韩国产| 麻豆精品在线看| 精品福利在线导航| 国产在线播精品第三| 色视频成人在线观看免| 亚洲欧洲另类国产综合| 欧美电影免费观看高清完整版在线 | 亚洲精品写真福利| 麻豆91在线观看| 欧美一区二区三区公司| 日韩在线观看一区二区| 欧美肥妇毛茸茸| 日韩精品每日更新| 欧美日本在线播放| 狠狠色丁香久久婷婷综合丁香| 精品欧美一区二区在线观看| 麻豆精品视频在线观看视频| 激情小说亚洲一区| 日韩三级在线观看| 国内不卡的二区三区中文字幕| 欧美一区二区性放荡片| 久久99精品久久只有精品| 精品成人免费观看| 成人在线一区二区三区| 精品99一区二区| 99精品1区2区| 视频精品一区二区| 国产蜜臀97一区二区三区 | 亚洲h在线观看| 日韩三级中文字幕| 99久久精品国产导航| 日韩国产精品大片| 国产亚洲1区2区3区| 91久久久免费一区二区| 久99久精品视频免费观看| 欧美激情一区二区在线| 91精品国产综合久久蜜臀| 国产成人精品免费网站| 国产精品初高中害羞小美女文| 欧美色中文字幕| 国产精品中文字幕一区二区三区| 国产精品久久久爽爽爽麻豆色哟哟| 在线播放视频一区| 国产98色在线|日韩| 日韩高清国产一区在线| 久久综合五月天婷婷伊人| 91一区二区三区在线观看| 美女在线观看视频一区二区| 亚洲欧美综合在线精品| 精品福利一二区| 69av一区二区三区| 9色porny自拍视频一区二区| 成人一级片网址| 国内一区二区在线| 日韩国产精品久久| 亚洲高清视频在线| 亚洲欧洲三级电影| 欧美日韩一区二区三区四区| 99久久精品免费看|