国产亚洲精品福利在线无卡一,国产精久久一区二区三区,亚洲精品无码国模,精品久久久久久无码专区不卡

當(dāng)前位置: 首頁 > news >正文

怎樣才能做好網(wǎng)絡(luò)推廣優(yōu)化大師怎么下載

怎樣才能做好網(wǎng)絡(luò)推廣,優(yōu)化大師怎么下載,網(wǎng)站被黑是怎么回事啊,惠州網(wǎng)站建設(shè)熊掌號目錄 創(chuàng)建 DataFrames 生成我們自己的 JSON 數(shù)據(jù) 創(chuàng)建 DataFrame 創(chuàng)建臨時表 簡單的 DataFrame 查詢 DataFrame API 查詢 SQL 查詢 創(chuàng)建 DataFrames 通常,您會通過使用 SparkSession(或在 PySpark shell 中調(diào)用 spark)導(dǎo)入數(shù)據(jù)來創(chuàng)建 …

目錄

創(chuàng)建 DataFrames

生成我們自己的 JSON 數(shù)據(jù)

創(chuàng)建 DataFrame

創(chuàng)建臨時表

簡單的 DataFrame 查詢

DataFrame API 查詢

SQL 查詢


創(chuàng)建 DataFrames

通常,您會通過使用 SparkSession(或在 PySpark shell 中調(diào)用 spark)導(dǎo)入數(shù)據(jù)來創(chuàng)建 DataFrame。

我們將討論如何將數(shù)據(jù)導(dǎo)入到本地文件系統(tǒng)、Hadoop 分布式文件系統(tǒng)(HDFS)或其他云存儲系統(tǒng)(例如,S3 或 WASB)。在本文中,我們將專注于在 Spark 內(nèi)直接生成您自己的 DataFrame 數(shù)據(jù)或利用 Databricks 社區(qū)版中已經(jīng)可用的數(shù)據(jù)源。

首先,我們將不訪問文件系統(tǒng),而是通過生成數(shù)據(jù)來創(chuàng)建 DataFrame。在這種情況下,我們將首先創(chuàng)建 stringJSONRDD RDD,然后將其轉(zhuǎn)換為 DataFrame。這段代碼片段創(chuàng)建了一個包含游泳者(他們的 ID、姓名、年齡和眼睛顏色)的 JSON 格式的 RDD。

生成我們自己的 JSON 數(shù)據(jù)

下面,我們將最初生成 stringJSONRDD RDD:

stringJSONRDD = sc.parallelize(("""{ "id": "123",
"name": "Katie",
"age": 19,
"eyeColor": "brown"}""",
"""{
"id": "234",
"name": "Michael",
"age": 22,
"eyeColor": "green"}""", 
"""{
"id": "345",
"name": "Simone",
"age": 23,
"eyeColor": "blue"}""")
)

現(xiàn)在我們已經(jīng)創(chuàng)建了 RDD,我們將使用 SparkSession 的 read.json 方法(即 spark.read.json(...))將其轉(zhuǎn)換為 DataFrame。我們還將使用 .createOrReplaceTempView 方法創(chuàng)建一個臨時表。

創(chuàng)建 DataFrame

以下是創(chuàng)建 DataFrame 的代碼:

swimmersJSON = spark.read.json(stringJSONRDD)

創(chuàng)建臨時表

以下是創(chuàng)建臨時表的代碼:

swimmersJSON.createOrReplaceTempView("swimmersJSON")

如前文所述,許多 RDD 操作是轉(zhuǎn)換,這些轉(zhuǎn)換直到執(zhí)行動作操作時才執(zhí)行。例如,在前面的代碼片段中,sc.parallelize 是一個轉(zhuǎn)換,當(dāng)使用 spark.read.json 從 RDD 轉(zhuǎn)換為 DataFrame 時執(zhí)行。注意,在這段代碼的筆記本截圖中(左下角附近),直到包含 spark.read.json 操作的第二個單元格,Spark 作業(yè)才執(zhí)行。

為了進一步強調(diào)這一點,在下圖的右側(cè)窗格中,我們展示了執(zhí)行的 DAG 圖。

在下面的截圖中,您可以看到 Spark 作業(yè)的 parallelize 操作來自生成 RDD stringJSONRDD 的第一個單元格,而 map 和 mapPartitions 操作是創(chuàng)建 DataFrame 所需的操作:

需要注意的是,parallelize、map 和 mapPartitions 都是 RDD 轉(zhuǎn)換。在 DataFrame 操作 spark.read.json(在本例中)中,不僅有 RDD 轉(zhuǎn)換,還有將 RDD 轉(zhuǎn)換為 DataFrame 的動作。這是一個重要的說明,因為即使您正在執(zhí)行 DataFrame 操作,要調(diào)試您的操作,您需要記住您將在 Spark UI 中理解 RDD 操作。

請注意,創(chuàng)建臨時表是一個 DataFrame 轉(zhuǎn)換,并且在執(zhí)行 DataFrame 動作之前不會執(zhí)行(例如,要執(zhí)行的 SQL 查詢)。

簡單的 DataFrame 查詢

現(xiàn)在您已經(jīng)創(chuàng)建了 swimmersJSON DataFrame,我們將能夠在其上運行 DataFrame API 以及 SQL 查詢。讓我們從一個簡單的查詢開始,顯示 DataFrame 中的所有行。

DataFrame API 查詢

要使用 DataFrame API 執(zhí)行此操作,您可以使用 show(<n>) 方法,該方法將前 n 行打印到控制臺:

# DataFrame API
swimmersJSON.show()

這將給出以下輸出:

SQL 查詢

如果您更傾向于編寫 SQL 語句,您可以編寫以下查詢:

spark.sql("select * from swimmersJSON").collect()

這將給出以下輸出:

我們使用了 .collect() 方法,它返回所有記錄作為一個行對象(Row objects)的列表。請注意,您可以對 DataFrames 和 SQL 查詢使用 collect() 或 show() 方法。只要確保,如果您使用 .collect(),這是針對小 DataFrame 的,因為它將返回 DataFrame 中的所有行,并將它們從執(zhí)行器移回驅(qū)動程序。您可以改用 take(<n>) 或 show(<n>),這允許您通過指定 <n> 來限制返回的行數(shù):

http://aloenet.com.cn/news/30085.html

相關(guān)文章:

  • 免費網(wǎng)站建設(shè)哪個好百度app下載官方免費最新版
  • 網(wǎng)站模板如何制作武漢網(wǎng)站競價推廣
  • 公司做網(wǎng)站的 oa辦公系統(tǒng)seo搜索引擎
  • 晚上必看的正能量網(wǎng)站app市場營銷在線課程
  • 東莞市國外網(wǎng)站建設(shè)報價百度云盤資源搜索
  • 行業(yè)網(wǎng)站cms推廣賺錢
  • wordpress個人博客多大空間seogw
  • 浙江建設(shè)網(wǎng)官方網(wǎng)站西安百度公司開戶
  • 晉城網(wǎng)站建設(shè)重慶的seo服務(wù)公司
  • 模板建站服務(wù)器網(wǎng)站關(guān)鍵詞
  • 商城網(wǎng)站開發(fā)技術(shù)可行性分析廣州疫情最新動態(tài)
  • asp.net手機網(wǎng)站開發(fā)教程深圳網(wǎng)站優(yōu)化公司
  • 政府門戶網(wǎng)站規(guī)范化建設(shè)深圳推廣公司哪家好
  • 網(wǎng)頁美工設(shè)計高跟鞋效果好的關(guān)鍵詞如何優(yōu)化
  • 蘑菇短視頻2023版特色功能怎么優(yōu)化標題和關(guān)鍵詞排名
  • 設(shè)計門戶網(wǎng)站軟件開發(fā)外包公司
  • 備案的網(wǎng)站可以改域名嗎我想做網(wǎng)絡(luò)推廣找誰
  • 做網(wǎng)站單頁視頻互聯(lián)網(wǎng)媒體廣告公司
  • 武漢 網(wǎng)站建設(shè)公司登封網(wǎng)站關(guān)鍵詞優(yōu)化軟件
  • 哪個網(wǎng)站能買到做披薩的芝士正宗中小企業(yè)網(wǎng)站
  • 有什么網(wǎng)站可以兼職做翻譯色盲測試卡
  • 圖庫網(wǎng)站源碼下載排名點擊軟件怎樣
  • 大連企業(yè)網(wǎng)站排名優(yōu)化百度關(guān)鍵詞推廣可以自己做嗎
  • matlab做網(wǎng)站爬蟲最新國際新聞事件
  • 網(wǎng)站二次開發(fā)是什么意思seo優(yōu)化團隊
  • 網(wǎng)站建設(shè)需要注冊什么類型的公司aso應(yīng)用商店優(yōu)化原因
  • 溫州免費做網(wǎng)站安徽360優(yōu)化
  • 濟南網(wǎng)站建設(shè)公司哪個好自媒體平臺有哪些
  • 網(wǎng)站上面的內(nèi)容里面放照片怎么做平臺推廣文案
  • centos 7安裝wordpress上海seo排名