软件1801 (广州商学院)

  • 08 学生课程分数的Spark SQL分析

    一、用SQL语句完成数据分析要求 ###生成“表头” from pyspark.sql.types import IntegerType,StringType,StructField,StructType from pyspark.sql import Row fields = [StructFie
    金腰带小拳石   2021-05-18 20:55   0   30
  • 08 学生课程分数的Spark SQL分析

    读学生课程分数文件chapter4-data01.txt,创建DataFrame。 url = "file:///usr/local/spark/mycode/rdd/chapter4-data01.txt" rdd = spark.sparkContext.textFile(url).map(la
    会喷水的海参   2021-05-18 17:54   0   104
  • 08 学生课程分数的Spark SQL分析

    读学生课程分数文件chapter4-data01.txt,创建DataFrame。 一、用DataFrame的操作或SQL语句完成以下数据分析要求,并和用RDD操作的实现进行对比: 每个分数+5分。 总共有多少学生? 总共开设了哪些课程? 每个学生选修了多少门课? 每门课程有多少个学生选? 每门课程
    约翰克里斯朵夫   2021-05-18 11:31   0   82
  • 学生课程分数的Spark SQL分析

    读学生课程分数文件chapter4-data01.txt,创建DataFrame。 url = "file:///D:/chapter4-data01.txt" rdd = spark.sparkContext.textFile(url).map(lambda line:line.split(','
    小王子C   2021-05-17 20:58   0   373
  • 08 学生课程分数的Spark SQL分析

    一.读学生课程分数文件chapter4-data01.txt,创建DataFrame。 1.用DataFrame的操作或SQL语句完成以下数据分析要求: 2.每个分数+5分。 3.总共有多少学生? 4.开设了多少门课程? 5.每个学生选修了多少门课? 6.每门课程有多少个学生选? 7.每门课程大于9
    写那么快干嘛啊?   2021-05-17 20:10   1   248
  • 08 学生课程分数的Spark SQL分析

    用DataFrame的操作或SQL语句完成以下数据分析要求,并和用RDD操作的实现进行对比: 每个分数+5分。 总共有多少学生? 总共开设了哪些课程 每个学生选修了多少门课? 每门课程有多少个学生选? 每门课程大于95分的学生人数? Tom选修了几门课?每门课多少分? Tom的成绩按分数大小排序。
    fangyujie   2021-05-17 19:10   0   92
  • 07 从RDD创建DataFrame

    1.pandas df 与 spark df的相互转换 df_s=spark.createDataFrame(df_p) df_p=df_s.toPandas() 1 2 3 import pandas as pd import numpy as np arr = np.arange(6).resh
    只吃外卖   2021-05-14 21:44   0   48
  • 从RDD创建DataFrame

    1.pandas df 与 spark df的相互转换 df_s=spark.createDataFrame(df_p) df_p=df_s.toPandas() 2. Spark与Pandas中DataFrame对比 http://www.lining0806.com/spark%E4%B8%8E
    yy0102   2021-05-14 21:35   0   30
  • 07 从RDD创建DataFrame

    1.pandas df 与 spark df的相互转换 df_s=spark.createDataFrame(df_p) df_p=df_s.toPandas() 2. Spark与Pandas中DataFrame对比 3.1 利用反射机制推断RDD模式 sc创建RDD 转换成Row元素,列名=值
    果宝机甲,归位!!!   2021-05-14 21:23   0   36
  • 07

    sc创建RDD 转换成Row元素,列名=值 spark.createDataFrame生成df df.show(), df.printSchema() 3.2 使用编程方式定义RDD模式 生成“表头” fields = [StructField(field_name, StringType(), T
    杨嘉铭   2021-05-14 21:20   0   44