韩漫免费漫画在线观看方法,《好好疼爱里面》免费看,年轻漂亮的女士护士内衣,妈妈醉酒后把我当爸爸电视剧

文章 > Python常见问题 > 怎么用python写spark

怎么用python写spark

头像

silencement

2019-11-21 09:41:222304浏览 · 0收藏 · 0评论

为什么要使用Python来写Spark

Python写spark我认为唯一的理由就是:你要做数据挖掘,AI相关的工作。因为很多做数挖的他们的基础语言都是python,他们如果重新学scala比较耗时,而且,python他的强大类库是他的优势,很多算法库只有python有。

Win本地编写代码调试

编辑器:PyCharm

Spark:1.6

Python:2.7

Win环境准备

Python的安装

解压python包,在环境变量里面配上bin的路径

Spark的安装

下载spark的bin文件,解压即可,在环境变量配置SPARK_HOME

要可以通过编辑器来安装,如pycharm,查找pyspark库安装即可

Hadoop安装

安装hadoop环境 。在win下面需要winutils.exe;在环境里面配置HADOOP_HOME 即可。

代码示例

# -*- coding: utf-8 -*-
from __future__ import print_function
from pyspark import *
import os
print(os.environ['SPARK_HOME'])
print(os.environ['HADOOP_HOME'])
if __name__ == '__main__':
    sc = SparkContext("local[8]")
    rdd = sc.parallelize("hello Pyspark world".split(" "))
    counts = rdd \
        .flatMap(lambda line: line) \
        .map(lambda word: (word, 1)) \
        .reduceByKey(lambda a, b: a + b) \
        .foreach(print)
    sc.stop

python学习网,大量的免费python学习视频,欢迎在线学习!

问题:

from pyspark import *

找不到pyspark。那你需要把spark的bin包下面的python的所有都拷贝到(可能需要解压py4j)

%PYTHON%\Lib\site-packages下面去。这样,你的编辑器才能找到。

或者:

配置你的编辑器的环境变量:

PYTHONPATH=F:\home\spark-1.6.0-bin-hadoop2.6\python;F:\python2.7\Lib\site-packages

使用spark-submit提交时用到其他类库 –py-files xxxx/xxxx.zip,xxxx.py。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

AV网站在线观看| 乳腺增生| 妈妈叫我戴上避孕套英文| 33D蜜桃成熟| 苍井空人体写真| 初二学生小馒头| 一枪战三母2-1免费观看央视网| 下面的小嘴又饿了| 《性88分钟》| 不戴套瑜伽教练3)| 《互换人妻HD中字》| 女朋友的妹妹ID| 麻豆蜜桃69无码专区在线 | 哥布林杀手| 双飞娘俩国语免费观看视频| 李智友| 妻子的秘密在线观看免费全集| 儿媳妇免费播放全部电视剧| 少女たちよ在线播放电视剧 | 老公把闺蜜干的嗷嗷叫| 美女被咬小头头视频大全| 意大利《空乘》3| 狗配人的大片| 日产MV和欧美MV的外观对比| 学生女2| 老和尚猛挺进她莹莹的体导演是谁| 离婚女人的周末| 《黏糊糊的你》免费观看| 男生困困进女生困困洞视频| 《厨房激战5》完整版在线观看| 疯狂二人房间荷尔蒙爆发原声 | 《黏糊糊的你》免费观看| 我故意对着床上的小能做手工图片| 色情版巜劳拉性放荡ID剧情| 家族轮换之共乐的日子最新章节更,| 万能浏览器| 都江堰龙池巨人阶梯走红当地提醒| 欧美人动物PPT免费模板大全| 《黏糊糊的你》免费观看 | 厨房韵母2| 房东天天吃我奶躁我在哪里看