bigdata map_reduce原理
进入大数据领域经常接触到的词汇就是map /reduce,其实在这个在python中经常用到,比如处理一个li…
bigdata spark-yarn集群python异常
今天在spark yarn集群上面跑代码发现出现import numpy error ,提示没有相应的模块,其…
Reader 技术大牛养成指南,一篇不鸡汤的成功学实践
有的人想成为大牛,却不曾为此努力。有的人辛苦耕耘,却收获寥寥。很多时候,你跟成功的差距并不是能力,也不是运气,…
Python 改善 Python 程序的 91 个建议(二)
建议 24:遵循异常处理的几点基本原则 异常处理的几点原则: 注意异常的粒度,不推荐在 try 中放入过多的代…
Python 改善 Python 程序的 91 个建议(一)
第 1 章 引论 建议 1:理解 Pythonic 概念 Pythonic Tim Peters 的 《The…
Sql sql 日期转换函数
经常需要查询半年以内或者指定时间范围内的数据,一般情况下数据库中保存的都是时间戳,时间戳实际上就是unix时间…
Python python index小记
1.index() 一般用处是在序列中检索参数并返回第一次出现的索引,没找到就会报错,比如: >>…
Linux 阿里云ecs设置swap分区
使用swap分区也是博主的网站经常挂掉,以前用其他的服务器主要是内存大不会出现啥问题,主要就是wordpres…
Wordpress cenos6 apache等设置自启动
1、前言 维护wordpress日常惯例,需要用到apahce和mysql。阿里云ECS最近经常内存不够直接杀…
hdfs spark rdd保存单个文件问题
之前在spark上面跑一个代码,但是输出的结果想拿出来分析顺便画个图表征,因此就想把数据保存到一个文件上面去,…
Editor sublime3配置python开发环境
古语有云,工欲善其事必先利其器。选择一个好的工具,往往能达到意想不到的效果。因为个人电脑原因,用 pychar…
Sql hive 百分比统计
在hive查询中关于聚合和统计函数中涉及到百分比函数,比如PERCENT_RANK,不过这都是依据某个字段行数…
Python Pandas基础随手记
1、numpy切片中bool切片索引都是会产生copy,注意bool索引使用数学符号表示类似|,不可以使用an…
Python linux配置anaconda
选用Anaconda的优势: 1).不需要配置PYTHON环境变量; 2).集成很多packages,省去一一…
hdfs hadoop HDFS常用操作命令
命令基本格式: hadoop fs -cmd < args > 1.ls hadoop fs -l…