admin
互联网行业码农一枚/业余铲屎官/数码影音爱好者/二次元
文章 742
Python Anaconda update模块
conda是一个很好的包管理工具,在用了Anaconda之后一直不知道怎么用conda进行管理,其实很简单,就…
Python oop之继承nametuple
最近在spark上研究fp-growth算法,其中fpmodel中其中一个方法freqItemsets生成频繁…
bigdata hive collect_set等集合函数
hive工作中用到的一些函数 1. concat(string s1, string s2, string s…
Qt Tensorflow for Line Regression
回归问题是机器学习中一类重要的问题,可以作为一种预测系统或者作为推荐系统的模型,这里不重点讨论回归的理论,读者…
bigdata spark1.6 fp-growth序列化数据错误
Spark运行FP-growth异常报错 在spark1.4版上尝试运行频繁子项挖掘算法是,照搬官方提供的Py…
Python Haar-like人脸检测
2001年viola和jones发表的论文《Robust Real Time Object Detection…
Alg hash table理解 转载
在前面的系列文章中,依次介绍了基于无序列表的顺序查找,基于有序数组的二分查找,平衡查找树,以及红黑树,下图是他…
bigdata Spark RDD中的aggregate函数
刚开始看spark快速编程这本书的时候真的是没有理解这个函数的意思,后来看了博客再去看先关的api文档,现在基…
bigdata Hadoop 任务执行设置队列参考(转载)
对于集群我们经常会启用公平调度或容量调度来满足多用户的需求,这个时候我们需要去设定相应的队列以及队列的优先级。…
Sql 数据库字段类型char、varchar、nchar、nvarchar的区别
对于程序中的string型字段,char、varchar、nchar、nvarchar四种类型来对应(暂时不考…
Python Python函数陷阱
最近开始回头看下python学习手册,只想说这本书真的讲的很详细,每次看都会学到新的东西,看来基础还是不是太扎…
bigdata Spark mlib协同过滤算法中文翻译
最近看了下spark协同过滤的api,并根据提供的代码写了一版商品推荐代码,现在将当前的模块一些api函数翻译…
bigdata Spark读取csv跳首行
目前开发的版本的是spark1.6,因此很多最新的api无法使用,典型的就是读取csv文件无法跳过首行,现在给…