admin
互联网行业码农一枚/业余铲屎官/数码影音爱好者/二次元
文章 742
ml xgboost对one-hot编码特征特征选择时遇到的问题
xgboost对所有的输入特征都是当做数值型对待,所以你给定的数据也要是指定的数据类型 对于数据缺失或者稀疏,…
Qt xgboost调参–转载
XGBoost参数调优完全指南(附Python代码) 原文地址:Complete Guide to Param…
Sql hive连接优化相关
1. Join的基本原理 大家都知道,Hive会将所有的SQL查询转化为Map/Reduce作业运行于Hado…
bigdata mapreduce之shuffle操作
Shuffle过程是MapReduce的核心,也被称为奇迹发生的地方。要想理解MapReduce, Shuff…
Sql DML、DCL等基本概念
博主日常使用查询的工具就是hive,与mysql还是有很多共同之处,但是很多时候也要去hive官网查询相关信息…
Sql hive文件存储格式对比
列式存储和行式存储 上图左边为逻辑表,右边第一个为行式存储,第二个为列式存储。 行存储的特点: 查询满足条件的…
Sql hive传递参数变量方法
最近写的脚本都需要向hive中传递相关参数,所以搜集一下网上的资料备注一下,也顺便学习一下。 使用Hive编写…
Sql hive静态与动态分区理解
今天博主需要建立一个备份带分区的数据表,拷贝时若采用静态分区方式需要写N行语句,因此可以使用动态分区,节省大量…
ml 机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率
在分类任务中,人们总是喜欢基于错误率来衡量分类器任务的成功程度。错误率指的是在所有测试样例中错分的样例比例。实…
Linux Shell脚本逐行处理文本文件
经常会对文体文件进行逐行处理,在Shell里面如何获取每行数据,然后处理该行数据,最后读取下一行数据,循环处理…
Linux linux shell中使用awk sed等命令
cut cut 命令不能在分割符是空格的字符串中截取列,只能是 制表符 或 具体的分割符。 选项 -b :仅显…
Qt Deep Learning TensorFlow实践:mnist手写识别(二)
mnist_inference.py 实现参数设置,前向网络的计算: #!/usr/bin/python #-…
Qt Deep Learning TensorFlow实践:mnist手写识别(一)
代码如下: #!/usr/bin/python #-*- coding:utf-8 -*- #########…