好友是做海外市场工作的,为了更科学的制定今年的销量KPI,希望能根据往年数据进行建模预测。
分类目录归档:机器学习
matplotlib – 在linux环境配置jupyter支持中文
默认情况下,jupyter中matplotlib绘制的图片无法正确显示中文,这需要自行配置,我参考了网上的教程,实测有效且简单。 继续阅读
numpy机器学习 – 实现神经网络-下(实现篇)
接前文《numpy机器学习 – 实现神经网络-上(理论篇)》,我们在深刻理解理论之后,实现时只需要避开几个小坑即可。
numpy机器学习 – 实现神经网络-上(理论篇)
本文分享如何证明与实现一个神经网络,本篇博客拖延了很久,因为要深入浅出的讲明白是需要花点功夫的(画神经网络图、用latex推导公式)。 继续阅读
numpy机器学习 – 波士顿房价回归
本文分享”波士顿房价”的数据分析与线性回归问题。 继续阅读
numpy机器学习 – 分类模型的评估
本文介绍如何对分类模型进行效果评估。 继续阅读
numpy机器学习 – L2正则化
本文介绍如何推导L2正则化,涉及到数学推导没法事无巨细,所以下面只是一个大概的流程记录。
numpy机器学习 – 逻辑回归分类
本文介绍如何推导与手写一个逻辑回归分类模型,涉及到数学推导没法事无巨细,所以下面只是一个大概的流程记录。 继续阅读
numpy机器学习 – 感知机分类
本文介绍如何推导与手写一个感知机分类模型,涉及到数学推导没法事无巨细,所以下面只是一个大概的流程记录。
numpy机器学习 — 实现线性回归
本文介绍如何推导与手写一个线性回归模型,涉及到数学推导没法事无巨细,所以下面只是一个大概的流程记录。 继续阅读
【小白的机器学习】”鸢尾花”数据集
”鸢尾花”数据是用来讲”分类问题”的老生常谈了,下面我们站在一个相对纯粹的角度再来看看这个数据集。 继续阅读
【Python数据分析】推荐学习资料
Python数据分析三大套件numpy、matplotlib、pandas的学习资料太多了,如果你想”系统的、快速的“再梳理一下知识体系,我给大家推荐一个优质学习资料。 继续阅读
pyspark – 基于word2vec+LSH实现相似内容查找
本文基于kaggle豆瓣影评数据集,演示如何利用pyspark的word2vec和LSH库实现相似影评的计算,同样的方式可以用于相似内容匹配,例如:在海量文章中检测存在抄袭的文章等类似需求。 继续阅读
强化学习Deep Q-Network自动玩flappy bird
这两天看到通过强化学习自动玩游戏的项目,感觉有趣而且技术难度也不高,所以我也实现了一下。
经过一个通宵的训练,模型已经把小鸟控制的很棒了(训练了5万次左右): 继续阅读
tensorflow-serving二次开发 – 增加模型流量监控
我们采用tensorflow-serving部署模型,利用文件同步机制分发model到tensorflow-serving目录下,由tensorflow-serving自动热加载最新N个版本模型,或者直接指定加载哪些版本。 继续阅读
tensorflow分布式训练 — tensorflow on spark使用方法
tensorflow(2.x版本)生产训练需要在大规模训练样本下完成,单机已经无法满足训练速度。
tensorflow on spark是yahoo开源的基于spark进行分布式tensorflow训练的开发框架,本文要求读者熟练tensorflow单机使用,最好读一下前一篇博客:《tensorflow2.0 – 端到端的wide&deep模型训练》。
tensorflow2.0 – 端到端的wide&deep模型训练
本文将基于泰坦尼克数据集,展现tensorflow2.0实现wide&deep模型训练的整个工程化流程,内容包括: 继续阅读
tensorflow – 透过数学理解model
本文通过一个tensorflow例子,通俗的说明神经网络是如何工作的,以便我们更自信的驾驭它。 继续阅读
推荐2本机器学习的好书
学机器学习,不可能一直停留在”API侠”层面,终究会开始探究原理的,而机器学习的原理就是数学。 继续阅读
端到端的tensorflow2.0工程示例
本文以泰坦尼克数据集为例,提供了一套端到端的完整tensorflow2.0工程示例: 继续阅读