关于机器学习,很多地方提到GBDT+LR这类炼金方法,常用于CTR预估的二分类问题。 继续阅读
分类目录归档:机器学习
tensorflow2.0 keras SavedModel模型特征预处理
神经网络和xgboost有一个很大的区别,就是xgboost树模型对每个特征的数值范围不敏感,因此基本不需要做特征预处理就可以达到不错的效果。
而神经网络对特征的数值范围敏感,如果不进行特征预处理,模型效果可能还不如xgboost。 继续阅读
2019谷歌开发者大会 – 收获
刚参加完这个大会,谷歌不仅技术创新牛,而且还非常大方,难怪长盛不衰了。 继续阅读
手写python神经网络
如果你已经读过了传统机器学习的书,相信你下一步就会对神经网络和深度学习产生兴趣,但却往往苦于不知道该从何入手。 继续阅读
《Python机器学习基础教程 》全书总结
我是如何接触到机器学习的呢?其实是出于对公司推荐系统的好奇,所以就学习了该项目的代码,因此我实际上从最初就了解到了机器学习对应用产生的巨大实际价值以及其核心原理。
正因为这样的经历,让我认识到机器学习这门技术是一定要去了解和掌握的,这是一个我从来未曾想象过的东西,它可以如何简单的付诸于实践,虽然其内核是无比复杂的数学理论。
《Python机器学习基础教程 》笔记-第7章
《Python机器学习基础教程 》笔记-第6章
《Python机器学习基础教程 》笔记-第5章
《Python机器学习基础教程 》笔记-第4章
《Python机器学习基础教程 》笔记-第3章
《Python机器学习基础教程 》笔记-第2章
《Python机器学习基础教程 》笔记-第1章
基于标签如何构建特征向量?
我们预测user是否对item感兴趣,最简单的就是user特征和item特征拼在一起作为特征向量,进行模型训练与预测。 继续阅读
精确率(precision)与召回率(recall)
这两个”率”经常看到,但也很容易忘记怎么回事,所以我在这里通过博客的方式再记录一下,加深印象。 继续阅读
机器学习与商品归一去重
本文仅提供思路,希望对大家有帮助。 继续阅读
记录pyspark ml与pmml的用法
这两天实践了一下sklearn、pyspark ml、pmml,下面记录一下。 继续阅读
一篇机器学习入门的PPT分享
考虑到浏览器支持PDF在线阅读,所以以后会上传PDF版本的PPT。
CTR展现打散去重的设计
大家看今日头条的推荐会发现,每次刷新都会推荐不同的内容,而且翻页也很少出现重复内容。 继续阅读
小白理解的机器学习
机器学习给大多数人的感觉就是3个字:”高大上”。 继续阅读
协同过滤推荐算法 — 原理与实践
自从机器学习火爆以来,一直对推荐系统的工程化比较感兴趣,但是网上又缺乏这方面的干货。
这两天偶然接触到python surprise库,才意识到其实基础的推荐算法是可以高度抽象的,也并没有想像的那么难以应用。
为了掌握工具,我发现缺乏了太多理论基础,于是决定把推荐系统的基础算法–协同过滤 进行理论研究。