Category: ml

利用朴素贝叶斯算法进行文档分类

Post by Joey Huang under ml on 2017-05-07(Sunday) 23:43. Tags: machine-learning,

本文利用 scikit-learn 里的朴素贝叶斯算法对文档进行分类,以便更深入地理解贝叶斯算法。这不是篇介绍自然语言处理的文章,语料库直接使用英文,以避免介绍针对中文的分词技术。为了读者更好的理解原理,本文介绍了 TF-IDF ,这是一个表达词语权重信息的模型。

阅读全文 »





异常检测

Post by Joey Huang under ml on 2015-12-15(Tuesday) 23:11. Tags: machine-learning,

高斯分布是自然界最常见的分布形态,高斯分布用来做异常检测是非常合适的模型。枪打出头鸟,那些分布在正态分布两端的小概率事件,要么好的出奇(右边),要么差得离谱(右边)。据说认真看完这篇文章并点赞的人基本上是分布在高斯分布的右侧。

阅读全文 »




支持向量机核函数

Post by Joey Huang under ml on 2015-12-07(Monday) 23:04. Tags: machine-learning,

什么是核函数?核函数的作用是什么?怎么样把核函数和支持向量机结合起来?怎么样使用支持向量机来解决分类问题?怎么样在逻辑回归算法,支持向量机,神经网络这三个分类算法里选择使用哪个算法来解决实际问题?本文就是回答这些疑问的。

阅读全文 »





Powered by Pelican and Zurb Foundation. Theme by Kenton Hamaluik.