利用朴素贝叶斯算法进行文档分类

Post by Joey Huang under ml on 2017-05-07(Sunday) 23:43. Tags: machine-learning,

本文利用 scikit-learn 里的朴素贝叶斯算法对文档进行分类,以便更深入地理解贝叶斯算法。这不是篇介绍自然语言处理的文章,语料库直接使用英文,以避免介绍针对中文的分词技术。为了读者更好的理解原理,本文介绍了 TF-IDF ,这是一个表达词语权重信息的模型。

阅读全文 »






白话网站架构演进

Post by Joey Huang under web on 2016-12-02(Friday) 23:52. Tags: web,

读写分离,负载均衡,DNS 动态解析,CDN, memcached, Redis, 动态扩容,你是否曾经被这些名词搞得晕头转向,然后发誓要搞清楚这些概念,然后就没有然后了。或许这篇文章可以让你下次和程序员聊天时可以插一两句话。

阅读全文 »





Powered by Pelican and Zurb Foundation. Theme by Kenton Hamaluik.