新书:《文本处理中的机器学习》

  • A+
所属分类:人工智能
广告也精彩

前一段时间,谷歌刚刚发布了BERT(Bidirectional Encoder Representations from Transformer)的论文, 进一步推进了深度学习在文本处理中的攻城掠地。

前面我们推荐过一部分深度学习的文本分类 “基于深度学习的文本分类?” ,但是少了很多经典和问题处理, 让很多新人难以掌握历史全貌。  所以这里强烈给各位新人推荐一本3月份的新书 “Machine Learning for Text”, 附带一本9月份的新书“NEURAL NETWORKS AND DEEP LEARNING”。

文本处理中最核心的应该是统计自然语言处理技术,冯志伟老师翻译的《自然语言处理综论(第二版) 》(Speech and Language Processing) 是这方面不可多得的好书。  但是应用部分对于目前应用最广的分类,信息检索,信息抽取部分并不涵盖。   主流的文本应用包括如下方面:

新书:《文本处理中的机器学习》

但是如果再结合我们推荐的这边今年3月出版的新书, 就基本涵盖绝大部分文本应用了。 这就是IBM大神Charu C. Aggarwal的《文本处理中的机器学习》(“Machine Learning for Text”)。

新书:《文本处理中的机器学习》

除了上述的理由之外, 推荐本书还有如下几个要点:

1. 出自文本处理的大神Charu C. Aggarwal

CCA本科平均满分(10 out of 10)毕业于著名的印度理工IIT,博士毕业于MIT, 毕业之后一直在IBM Watson研发中心,专注文本处理领域工作至今已有23年。他目前有10部著作,尤其最近三年,几乎每年一本牛书。  今年更是发表了两本书, 除了推荐的“Machine Learning for Text”, 还有另外一本专注深度学习的书“NEURAL NETWORKS AND DEEP LEARNING”。 当然还有那本经典的介绍推荐系统的大作“RECOMMENDER SYSTEMS”。 不仅如此, CCA对华人还特别友善, 几乎有1半的弟子是华人。

新书:《文本处理中的机器学习》

新书:《文本处理中的机器学习》

2. 理论实践并重

因为出自工业界, 所以本书对如何预处理文本, 如何评价文本分类效果, 如何融合多种数据等各种实战挑战一一进行了细致的说明。 大家可以看一下详细目录:http://charuaggarwal.net/Text-Learning.pdf

3. 侧重文本中的信息提取

大部分自然语言处理的书多侧重语言模型, 只有偏向搜索引擎,广告推荐系统方向的侧重于信息提取。  目前, 整个文本处理工业界已经走过从检索过渡到了推荐的历程, 正处于从推荐过渡到辅助理解的过程中。 从这个角度来说, 由一线大神写的书可谓是查漏补缺的宝典。   如果在结合一个做文本处理的人写的深度学习的书“NEURAL NETWORKS AND DEEP LEARNING”, 简直就是扎扎实实的拿到第一线经验。

新书:《文本处理中的机器学习》

小结:

CCA大神的书是必须推荐的, 尤其还是2本杰作。  当然有钱的同学, 亚马逊上可以购买到的, 请支持一下CCA! 刚入门还没赚到高薪的同学, 请关注一下参考文献吧。记得以后要通过购买来支持CCA。

  • 微信
  • 扫一扫
  • weinxin
  • 微信公众号
  • 扫一扫
  • weinxin
广告也精彩
多功能折叠刀具
商品3
Pacewear 腾讯HC 智能手表 运动防水定位心率电话苹果蓝牙标准版 咨询客服 领取60元优惠券
羊绒茧型大衣
广告也精彩

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: