• 加入Google Analytics、Google Tag Manager QQ群一起交流谷歌分析小站—总群
  • 加入Adobe Analytics、Adobe Launch交流群,加入请附上Adobe的组织ID,没有请勿加Adobe Analytics交流群
  • Google Analytics和Google Tag Manager视频课程第三版http://ke.ichdata.com/course/50

自然语言处理与文本挖掘(3)——统计语言模型

NLP GA小站 3年前 (2016-12-25) 3136次浏览 已收录 0个评论

基于以下语料建立语言模型

研究生物很有意思
他大学时代是研究生物的
生物专业是他的首选目标
他是研究生

1)以“字”作为基元计算出现句子“他是研究生物的”的概率
2)以“词”作为基元分别计算出现句子“他 是 研究 生物 的”和“他 是 研究生 物 的”的概率
注意2)中用空格标识的不同分词方法,如果出现概率为0的情况,请使用适当的平滑方法处理
自然语言处理与文本挖掘(3)——统计语言模型

喜欢 (1)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址