• 如果觉得本站不错,可以收藏本站
  • 本站关注Google Analytics、Adobe Analytics和广告技术
  • Google Analytics和Google Tag Manager视频课程第三版http://edu.ichdata.com

自然语言处理与文本挖掘(3)——统计语言模型

NLP 黄业忠 4年前 (2016-12-25) 3391次浏览 已收录 0个评论 扫描二维码

基于以下语料建立语言模型

研究生物很有意思
他大学时代是研究生物的
生物专业是他的首选目标
他是研究生

1)以“字”作为基元计算出现句子“他是研究生物的”的概率
2)以“词”作为基元分别计算出现句子“他 是 研究 生物 的”和“他 是 研究生 物 的”的概率
注意2)中用空格标识的不同分词方法,如果出现概率为0的情况,请使用适当的平滑方法处理
自然语言处理与文本挖掘(3)——统计语言模型


GA小站, 版权所有丨如未注明 , 均为原创

转载请注明标题:自然语言处理与文本挖掘(3)——统计语言模型
链接:https://www.ichdata.com/statistical-language-model.html

喜欢 (1)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址