文本挖掘与自然语言处理结课

文本挖掘与自然语言处理结课
课程终于结束,花了小半年学这个课程,在这个过程明显体会到的是数学部分,多花点时间还是可以理解的,但编码部分,实在是一时间补不起来,即是看了一些第三方库的代码,还是能学到不少东西。这门课还是很系统的介绍了文本挖掘和自然语言的,偏向于算法原理部分吧,难度肯定是有的,但要坚持,没有什么能够一蹴而就的。   又通过一次,到了level6了,多三门课有能……继续阅读 »

GA小站 7个月前 (03-25) 461浏览 0评论 0个赞

自然语言处理与文本挖掘(3)——统计语言模型

自然语言处理与文本挖掘(3)——统计语言模型
基于以下语料建立语言模型 研究生物很有意思 他大学时代是研究生物的 生物专业是他的首选目标 他是研究生 1)以“字”作为基元计算出现句子“他是研究生物的”的概率 2)以“词”作为基元分别计算出现句子“他 是 研究 生物 的”和“他 是 研究生 物 的”的概率 注意2)中用空格标识的不同分词方法,如果出现概率为0的情况,请使用适当的平滑方法处理 ……继续阅读 »

GA小站 10个月前 (12-25) 620浏览 0评论 1个赞

自然语言处理与文本挖掘(2)——乔姆斯基的形式语法

自然语言处理与文本挖掘(2)——乔姆斯基的形式语法
基于以下语料建立语言模型 研究生物很有意思 他大学时代是研究生物的 生物专业是他的首选目标 他是研究生 1)以“字”作为基元计算出现句子“他是研究生物的”的概率 2)以“词”作为基元分别计算出现句子“他 是 研究 生物 的”和“他 是 研究生 物 的”的概率 注意2)中用空格标识的不同分词方法,如果出现概率为0的情况,请使用适当的平滑方法处理 ……继续阅读 »

GA小站 10个月前 (12-19) 538浏览 0评论 0个赞

自然语言处理与文本挖掘(1)——数学基础

自然语言处理与文本挖掘(1)——数学基础
最近开始学自然语言处理与文本挖掘方面的东西,随着课程按自己的理解做些总结。 集合:一定范围内确定的,并且彼此可以区分的对象汇集在一起形成的整体 集合由元素或子集构成,之间的是包含 集合的表示方法:列举放和命题法 列举法:列出所有的元素 命题法;函数式表达 分类:有限集和无穷集,无穷集可以分为可数和不可数 可数不可数取决于基数是否有限 集合之间的关系: 包含&……继续阅读 »

GA小站 11个月前 (12-05) 546浏览 0评论 0个赞