• 加入Google Analytics、Google Tag Manager QQ群一起交流谷歌分析小站—总群
  • 加入Adobe Analytics、Adobe Launch交流群,加入请附上Adobe的组织ID,没有请勿加Adobe Analytics交流群
  • Google Analytics和Google Tag Manager视频课程第三版http://ke.ichdata.com/course/50

自然语言处理与文本挖掘(1)——数学基础

NLP GA小站 4年前 (2016-12-05) 2958次浏览 已收录 0个评论

最近开始学自然语言处理与文本挖掘方面的东西,随着课程按自己的理解做些总结。

集合:一定范围内确定的,并且彼此可以区分的对象汇集在一起形成的整体
集合由元素或子集构成,之间的是包含
集合的表示方法:列举放和命题法
列举法:列出所有的元素
命题法;函数式表达
分类:有限集和无穷集,无穷集可以分为可数和不可数
可数不可数取决于基数是否有限
集合之间的关系:
包含–真子集
相等
集合的运算:
并–所有
交–共有
差–只在
笛卡尔–交叉
冥集–元素的组合,一定包含空集
补集–之外的

关系:集合之间的动态描述
假设存在两个集合A和B,任意的R都包含于A*B,R就是A到B的二元关系。A为定义域,B为值域,a包含于A,b包含于B,(a,b)包含于R,可以写成aRb
关系的合成:
R1包含于A*B,R2包含于B*C,则R1与R2的合成R1R2是表示A*C的关系

是由于点和线组成,G=(V,E) V表示定点,E表示边
图分为无向图和有向图,取决于边是否有方向
deg(v)表示顶点的度数,也就是经过该顶点的边数
度数之和通常是图中边数的2倍
图中构成圈的叫回路或圈,至少有一条路存在的是连通图
有向图有出度数(ideg(v))和入度数(odeg(v))
出度数和入度数是相等的

树:有向图中满足特定条件的成为树,只能够有一条有向路,方向一致

森林:多个树构成森林

文法是形式定义实际上给出的是语言描述的模型系统
G=(V,T,P,S)=(变量,终极符,产生式,开始符号)

喜欢 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址