您当前的位置: 首页 >  矩阵

词共现矩阵

发布时间:2021-07-29 08:17:35 ,浏览量:0

通过统计一个事先指定大小的窗口内的word共现次数,以word周边的共现词的次数做为当前word的vector。具体来说,我们通过从大量的语料文本中构建一个共现矩阵来定义word representation。

例子

有语料如下:

I like deep learning.
I like NLP.
I enjoy flying.

则其共现矩阵如下:

在这里插入图片描述 此时选的窗口大小为3,选择在该窗口内词汇的共现频率作为vector。

将共现矩阵行(列)作为词向量表示后,可以知道like,enjoy都是在I附近且统计数目大约相等,他们意思相近。

矩阵定义的词向量在一定程度上缓解了one-hot向量相似度为0的问题,但没有解决数据稀疏性和维度灾难的问题。

关注
打赏
1688896170
查看更多评论

暂无认证

  • 0浏览

    0关注

    109275博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文
立即登录/注册

微信扫码登录

0.2559s