找回密码
 新注册用户
搜索
查看: 3001|回复: 1

[计算机交流]从全唐诗对偶字中提取字义网络图

[复制链接]
发表于 2010-1-17 19:33:37 | 显示全部楼层 |阅读模式


语言统计分析期末大作业要求我们统计全唐诗中的对偶字,并用所得到的统计结果反过来评判出对仗最工整的诗句。我在数据处理过程中突然想到,鉴于互成对偶的两个字之间有一定的语义联系,我们便有了一个庞大的汉字语义关联库;如果把所有汉字之间的关联画成一张图会是什么样子呢?于是我用 Mathematica 7 提出了全唐诗中处在对偶位置上的所有字对,得到了 464448 个可能的对偶关系;再利用一些算法得到了最稳定、最常用的 2000 个对偶关系,把它们都描绘在一张大图上,于是便有了上面的这个图。点击这里查看高清无码大图,1600x1600 像素。可以看到,有语义关联的汉字自动地聚合到了一起。


    利用 Mathematica 7 的 CommunityStructurePartition 算法,我把这个图中的顶点大致分成了几个团体,每一个团体内的字基本上就构成了一个词类。这几天打算就这个题目继续研究下去,希望能得到一些更有意思的结果。

来自: matrix67
回复

使用道具 举报

发表于 2010-1-17 20:33:34 | 显示全部楼层
太强大了,很有意思的题目,羡慕
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2025-5-14 12:49

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表