新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论Semantic Web(语义Web,语义网或语义万维网, Web 3.0)及相关理论,如:Ontology(本体,本体论), OWL(Web Ontology Langauge,Web本体语言), Description Logic(DL, 描述逻辑),RDFa,Ontology Engineering等。
    [返回] 中文XML论坛 - 专业的XML技术讨论区W3CHINA.ORG讨论区 - Web新技术讨论『 Semantic Web(语义Web)/描述逻辑/本体 』 → 公布基于wordnet的相似度计算算法的原代码!! 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 15516 个阅读者浏览上一篇主题  刷新本主题   平板显示贴子 浏览下一篇主题
     * 贴子主题: 公布基于wordnet的相似度计算算法的原代码!! 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     gzfxxy1978 帅哥哟,离线,有人找我吗?天秤座1975-10-18
      
      
      等级:大二期末(汇编考了97分!)
      文章:80
      积分:512
      门派:XML.ORG.CN
      注册:2007/1/31

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给gzfxxy1978发送一个短消息 把gzfxxy1978加入好友 查看gzfxxy1978的个人资料 搜索gzfxxy1978在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看gzfxxy1978的博客楼主
    发贴心情 公布基于wordnet的相似度计算算法的原代码!!

    以下是相关算法思想和相关的代码.
    设计过程
        计算相似度的准各下作:
        首先处理义原部分‘建分_一个读入流InputStreamReader的
    对象,将n: \ Whole. txt中的内客按行读入到程序中的字符串
    数组nbread中,这个文件中的内客为义原和所对应的层数:
    InputStreamReader isread=new InputStreamReader(new I'ileInput-
    Strea m(" a\Whole. txt")):
    hufFeredReader bread=new hufFeredReader( isread):
        接卜来是处理义原部分sub4中存放的内容即为各个义
    原,之后获得分层数,劝int为分层数:
    nbint[ n]=Intener. value0f( sub2[ n]).intValue():
        从n: \  Glossary. dat中得到每个名词subob‘以及每个词
    的义原submean得到各个义原放在数组stir 1中:
    InputStreamReader isr=new  InputStreamReader(new  P'ileInput-
    Stream ( " n\Glossary. dat")):
    BufferedReader br=new BufferedReader( isr):
    for( int ii= 0; ii< nbstrinn. lennth; ii++)
    {
    nbstrinn} ii}=br.readLine():
    subnb} ;;}=nbstrinn} ii}.substrina(10).trim():
    if(subab} ii}.startsWith(" N"))
      {
      subwhole} m}=nbstrinn} ii}:
      submean} m}=subnb} ;;} .substrina( 5).trim():
      subob} m}=subwhole} m}.substrina(0, 12).trim):
      m+=1:
    }
        这样就可以得到义原数组然后将得到的义原数组放在
    stint中.
        接卜来是对所输入的两个词语的处理下作
        将名词转换成unicode存放在g\out. txt中‘首先建}%_
    IiyteToCharConverter的对象‘利用该对象的convertAll方法将
    拆分成两个字竹的中文巾一字转换成、micode表示的一进制
    然后以十六进制的形式输出就得到中文的、micode编码形
    式:IiyteToCharConverter convey= IiyteToCharConverter. getConve-
    rter(" Gh2312"):
        I'ileWriter fileWriter=new I'ileWriter(" g\out. txt"):
        byte」gbbytes= new bytes 2}:
      for( int a= 0; a< 31823; a++)
            {
          gbbytes= subob} a}.gethytes(" Gh2312"):
          char」c= convey. convertAll( gbbytes):
    for( int b= 0; b< c. length; b++)
      {
    fileWriter. write( Integer. toIIexString( c} b})):
              }
            fileWriter. write("\n"):
            }
    fileWriter. close():
        然后对输入的两个词语instr} 0}和instr} 1}进行处理‘得
    到两个词语的义原数组:
        InputStreamReader istt=new InputStreamReader( new I'ileIn-
    putStream(" g\sty. txt")):
        IiufferedReader btt=new hufferedReader(istt):
        String」uniout= new String「 2」:
        int.」「」uniint= new into 2}「lob:
    for( int j= 0; j< 2; j++)
              {
        uniout} j}=btt. readLine():
        for( int d= 0; d< unistr. length; d++)
            {
          iF( uniout} j}.equals( unistr} d}))
              {
            ttniint} j}=sting cl}:
              }
            }
        在前文中处理得到的义原与层数的对应关系文件中查
    找两个词语的义原数组所对应的层数关系按照对应的关系
    赋子不同的参数后按照上文中的公式进行计算将结果存放
    在双精度型变录sim中
      while( IJverySim} simindex}!=0. 0)
    {
    for( int p1= 0; p1< simindex+ 1; p1++)
        {
      IJvery= IJvery* IJverySim} ply:
        }
    Sim} simindex}=betas simindex} * IJvery;
    simindex+=1:
    double SimRPSUIt= 0. 0:
    for( int vx= 0; vx< simindex; vx++
                {
    SimRPSUIt= SimRPSUIt+ Sim} vx}
      }
    System. out. println("The Sim of two words is:”+SimResult):
    }


    希望各位同仁,给出实例相似度和其他如结构相似度的计算方法


       收藏   分享  
    顶(2)
      




    ----------------------------------------------
    本体啊,我的出路

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/11/16 11:31:00
     
     GoogleAdSense天秤座1975-10-18
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/5/29 23:55:08

    本主题贴数9,分页: [1]

     *树形目录 (最近20个回帖) 顶端 
    主题:  公布基于wordnet的相似度计算算法的原代码!!(3032字) - gzfxxy1978,2007年11月16日
        回复:  楼主能不能把你的源代码发一份给我,希望可以拜读一下完整篇,非常感谢!hawoodho@sina...(87字) - hawood,2011年4月12日
        回复:  谢谢!!!(10字) - zhoucqucs,2011年1月3日
        回复:  lz给我发一份吧,谢谢了。ly_zgz@163.com(38字) - lyzgz,2010年12月19日
        回复:  楼主能不能把你的源代码发一份给我,万分感谢!Email: lyf200581105@163.co..(73字) - lyfsemanticweb,2010年9月7日
        回复:  知识共享的力量是伟大的!互相帮助的力量是伟大的!谢谢楼主!有空多交流!..(76字) - Avansky,2010年4月8日
        回复:  顶 !非常好的东东(17字) - wangdong123xyz,2009年9月19日
        回复:  那你有没有 计算的完整的代码 你是在什么环境下编的啊 可不可以把代码给我啊..(75字) - xiaohai5702,2009年4月21日
        回复:  多谢楼上了。但您的代码似乎又很多字符错误,比如“gh2312"应为”gb2312",还又str..(76字) - bzbc,2007年11月16日

    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    78.125ms