新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 搜索引擎, 信息分类与检索, 语义搜索, Lucene, Nutch, GRUB, Larbin, Weka
    [返回] 中文XML论坛 - 专业的XML技术讨论区计算机技术与应用『 Web挖掘技术 』 → Web 文本挖掘技术研究 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 43221 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: Web 文本挖掘技术研究 举报  打印  推荐  IE收藏夹 
       本主题类别: 信息检索    
     wuchenlu 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:5
      积分:104
      门派:XML.ORG.CN
      注册:2006/5/30

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给wuchenlu发送一个短消息 把wuchenlu加入好友 查看wuchenlu的个人资料 搜索wuchenlu在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看wuchenlu的博客楼主
    发贴心情 Web 文本挖掘技术研究


    摘 要 作为从浩瀚的W eb 信息资源中发现潜在的、有价值知识的一种有效技术,W eb 挖掘正悄然兴起, 倍受关注. 目前,W eb 挖掘的研究正处于发展阶段, 尚无统一的结论, 需要国内外学者在理论上开展更多的讨论. 同时,W eb 挖掘系统的开发对其研究也将起到很大推进作用. 首先探讨了W eb 挖掘的有关理论, 从W eb 挖掘的定义、W eb 挖掘与W eb 信息检索的关系、W eb 挖掘任务的分类与功能等方面加以阐述. 然后重点分析了W eb 文本挖掘的方法, 包括: 文本的特征表示、文本分类与文本聚类. 在此基础上简单介绍了一个W eb 文本挖掘系统原型WebMiner. W ebM iner 采用了多agent 体系结构, 将多维文本分析与文本挖掘这两种技术有机地结合起来, 以帮助用户快速、有效地挖掘W eb 上的HTML 文档.
    关键词 W eb 挖掘, 文本挖掘, 文本分类, 文本聚类, 多维文本分析



       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/6/5 10:28:00
     
     wuchenlu 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:5
      积分:104
      门派:XML.ORG.CN
      注册:2006/5/30

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给wuchenlu发送一个短消息 把wuchenlu加入好友 查看wuchenlu的个人资料 搜索wuchenlu在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看wuchenlu的博客2
    发贴心情 
    2000年的有点早了
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/6/5 10:29:00
     
     liangchenshell 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:5
      积分:77
      门派:XML.ORG.CN
      注册:2006/4/4

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给liangchenshell发送一个短消息 把liangchenshell加入好友 查看liangchenshell的个人资料 搜索liangchenshell在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看liangchenshell的博客3
    发贴心情 
    太早了,还是非常感谢
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/7/27 9:53:00
     
     eviltear 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:13
      积分:114
      门派:XML.ORG.CN
      注册:2006/4/6

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给eviltear发送一个短消息 把eviltear加入好友 查看eviltear的个人资料 搜索eviltear在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看eviltear的博客4
    发贴心情 
    知识普及了
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/10/10 17:45:00
     
     suiyun0234 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:20
      积分:180
      门派:XML.ORG.CN
      注册:2006/8/20

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给suiyun0234发送一个短消息 把suiyun0234加入好友 查看suiyun0234的个人资料 搜索suiyun0234在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看suiyun0234的博客5
    发贴心情 
    赫赫,多谢楼主,不用筛选了
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/11/29 14:14:00
     
     侬侬 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:5
      积分:78
      门派:XML.ORG.CN
      注册:2007/8/6

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给侬侬发送一个短消息 把侬侬加入好友 查看侬侬的个人资料 搜索侬侬在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看侬侬的博客6
    发贴心情 
    我有一个问题想请教大家:我现在想选一个方向写论文,但是我的计算机基础很差(因为我是半路出家的),你们觉的我写哪方面的比较容易呢?哪方面的理论性较强一点呢?
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/8/6 11:17:00
     
     DMman 帅哥哟,离线,有人找我吗?魔羯座1984-1-11
      
      
      威望:1
      头衔:数据挖掘青年
      等级:研二(Pi-Calculus看得一头雾水)(版主)
      文章:803
      积分:5806
      门派:W3CHINA.ORG
      注册:2007/4/9

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给DMman发送一个短消息 把DMman加入好友 查看DMman的个人资料 搜索DMman在『 Web挖掘技术 』 的所有贴子 点击这里发送电邮给DMman 访问DMman的主页 引用回复这个贴子 回复这个贴子 查看DMman的博客7
    发贴心情 
    以下是引用侬侬在2007-8-6 11:17:00的发言:
    我有一个问题想请教大家:我现在想选一个方向写论文,但是我的计算机基础很差(因为我是半路出家的),你们觉的我写哪方面的比较容易呢?哪方面的理论性较强一点呢?


    觉得您先了解一下可能的方向吧 看看哪个更有兴趣。。。

    ----------------------------------------------
    数据挖掘青年 http://blogger.org.cn/blog/blog.asp?name=DMman
    纪录片之家 (很多纪录片下载)http://www.jlpzj.com/?fromuid=137653

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/8/6 21:23:00
     
     chairmanwei 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:29
      积分:185
      门派:XML.ORG.CN
      注册:2007/8/19

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给chairmanwei发送一个短消息 把chairmanwei加入好友 查看chairmanwei的个人资料 搜索chairmanwei在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看chairmanwei的博客8
    发贴心情 
    学习ing。。。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/8/19 9:50:00
     
     BlueSky_DM 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:3
      积分:86
      门派:XML.ORG.CN
      注册:2007/8/31

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给BlueSky_DM发送一个短消息 把BlueSky_DM加入好友 查看BlueSky_DM的个人资料 搜索BlueSky_DM在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看BlueSky_DM的博客9
    发贴心情 
    呵呵,这个网站上介绍的文章比较多,不错的。
    关于Web信息提取的综述的文章,比较旧了:
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/8/31 15:51:00
     
     BlueSky_DM 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:3
      积分:86
      门派:XML.ORG.CN
      注册:2007/8/31

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给BlueSky_DM发送一个短消息 把BlueSky_DM加入好友 查看BlueSky_DM的个人资料 搜索BlueSky_DM在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看BlueSky_DM的博客10
    发贴心情 
    A Brief Survey of Web Data Extraction Tools.pdf
    http://homepages.dcc.ufmg.br/~berthier/books_journal_papers/sigmod_record_2002.pdf

    http://www.fullsearcher.com/n200511171744735.asp
    网上信息抽取技术纵览
    http://www.fullsearcher.com/down/InformationExtraction/1.doc

    最近开题中,狂读了100多篇提取相关的文章。

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/8/31 15:56:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Web挖掘技术 』 的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/4/27 7:09:20

    本主题贴数12,分页: [1] [2]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    1,296.875ms