首页 | 年会特色 | 年会议题 | 参会代表 | 媒体合作| 历届回顾 | 在线报名 | 联系我们
时间地点:
时间:2007年4月10日
地点:北京·西苑饭店
论坛主题:

数据挖掘与信息整合

主办单位:
中国电子信息产业发展研究院
中国信息化推进联盟
承办单位:
赛迪顾问股份有限公司
中国信息化推进联盟BI专委会
支持媒体:
中国计算机报、中国计算机用户、
软件世界杂志、赛迪网
大会网站:
联系方式:
合作联系
北京海淀区紫竹院路66号赛迪大厦10层(100044)
合作联系人:王朝闻
电话:010-88558527
传真:010-88558539
手机:13522721680
邮件:wangcw@ccidconsulting.com
 
参会报名
北京海淀区紫竹院路66号赛迪大厦9层(100044)
联系人:樊娜 何扬
电  话:010-88558542 / 9924
传  真:010-88559026 / 9032
E-mail: huiyi@ccidconsulting.com
 
 活动报道
清华同方知网内容管理、搜索及知识挖掘技术

    

    非常高兴来到这个大会跟大家做数据管理的交流。

    首先介绍一下我们同方知网,我们同方知网专注于中国知识信息资源的大规模整合利用与相关核心技术研发,我们同方知网目前已经是全球最大的中文知识信息资源整合服务提供商。今天我们大会的主题也是信息的整合。实际上我们同方知网在上个世纪90年代的时候,一直致力于中国大规模的公益性信息的服务。目前我们同方知网也是中国最好的内容管理、全文检索、知识挖掘技术提供商。相对于国外的一些厂商,我们同方知网更加懂中文,相对于国内的厂商,我们更加懂内容。

    我们同方知网发展过程是中国国家知识基础设施工程,我们的目标是实现中国知识信息资源高度共享,但都是公益性的。

    我们的目标要实现全方位知识资源传播共享和增值性整合利用开发,我们这个项目从启动到现在一直得到了国家和社会高度支持,也取得了很多的成绩。

    这是我们03年的时候启动了《中国知识资源总库》大会的场景,是在人民大会堂启动的。我们同方知网在市场上得到了很好的验证,我们得到了用户的,社会的,国家的认可。同方知网在全球拥有6000多家机构用户,中国大陆96%的大专院校,85%的科研院所,80%的党政机关等都是我们的用户,并正在继续向各个行业延伸。美国的白宫,美国的国防部,美国的国会图书馆,兰德公司等等都是我们的用户,英国、欧洲也有我们的用户。

    我们同方知网拥有很多的优势,同方知网依托是清华大学科技、人才的优势,以及清华同方的产业优势,同方知网具有同类企业不可比拟的可持续发展的能力。我们同方知网目前有一个专门的知识传播工程技术研究院,拥有近200人的专业IT队伍负责技术的研发。我们总编室拥有100多人的自身编辑和审读专家,对信息内容有着深刻的独特的理解。我们拥有专业的项目管理,工程实施,售后服务队伍,遍布了32个省市自治区,员工也有1300多人。这是我们一部分的荣誉,是国家科技重点产品等等,去年我们也推动了国家重大文化产业推进项目,国家知识资源数据库技术子项目,也得到的专家的验收。

    前面是我们同方知网一个简单的介绍,下面从另外一个层面展现我们的同方知网。

    我们是拥有完备的产品体系和全面解决方案,同时具有丰富的工程实施经验和众多成功的案例。在这里我和大家分享一下。

    在讲这个东西之前,今天我们这个大会的主题是信息整合,为什么要有这个问题呢?从90年代以后,以数字化资源建设为基础,以网络化信息服务为手段,大范围信息资源开发利用工作全民展开,取得很好的成果,用户日益依赖于数字化资源和网络化的服务,现在我相信在座的各位都有体会。信息资源正在发生革命性的变化。

    但是这种爆炸性增长的信息资源给用户带来很大的压力,迫切需要有序化、规范化的管理。

    这是我们产品体系的架构,从最底层的数据,再到技术,再到上面,涵盖了全方位的。

    我再介绍一下KBase全文数据库管理系统,这是以管理海量非结构化数据为主,具有高校全文检索性能,可用于构筑企业级搜索应用,特点如下:

    全文检索,性能国际上遥遥领先,达到500G/S。
    相似检索,性能达到惊人的百万文献毫秒级响应,业界第一,完全实用化。
    数据库检索网关,与DBMS无缝集成,全文检索与实务处理有机统一。
    大百科式概念关系辞典,500万词条,涵盖所有学科专业词汇的知识库,这是国内国外任何一个厂商都不具备的。还有海量非结构化数据管理。

    KBase典型应用。中国知识基础设施工程,管理着目前全球最大的中文知识信息资源库,文献信息总量达到5000多万篇,日检索千万人次,年下载文献量10亿余篇。中共中央办公厅,国家发改委、中纪委等等都是我们的用户。

    我们有同类企业无可比拟的优势,我们做自动分类也好,自动据类也好,首先我们要有真实的语料,我们有五千多万的标引规范的真实语料,拥有百万级的大百科式概念关系辞典。

    我们的典型应用,就是CNKI知网节,读者推荐文献,相似文献,检索词联想,引用文献等,有效消除信息孤岛,构筑知识网络,实现资源整体增值。CHKD医学主题词自动标引和智能检索系统,填补国内空白。基于超大分类体系,面向真实语境的实用化自动分类体系系统。

    另外我们也用到一些网络信息分析采集,做网络不良信息内容分析,如果你发现现在互联网一些博客、论坛,比以前有好转的话,这是我们的贡献,这也得到了中央领导的好评。

    这是我们知网节的推荐文献,这个是智能分析两篇文章有什么差别。还有基于内容实时相似性的分析。这个是文献自动分析和动态链接。还有基于概念关系辞典的相关检索词联想。这是我们在自动定位的展示,还有动态摘要的展示。另外对知识的发现和挖掘,对信息内容本身挖掘的功能,还有展示功能。知识挖掘的定义是什么,我们全部展现出来。

    这是网络采集的系统,这个采集系统根据用户的需求,跟踪采集特定范围,特定主题或类型的互联网信息,建立可再利用的信息服务系统。最大的特点就是基于智能代理技术,集成多种自动分类算法,能从信息海洋中准确的找到你需要的信息。

    应用领域与典型案例,我们这个系统应用在企业搜索和互联网搜索引擎,基于KBase全文检索,实现集数据库搜索和互联网或内网搜索为一体的搜索引擎服务,如中电集团某涉密项目等等,网络信息资源整合利用,对互联网上的无须,实时信息进行分类,整理等等,如国家图书馆专题存档项目也是我们的做的。网络不良信息内容过滤监控,对互联网的海量信息的过滤、分析等等。我们也协助了很多大案要案的破获。这是国家图书馆资源门户存档项目。

     我们信息资源建设与管理系统应用范围也很广,可以把一切电子资源,文档、图片、音频、视频,原有数据等等全部整合到我们的系统里面。部分典型案例,包括国家发改委金宏工程经济文献共享数据库,它把与国家经济相关的政策法规,经济信息都整合出来,提供给宏观经济的决策。还有中电集团文献信息系统,还有卫生部中国卫生政策知识管理项目等等。用户之所以选择,也是基于我们的技术实力,我们的口碑。这是一些简单应用案例,这是金宏的项目。
    因为时间关系,我做一个总结,信息资源建设发展到今天,成效显著,但也遇到了一个很大的门槛,就是资源整合,各个单位有很多的资源,但是这些资源都是分散的,无须的,很难统一管理,我认为我们不解决这个问题,很难再上一个台阶。

    加快本单位信息资源的数字化程度,实现与社会信息资源优势互补,加强自身信息资源的组织和深层次的整合开发利用,是下一步工作的重点。

    我们同方知网多年来和广泛用户亦师亦友。同方知网作为信息服务行业的领军企业,我们始终以提升全社会的信息服务水平为已任,紧密追随并不断挑战国际最领先的技术和理念,想用户及所用,急用户之所急。

 历届回顾
·2003年(第一届)中国数据管理技术年会
·2004年(第二届)中国数据管理技术应用年会
·2005年(第三届)中国数据管理技术应用年会
·2006(第四届)中国数据管理技术应用年

首页 | 年会特色 | 年会议题 | 参会代表 | 媒体合作| 历届回顾 | 在线报名 | 联系我们
赛迪顾问股份有限公司版权所有 copyright 2006,All Rights Reserved