i社区用户: 密码:
搜索:
首页| 资讯| 信息化| 产品| 专题| 创业| 技术天地| 企业中心| 企业论坛| 职场| 周报全文| 商城| 市场
会展| Blog| i社区| 社区联盟| RSS| 电子杂志| 发行| 直播| IT两会| i| 下载| 上网导航| CIO俱乐部
 
智能计算: 变数据为情报
 
 
(计算机世界报 2007年10月29日第41期 B3) 2007-10-28 13:07:14
 
   
 

在急速增加的互联网信息中,快速、准确地寻找信息,并将其提升为有价值的情报需要智能计算。

在互联网时代,用户对信息的需求已经发生了很大变化,人们大多借助百度和Google这样的搜索引擎来搜寻自己所需要的信息。但随着互联网信息量爆炸式的增长和个性化需求的增强,人们强烈需要在互联网中筛选出符合自己需求的精确信息,尤其是政府和企业等用户,更希望在搜索引擎的基础上进行深入的需求发掘,能够将信息升级为情报。

“智能计算在自然语言方面的处理就是帮助解决这一问题的。”海量信息技术有限公司副总裁兼首席科学家周富秋博士介绍说,在互联网信息挖掘中,智能计算是计算机利用存储与统计等特长模拟出人类智能效果的技术,通过一系列针对互联网数据的采集、分析、筛选、萃取等智能化技术手段,运用语义分析、数据挖掘、模式识别等一系列技术,从非结构化数据到结构化数据、从字符到语义,再进行海量计算后,将原始无序的数据转化成容易理解、价值较高的信息,进而再提炼出有价值的情报,供做决策依据。

对于信息情报方面的智能计算技术,周富秋做了进一步的解释,互联网拥有大量的数据和信息,目前主要采用了浅度智能自然语言处理技术(NPL Shallow),通过这种方式提取出来的内容是数据和信息,Google和百度等提供的搜索引擎就是这样实现的。

要想在数据和信息的基础上进行精加工,进而生产出精华——情报,需要采用一种叫做深度智能自然语言处理的技术(NPL Deep)。该技术建立在自然语言处理(Nature Language Process,NPL)的基础上,建立语料库,进行分类,然后建立规则表和词表。通过人工筛选出庞大语料库,按照事先设计的算法,对海量数据进行识别,从中找到对用户有用的信息和情报。

在搜索的过程中,比如输入“城管”这个词作为关键词,传统搜索结果会出现大量与“城管”相关的资料或新闻;如果输入“城管”和“评价”两个关键词,传统搜索结果会出现大量与“城管”及“评价”相关的信息,但远不能满足用户的需求。新的智能搜索用“城管”和“评价”做关键词,搜索结果将会根据对城管评价的内容和结果进行分类显示,例如会显示:城管评价超级不满意共10万条信息,城管评价不满意共5万条信息。当你点击这些信息时,将会把下面的详细信息列出。通过这种搜索,你不仅可以知道对城管评价的相关详细信息,而且能够进行分类和统计,起到了将信息升级为初级情报的效果。

实现上述功能的关键是应用了自动分词技术。中文分词技术的滞后是当前中文信息自动化处理技术发展的瓶颈,词是能独立活动的有意义的最小语言单位,分词是中文信息处理从字符处理水平发展到语义处理水平的关键,是中文智能计算技术的基础。周富秋认为,他们研究的智能分词技术及基于其上的搜索引擎技术、信息检索与过滤、自动分类和聚类等智能计算技术,目前已在中文智能分词方面取得突破性进展,分词准确率达到99.6%以上,智能计算将信息升级为情报是未来应用的主要方向。(邓健)

 
   
   
 全文检索
检索词
 作者检索
 按期查询
 专刊查询
 点击排行
工信部电信设施共享节约2...
2008胡润百富榜富豪数首...
解密李一男为何潜伏华为...
计世独家:SanDisk,别...
独家:SSD固态盘预装PC...
小灵通频率将用于支持TD-...
雅虎CEO杨致远让位 11月...
中移动直面TD 谈挑战及...
韩国网游玩家出视频污蔑...
中兴力挺C网 专为小灵通...
  发表评论  您的姓名   您的Email   发布  
   


周报全文频道联系方式:010-68130909
【关于我们】  【广告服务】  【周报发行】  【投稿指南】  【投稿声明】  【联系方式】  【法律声明】
  【媒体手册】  【编读往来】  
Copyright© ccw.com.cn,All rights reserved
中国计算机世界出版服务公司版权所有