|
||||
第四届知识发现与数据挖掘国际学术大会(KDD-98)简介 |
|
凌晓峰(Charles Ling)University of Westem Ontario,Canada 第四届知识发现与数据挖掘国际学术大会(The Fourth International Conference on Knowledge Discovery and Data Mining)于1998年8月27~31日在美国纽约举行。与 会代表700多人,是KDD历年国际会议最大的一次。 KDD国际会议的历史和发展 KDD国际会议的前身是KDD专题讨论会(Workshop),与会代表均是应邀出席。随着KDD 在学术界和工业界的影响越来越大,KDD组委会于1995年把专题讨论会更名为国际会议,并 改为大会代表自愿报名参加。1995年,在加拿大蒙特利尔市召开了第一次KDD国际学术会 议,以后每年召开一次,今年是第四届。近年来,KDD在研究和应用方面发展迅速,尤其是在 商业、银行领域的应用更为迅速,比研究的发展速度还要快。 1997年的KDD国际会议,有162篇学术文章投稿,而今年KDD国际会议却有250篇学术文 章投稿;参加会议人数由去年的500多人增加为今年的700多人。 大会议程纵观 1. 8个专题介绍会(Tutorials) 这8个专题介绍会主要介绍KDD领域中基础的和最新的发展动态。每个介绍会历时2小 时,受到全体与会代表的一致热烈欢迎。8个专题是: ·数据库方法用于数据挖掘(Database methods for Data Mining); ·数据缩减(Data Reduction); ·高性能数据挖掘(High performance Data Mining); ·察觉和发现商业性欺骗(Fraud Detection and Discovery); ·新非参数回归法(New-Wave Nonparametric Regression Methods for KDD); ·用于数据挖掘的平稳法(Smoothing Methods for Learning from Data); ·知识发现与数据挖掘的评估(Evaluation KDD); ·先进数据挖掘工具的比较(A comparison of Leading Data Mining Tools)。 2. 18篇学术文章在大会上宣读 本届组委会从250篇投稿中精选出18篇在大会上宣读,录取率仅为6%。组委会再从这 18篇里评选出2篇最佳学术文章:一篇是理论研究方面,另一篇是应用方面。 由此可见大 会追求高水平和高质量。 3. 49篇海报学术文章 大会又选出49篇宣读文章以海报形式(poster)使作者同代表进行面对面的畅通交流 。18篇学术文章和49篇海报学术文章收入大会文章集(Proceedings),由AAAI出版。 4. 2位特邀权威人士作报告 题目是: ·万维网上的数据挖掘; ·股票市场上的数据挖掘。 5. 3个专题小组公开讨论会(Panel Discussion) 专题小组由小组主席、几位成员组成,他们就当前KDD存在的争议问题发表自己的观 点,很多观点截然不同,甚至相反。成员之间进行激烈的辩论,在座的听众也踊跃提问题。 通过这种小组公开辩论有助于了解当前KDD现存的争议问题。三个专题公开讨论会题目是 ·数据库与数据挖掘之间的关系; ·数据挖掘对个人隐私有何影响和作用; ·幕后的数据挖掘。 6. KDD软件展览(Exhibit/Demos) 30多个软件公司和研究单位向与会者展览他们的KDD软件新成品。通过展览,可以看 到数据挖掘在北美、欧洲等国家的发展非常迅速,KDD的不少软件已形成系统,并走向成熟 。来参加大会的不少商业、银行纷纷就软件功能、价格等问题与软件公司进行商议。 7. 3个特别报告会(Exhibit Talk) KDD组委会还组织了3个特别报告会,主要是邀请软件公司的代表介绍他们在制作KDD 软件系统过程中的经验,受到与会代表的普遍欢迎。 8. KDD-98杯竞赛 此次竞赛是KDD大会的第二次,其主要内容是关于数据值的预测,哪位参赛选手预测得 最佳,便是竞赛杯的得主。 具体来说:一家非盈利公司拥有一个很庞大的数据库,是关于十几万美国人的个人资 料。这家公司寄信给这十几万人要求他们募捐,其中一部分顾客回了函,捐了款。但大部 分人并未回函、捐款。这些个人资料和捐款数额组成一个很大的数据库,再随机地分成两 部分,一部分作为训练数据(training set),用数据挖掘法从中寻找出捐款人的规律,分析 哪些人可能捐款,及其可能捐款的数额;另一部分数据作为测试数据(testing set), 但实 际捐款的数额已从中去掉, 让参赛单位或选手用其软件来预测未给的捐款数额。哪位选 手的预测捐款数额与实际捐款数额最为贴近,那么这位选手将是此次KDD-98杯的得主。组 委会从参赛的21个单位评选出前三名: 第一名是:Urban Science Applications Inc. 软件为:GainSmart; 第二名是:SAS Institute Inc. 软件为:Enterprise Miner; 第三名是:Quadstone Limited,软件为:DecisionHouse。 9. 3个专题讨论会(Workshops)。 主要是集中在某些专门领域对KDD的研究和应用进行更深入的讨论。 ·数据挖掘在金融经济中的应用(Data Mining in Finance); ·分部式数据挖掘 (Distributed Data Mining); ·数据挖掘在商业领域成功的关键(Keys to the Commercial Success of Data)。 本届大会的几个特点 1. 半数以上的与会者是来自工业、商业、银行、金融、公司等,由此表明人们对KD D在工业、商业上的应用越来越重视;大会的日程安排也与工业、 商业的应用紧密结合, 如:举办KDD软件展览;请软件公司的代表阐述他们对KDD的认识,等等。 2. KDD-98注重提高大会的质量,对投稿学术文章进行严格筛选,邀请在KDD领域里有 名望的权威人士作学术报告等。 3. KDD-98组委会给予与会代表充分的时间和场所进行学术上的互相交流与切磋。 KDD的发展趋势 1. 研究方面 ·KDD研究有新的进一步发展,如:近年来注重对Bayes(贝叶斯)方法以及Boosting方 法的研究和提高; ·传统的统计学回归法在KDD中的应用; ·KDD与数据库的紧密结合。 2. 应用方面 ·KDD商业软件工具不断产生、不断完善; ·KDD的应用系统注重建立解决问题的整体系统,而不是孤立的过程; ·KDD软件工具的价格较昂贵。大型的KDD软件售价为十几万美元,大多数小型的软件 工具也要在几万美元。KDD的用户主要是大型银行、保险公司、电讯公司和销售业。 参加KDD-98大会中国大陆的学者 来自大陆的中国学者,目前在海外从事KDD研究的人数逐渐增加,且在这个领域发挥着 骨干作用。此次KDD-98大会共有20多位中国学者参加,他们有的学术文章在大会上宣读或 者展出,有的研究成果在大会上展览。现重点介绍几位主要人物: 第一位是韩家炜教授,加拿大Simon Fraser 大学计算机系的正教授,智能数据库研究 系统实验室主任。韩教授在数据挖掘和数据仓库(Data Warehouse)、空间关系数据库(S patial Database)、推理数据库(Detection Database)、 多媒体数据库(Multi-media Database)等方面做了很多工作,取得了很大成就。曾在学术杂志、大会上发表过100多篇 学术文章。他带领学生组建了DB Miner——一个数据挖掘综合系统,并在此次 KDD-98大 会上展览。 韩教授的电子邮件地址:han@cs.sfu.ca URL:http://www.cs.sfu.ca/~han。 第二位是王晖,现为北爱尔兰阿尔斯特大学(University of Ulster)的讲师(相当于 北美的助理教授)。他主要致力于数据归约和缩减的研究,即把很大的数据库缩小之后再 进行知识的挖掘。他的研究工作基于格子机理论(Lattice Machine)。他开发出一个系统 DR(Data Reduction)并在此次KDD-98大会上展出。他的学术文章以海报形式在大会上展 出。 王晖的电子邮件地址:h.wang@ulst.ac.uk。 第三位是刘兵,现为新加坡国立大学(National University of Singapore)计算机系 高级讲师(相当于北美的副教授)。他主要研究分类学习(Classification)和相关规则学 习(Learning association rules)的结合,以及数据挖掘中有用性规则的产生。在此次K DD-98大会上展出他的研究产品。他有两篇学术文章在大会上宣读。 刘兵的电子邮件地址:liub@comp.nus.edu.sg URL: http://www.comp.nus.edu.sg/ ~liub。 本人凌晓峰,现为加拿大的西安大略大学计算机科学系副教授,自1989年由滨西法尼 亚大学获得博士学位后一直从事机器学习和认知科学方面的研究。近几年又开始对数据 挖掘进行研究和开发,并为加拿大一些大银行、保险公司做开发和咨询工作,开发的结果 在KDD-98大会上宣读,题目是:数据挖掘在直接销售中的应用(Data Mining for Direct Marketing)。今年夏天,我应邀为国家863专家组在沈阳举办的高科技人才培训班进行为 时一星期的关于数据挖掘的讲座。电子邮件地址:ling@csd.uwo.ca URL:http://www.c sd.uwo.ca/ faculty/ling。 KDD-99 KDD组委会宣布明年(1999年) 8月在美国加利福尼亚州的圣地亚哥市举行第五届KDD 国际学术会议。明年大会的赞助单位将由历年的美国人工智能协会(AAAI)改为美国的计 算机协会(ACM)。由于赞助单位变了,很可能大会在组织形式等方面将有所变化。对KDD感 兴趣者可从 http://www.kdnuggets.com中直接获取大量信息。 中国在KDD领域方面的发展情况 此次国际会议,中国只有一篇学术文章投稿,且遗憾的是,未被大会最后录取。据我所 知,不少研究单位在KDD领域有不少成果,但往往是和国外的接轨不紧,文章的语言表达不 佳,造成在国际高级学术杂志及大会上发表文章不多。有待于我们共同努力,有效地改变 这一现状。 值得一提的是,由中国科学院计算技术研究所的博士生朱廷劭最近开辟的一个中国K DD万维网主页KDD in China,里面介绍了中国在KDD方面的发展和动向,以及大量算法和源 程序(网址是http://kdd.yeah.net)。 |
周报全文频道联系方式:010-68130909 |
||||||
| 【关于我们】 【广告服务】 【周报发行】 【投稿指南】 【投稿声明】 【联系方式】 【法律声明】 【媒体手册】 【编读往来】 |
||||||
| Copyright© ccw.com.cn,All rights reserved | ||||||
| 中国计算机世界出版服务公司版权所有 | ||||||