大数据分析与应用

主要开展大数据分析、机器学习、数据挖掘、个性化推荐等方向的研究工作。研究室现有教授1人、大师讲席教授1人、副教授3人。其中,陈恩红教授主要从事数据分析与挖掘等方向研究工作。熊辉教授主要研究领域为数据挖掘、商业智能、地理信息系统(GIS)等。刘贵全副教授,主要研究领域为多agent系统,机器学习,网络安全。徐林莉副教授,主要研究方向为机器学习。刘淇副教授,主要研究领域为数据挖掘与知识发现、机器学习方法及其应用。

研究室承担了多项国家自然科学基金项目、863计划课题、国家科技支撑计划、国家科技重大专项课题、教育部博士点基金项目等应用基础研究课题,并与包括百度、腾讯、阿里巴巴、诺基亚、华为、讯飞等在内的众多企业和研究机构开展合作,致力于科研成果在产业界的转化。

研究室重视人才培养质量提高,培养毕业的研究生中,曾获得“中国计算机学会(CCF)优秀博士学位论文奖”、“中国科学院优秀博士学位论文奖”、人工智能学会优秀博士学位论文奖、“微软学者奖”、“中国科学院院长特别奖”、“博士生国家奖学金”等多个重要奖项。


学术带头人

头像
陈恩红

1968年7月生,中国科学技术大学教授,博导,CCF会士,IEEE 高级会员(Senior Member)。从事机器学习与数据挖掘、社会网络、个性化推荐等方向的研究。1996年获中国科学技术大学计算机软件专业博士学位。2005年入选教育部新世纪优秀人才支持计划。2013年获国家杰出青年科学基金。2016年作为团队负责人入选科技部重点领域创新团队。2018年入选“万人计划”科技创新领军人才。

现任计算机科学与技术学院副院长、中国计算机学会(CCF)理事、CCF大数据专家委员会副主任、CCF人工智能与模式识别专委会委员、安徽省计算机学会理事长、安徽省大数据应用协同创新中心主任、大数据分析及应用安徽省重点实验室负责人等。2011年,发起创建了YOCSEF合肥分论坛并担任首任主席。担任国际期刊IEEE TSMC:System、 WWW Journal副主编,中国计算机学会通讯“推荐技术与互联网广告”专题的特约编辑,是KDD2012-2016、ICDM2013-2016、SDM2013-2016、IJCAI、PAKDD、AAAI等40多个国际学术会议的程序委员会委员,是CNCC 2015、CCF BigData 2015、CCDM 2014、NDBC 2012、KDD2012ContextDDWorkshop程序委员会主席。

承担了国家杰出青年科学基金、国家自然科学基金重点项目、863计划、国家科技支撑计划、国家科技重大专项、教育部博士点基金项目,以及与讯飞、阿里巴巴、诺基亚、华为合作项目等共计20多项。近五年,在Nature Communications、IEEE Transactions、ACM Transactions、KAIS、Information Science、Theoretical Computer Science和数据挖掘领域重要国际学术会议KDD、IJCAI、WWW、SIGIR、AAAI、ICDM、NIPS、ECML-PKDD、CIKM等发表学术论文150余篇。

师资队伍

头像
熊辉

大师讲席教授。担任美国罗格斯-新泽西州立大学罗格斯商学院管理科学与信息系统系副系主任、罗格斯大学信息安全中心主任、正教授 (终身教授)、RBS院长讲席教授,博士生导师,并担中国科学技术大学大师讲席教授。2014年被选为ACM杰出科学家。2018年加盟百度研究院。熊辉教授目前的研究领域是数据与知识工程,重点为新兴的数据型应用发展提供有效且高效的数据分析技术。

头像
刘贵全

博士,副教授。中国人工智能学会人工智能基础专业委员会委员、机器学习专业委员会委员。主要研究方向:机器学习,智能信息处理与挖掘,互联网信息抽取及深度搜索与挖掘。作为项目主要成员,参与过包括国家自然科学基金、863、973计划等多个项目。作为项目负责人,承担了10余项科研项目,其中包括1项国家自然科学基金项目、2项863计划项目。在国际学术会议及期刊中发表论文三十余篇。

头像
徐林莉

博士,副教授。主要研究方向:机器学习(Machine Learning),数据挖掘(Data Mining)。研究着重于从复杂的数据中学习有价值的信息,利用数学建模发展相应的算法。研究课题包括各种聚类(Clustering)算法、非监督学习(Unsupervised Learning)以及半监督学习(Semi-supervised Learning)、多任务学习(Multi-task Learning)、多标签分类(Multi-label Classification)、支持向量机(Support Vector Machines)及其相关的扩展、凸优化算法(Convex Programming)在机器学习中的应用等。承担了国家自然科学基金项目两项。在国际顶级学术会议及期刊中发表论文三十余篇,累计被引用超过700次。


头像
刘淇

博士,副教授。主要研究方向为数据挖掘与知识发现,着重于针对用户行为数据(如消费数据、社交数据、教育数据)的建模和应用研究。在重要国际学术会议和期刊共发表论文40余篇,2011年获得数据挖掘领域顶级国际会议之一IEEE ICDM的最佳研究论文奖,2012年获中科院院长特别奖和首届博士生国家奖学金,2014年获中科院优秀博士学位论文奖。申请发明专利7项。目前主持国家自然基金(青年)项目、安徽省自然科学基金(青年)项目、中央高校基本科研基金项目、科大讯飞合作研究项目以及中科院青年创新促进会会员专项。多次参与国际会议组织工作,担任CCF BigData2015宣传主席、ICDM 2015 MobileDM workshop共同主席,是包括IJCAI2015、KDD2016等20余个国际会议的程序委员会委员以及国际期刊IEEE TKDE、TC、TSMC-C等的审稿人。


头像
马建辉

讲师。主要研究方向为智能计算,人工免疫,网络安全,大数据分析等。担任中国计算机学会大学生计算机系统与程序设计竞赛专家委员会委员、安徽省大学生程序设计竞赛技术委员会副主任。

主要科研项目

    • 基于大数据的微反应情感分析仪器,国家重大科研仪器研制项目,2018/1-2022/12;

    • 网络大数据协同建模与序列分析的理论和方法研究,国家自然科学基金,2017/1-2020/12;

    • 基于情境感知的知识导航,国家重点研发计划,2016/7-2020/12;

    • 情境数据挖掘及应用,国家杰出青年科学基金,2014.1-2017.12;

    • 面向社交网络的信息传播规律及用户行为研究,863计划,2014.1-2016.12;

    • 基于社会网络的舆情分析关键技术研究,教育部高等学校博士点基金,2012.1-2014.12;

    • 数据的非监督/半监督学习问题研究及应用,国家自然科学基金,2011.1-2013.12;

    • 基于云计算的国家金融数据分析与信息服务关键技术与应用,国家科技支撑计划(新华社、中科大等联合申请),2012-2015;

    • Web社会网络的理论与技术,国家自然科学基金重点项目(清华大学、中科大联合申请),2010.1-2013.12;

    • 面向移动用户个性化服务的情境数据挖掘方法及应用研究,国家自然科学基金,2011.1-2013.12;

    • 面向XML数据语义检索的关键技术研究与应用,863计划,2008.1-2010.12;

    • 论文共享网站的个性化服务研究,教育部科技发展中心专项,2008.1-2008.12;Data mining approach for mobile personalized context modeling and discovery等4项,Nokia合作项目,2009-2012;

    • 阿里巴巴个性化推荐算法研发等5项,阿里巴巴合作项目,2010-2013。

主要成就

    首次提出了情境感知的查询建议方法,成果发表国际顶级会议KDD2008,并获当年度唯一的最佳应用论文奖。首次提出了Maximum Margin Clustering思想,于NIPS发表以后引起较广泛关注,于2009在ICML发表的“Optimal Reverse Prediction: A Unified Perspective on Supervised, Unsupervised and Semi-supervised Learning”获得最佳论文优秀奖。

    首次提出个性化旅游套餐服务推荐方法,成果分别发表在IEEE Transactions on KDE、SMC-B,及数据挖掘顶级国际学术会议ICDM2011,并获得当年度唯一的最佳研究论文奖。


论文及专利获奖情况

    近5年来,该方向已在国际期刊和重要国际会议上发表一批高水平论文,其中在Nature Communications, IEEE Trans. on KDE,IEEE Trans. on SMC-B,IEEE Trans. on MC, IEEE Trans. on Web, ACM Trans. on IST,ACM Trans. on IS、KAIS,Information Science, Theoretical Computer Science等国际期刊,以及KDD、IJCAI、SIGIR、ICML、NIPS、AAAI、ICDM、WWW、ECML-PKDD、CIKM、ICPR等顶级或知名国际会议发表论文150余篇。

    数据挖掘顶级会议ACM SIGKDD2008论文获“最佳应用论文奖”、机器学习顶级会议ICML2009论文获“最佳论文优秀奖”、IEEE ICDM2011论文获“最佳研究论文奖”、SDM 2015论文获“最佳论文候选奖”、KSEM 2011最佳学生论文奖、U-media2010最佳论文奖、中国机器学习会议(CCML2013)优秀学生论文奖。该方向已申请国内、国际专利10余项,已获授权专利5项(对移动设备用户进行个性化新闻推荐的方法和装置、基于网络结构的用户兴趣漂移检测方法及系统、文本分类方法、一种基于自回归模型的在线连载内容流行度预测方法等)。


人才培养情况

研究室重视人才培养质量提高,积极为研究生提供多途径实习、合作培养等的机会。研究室已培养毕业一批优秀博士生和硕士生,有的就职于国内外知名IT企业,如谷歌、微软、百度、阿里巴巴、讯飞、三星、惠普等,有的在高校做博士后研究或任教,如新加坡国立大学、中国科学技术大学、东南大学、合肥工业大学、安徽大学等,或出国深造。

培养的研究生中,有我校计算机学科首位“中国计算机学会优秀博士论文奖”获得者、2人获中国科学院优秀博士学位论文奖、2人获得“微软学者”奖、1人获得安徽省优秀硕士学位论文奖、2人获中国科学院院长特别奖、6人获中国科学院院长优秀奖,若干人获博士生国家奖学金、以及全国大学生数据挖掘邀请赛一等奖1项。以博士生为第一作者的论文中,曾获得KDD2008最佳应用论文奖、ICDM2011最佳研究论文奖、SDM2015最佳论文候选奖等多项主流国际会议的论文奖。