余伟
44118太阳成城集团 人工智能系 大数据研究所 副教授 (硕导)
姓名:余伟
主页:
性别:男
职称:副教授 (硕导)
学历学位:博士
电话:
办公地点:B507
E-mail:yuwei ▇ whu.edu.cn 请手工替换符号
领域:Web搜索与挖掘,并行分布计算,大数据挖掘管理与分析,模式识别,人工智能,数据管理,数据库,数据挖掘与分析,信息检索,云计算与大数据处理,知识工程,智能计算,
招生信息:2019年度招收硕士5名,招收方向:计算机科学与技术(学硕),计算机技术(专硕)。 招收博士0名,招收方向:。
|
研究方向
长期以来从事云计算平台和大数据分析管理等方面的理论研究和应用开发。主要成果有异构数据存储处理平台、大数据可视化分析平台、推荐系统、深度学习系统、用户画像系统等,积累了丰富的平台技术、开发经验和理论方法。服务客户包括税务、审计、工商、教育、消防、综治、公安等众多政府部门和企事业单位,形成了自动报税系统、审计大数据平台、企业信息资源库、在线教育系统、智慧消防系统、网格化平台、水下模拟作战系统等产品。
研究方向:海量多源异质数据融合下的知识管理
多源异质数据融合
对Web上不同类型的多数据源进行融合, 建立了统一数据表示模型和分析框架。
数据可用性理论框架与数据质量度量体系
建立了Web数据可用性理论模型,实现跨源数据的不一致、缺失、错误等自动发现和修复,形成全维度的Web数据源质量度量体系,实现快速的质量评价和缺陷分析。
复杂数据关联网络的融合和转换
构造用户间多重社交关系、内容多维关联关系的复杂时态网络,实现无缺失的知识图谱体系。
工业级推荐系统研发
建立多维网络的知识传递概率网络图,实现多维度的信息推荐。再此基础上实现推荐系统的产业化,开发的代表性项目“改图网”,获得过全球创业技术挑战赛冠军。
教育背景
2002年9月-2006年6月 武汉理工大学,数学系,理学学士
2006年9月-2008年6月 44118太阳成城集团,44118太阳成城集团,工学硕士
2008年9月-2011年6月 44118太阳成城集团,44118太阳成城集团,工学博士
工作经验
2011年12月-2013年12月 44118太阳成城集团,数学与统计学院,博士后
2015年5月-2016年6月 美国SUNY Binghamton University, 计算机科学系,访问学者
2013年12月-至今 44118太阳成城集团,44118太阳成城集团,讲师
教授课程
面向对象软件工程、数据结构、数据库、云计算、大学生创新创业
发表论文
(1).Yu Wei, Li Shijun.(2018/10).Recommender systems based on multiple social networks correlation.FUTURE GENERATION COMPUTER SYSTEMS (SCI二区非TOP,影响因子: 4.639,他引次数:3,页码:312-317),第一作者
(2).Yu Wei, Li Shijun.(2019/01). An efficient top-k ranking method for service selection based on ε-ADMOPSO algorithm. Neural Computing and Applications (SCI二区非TOP,影响因子: 4.213,他引次数:0,页码:77–92),第一作者
(3).Jin Hong, Yu Wei*(2019/02). Graph regularized nonnegative matrix tri-factorization for overlapping community detection. PHYSICA A: STATISTICAL MECHANICS AND ITS APPLICATIONS (SCI三区,影响因子: 2.132,他引次数:0,页码:376-387),通讯作者
(4).Yu Wei , Zhang Yunlu, Gan Lin.(2014/09).Automatic Evaluation for Engineering Pathway Premier Award Winners.APPLIED MATHEMATICS & INFORMATION SCIENCES (SCI三区,影响因子: 1.232,他引次数:0,页码:2613-2626),第一作者
(5).Yu Wei ,Gan Lin, Yang Sha, Ding Yonggang , Jiang Pan, Wang Jun, Li Shijun.(2014/12).An improved LBP algorithm for texture and face classification.SIGNAL IMAGE AND VIDEO PROCESSING (SCI四区,影响因子: 1.643,他引次数:13,页码:155-161),第一作者
(6).Yu Wei, Li Shijun.(online publish). Research on financial data analysis based on data mining algorithm. Concurrency and computation: practice and experience (SCI四区,影响因子: 1.063,他引次数:0,页码:),第一作者
(7).Yu Wei1 , Li Shijun1 , Yang Sha1, 2 , Hu Yahui1, 3 , Liu Jing1 , Ding Yonggang1 ,Wang Qian1.(2015/02).Automatically discovering of inconsistency among cross-source data based on Web big data.Jisuanji Yanjiu yu Fazhan (EI源刊,影响因子: ,他引次数:,页码:295-308),第一作者
(8).Yu Wei1 , Gan Lin1 , Li Shijun1, Qin Yanxia1 , Wang Jun1, Wang Feng1 , Liu Jin1.(2013/11).Research on datacenters energy of big data environment.Energy Educ. Sct. Technol. Part A. Energy Sci. Res. (EI源刊,影响因子: ,他引次数:,页码:2227-2234),第一作者
(9).Yu Wei1 , Li Shijun1, Zhang Yunlu2 , Gan Lin1 , Wang Feng1, Wang, Jun1 , Wang, Kai1.(2013/12).Micro blog ranking for personalize recommendation.J. Comput. Inf. Syst. (EI源刊,影响因子: ,他引次数:,页码:8243-8250),第一作者
(10).Zhang Yunlu1, Yu Wei1*, Li Shijun1.(2013/11).What can we get from learning resource comments on engineering pathway.Lect. Notes Comput. Sci. (CCF C类会议,影响因子: ,他引次数:,页码:482-493),通讯作者
(11). WANG Feng1, YU Wei1*, LI ShiJuni1.(2013/12). Study of POI-s recommendation based on a PMR framework.SCIENTIA SINICA Informationis. (CSCD,影响因子: ,他引次数:,页码:1503-1520), 通讯作者
科研课题
(1).面向大数据可用性的Web跨源实体数据不一致自动发现研究,纵向科研项目,国家自然科学基金委,
(2).Web大数据环境下的数据一致性研究,纵向科研项目,湖北省自然科学基金委,
(3).面向过时信息自动发现的Web时态一致性研究,纵向科研项目,国家自然科学基金委,
(4) Web时间不一致建模与过时网页自动发现研究,纵向科研项目,博士后基金委,
(5).纵向科研项目,CSIC,
(6).数据软件技术服务,纵向科研项目,CSIC,
(7).标校软件,纵向科研项目,CSIC,
研究团队
知识产权
(1),微博平台上的关键传播路径和中心节点的探测方法,201310087938.7,发明专利,中国,2013-03
(2),一种基于能量函数的网页时间敏感性度量方法,201410160080.7,发明专利,中国,2017-01
(3),基于Web时态对象模型的过时网页信息自动发现方法,201210197587.0,发明专利,中国,2012-06
(3), 基于微博平台的用户可信度评估方法,201210197587.0,发明专利,中国,2015-09
(3), 微博平台上的僵尸用户探测方法,201210197587.0,发明专利,中国,2015-07
学术服务
CCF大数据专家委员会
KNOWLEDGE-BASED SYSTEMS、INFORMATION SCIENCES等10多个国际刊物、CCF会议审稿人
成果展示
(1) 湖北省武汉市地税大数据情报中心分析平台
与武汉市地税局合作建立了地税大数据情报中心平台。 通过构建基于税务领域本体的主题爬虫,爬取互联网涉税信息,包括:基础信息类、产业投资类、重点税源类、资产交易类、热点信息类和文化创意类;平台通过采集、融合分析涵盖内部税收信息、地方税费保障部门第三方信息、互联网涉税信息、最新税收理论期刊文献等广泛的税收情报资源,建立市局税收情报大数据。在该大数据中心的基础上,构建了税收风险模型库,以及基于该模型库的风险自动识别与推送引擎;实现了文献中心、期刊中心、数据中心、情报分析中心;实现了税收风险预警、风险应对处置;实现辅助决策、动态跟踪、课题研究、智库图书、信息发布、风险应对等功能。实现了面向全市地税系统干部提供大数据税收情报服务。
(2)湖北省审计大数据平台
与湖北省审计厅合作建立的审计大数据平台,通过融合审计对象在不同数据源中的不同结构的数据,包括审计报表、财务报表、互联网数据等非结构化和半结构化等数据。通过关联分析从异构的不同数据源中抽取频繁出现的模式,其目的是挖掘隐藏在数据间的相互关系。利用关联分析,审计人员可通过对被审计对象的跨源数据利用关联规则进行挖掘分析和融合,找出被审计对象中不同数据项之间的联系,从而发现存在异常联系的数据项,在此基础上通过进一步分析,发现审计疑点。实现了多个省级的专用审计云,包括财政审计云、审计结果分析云、地税审计云等审计云服务子系统,在全省推广应用。
(3)智能电网大数据分析平台
首次用大数据手段实现电力通信信息化管理过程中的数据质量提升、基于设备画像的扩展延伸、通信网优化辅助分析、业务可靠性评价、设备运行状态与外部因素探索分析等从系统架构、开放的多数据源、数据存储、分布式计算、数据挖掘等多个方面体现大数据特征,针对信息通信领域的业务应用构建智能电网通信大数据挖掘分析支撑平台。数据质量提升研究创新点在于通过机器学习提升系统数据质量,包括已有数据的异常发现及质量提升、数据录入的纠错及推荐,形成基于修改日志的提升数据质量的规则库。通信网优化辅助分析研究创新点在于充分利用内、外部积累的海量数据,运用大数据技术分析,提出通信网优化辅助分析的方法,包括内、外部数据的融合碰撞及关联规则分析,基于经验+历史数据的动态阈值算法。业务可靠性评价研究创新点在于评价业务对象、评价指标和评价手段的全面性、指标分析和权重确认算法的可靠性,提出基于业务路径推荐技术的算法及应用。
(4)湖北省恩施州政府大数据平台
本恩施州合作建立的城乡一体化大数据平台,通过多领域数据融合,全面覆盖人口、房屋、单位、物品、事件、地理信息六大类数据对象,横向贯通公安、民政、综治、司法、房管、教育、城管、卫生、国土、工商、人社、计生、食品药品等20几个职能业务部门,纵向贯通地市-县区-乡镇-社区-网格五级行政区划,形成全面覆盖、联通共享的政务大数据。并基于数据融合结果,对人口、单位等管理对象建立各职能业务部门之间的数据关联,发现其中的逻辑蕴含和规则推理,发现部门间的异常数据,形成管理对象的全景式分析平台,有效的提高政府管理效率和决策能力。
(5)社交网络大数据平台
建立了基于分布式爬虫进行数据获取的互联网社交平数据融合平台,通过实时获取微博、论坛、博客、SNS等1000多个平台的交互数据,实现了跨平台的虚拟用户匹配、主题关联、全景式分析,为全面分析互联网动态和舆情引导决策提供了基础。
(6)电子商务大数据平台
为研究网络经济的发展,为消费者提供更好的商品信息服务,建立了融合国内主流电子商务系统的大数据平台。通过融合淘宝、京东等100多个电子商务系统的商品、交易、评论数据,研究不同电子商务数据源中异构数据的关联分析和关系推理,实现了商品的同一性识别、不一致发现、错误数据修复、商品推荐、评论分析、品牌口碑研究等。
(7)湖北省消防总队大数据平台
习近平总书记强调大数据作为国家发展战略,在这一战略指引下,大数据已应用到各行各业。在消防应急部门采用大数据技术能实时精准地反映各官兵的所思所想所求所好所长所短、学习和工作任务情况,从而实现官兵、各中队、大队、支队的精准画像,实现各种风险的及时预警与应对,实现精准政工,科学精准的考核考评。对极大地提高政工工作效率,开创消防应急政工工作新局面有着重要的推进作用,能在全国起到示范推广作用。。
其他
主要研究在海量、多源、异质、多维和复杂数据融合下的知识发现和知识管理,建立了成熟的平台框架实现大数据的统一采集、统一存储、统一分析和可视化决策管理。其中主要的研究点包括以下3个部分:
(1)数据可用性理论体系和数据质量度量与修复
建立了数据可用性理论模型,实现跨源数据的不一致、缺失、错误等自动发现和修复,形成全维度的Web数据源质量度量体系,实现快速的质量评价和缺陷分析。
(2)数据关联网络的融合和价值发现
数据间存在普遍和多维的联系,这些联系增加了数据分析的复杂度,也蕴含了丰富的知识。通过构造对象间多重社交关系、内容多维关联关系的复杂时态网络,实现无缺失的知识图谱体系。
(3)基于深度学习的数据挖掘和知识发现
大数据的挑战给经典的数据挖掘和知识带来了新的难题和机遇,以神经网络为代表的深度学习方法提供了一套可行的解决思路。