牛宝体育新闻

卓越牛宝体育项目奖+最佳论文奖!这位“青椒”在大数据计算研究领域“勇攀高峰”

2023-02-12
浏览次数:
返回列表

  牛宝体育牛宝体育近期,2021年度CCF-腾讯犀牛鸟基金揭橥结题评优功劳。中国黎民大学音讯学院张峰副教授获得本年度的唯一最高奖——卓绝项目奖。

  别的,张峰副指挥为第一作者的A类论文也荣获TPDS 2021年度最佳论文奖。

  在数据库和编制组织交叉周围,全部人焚膏继晷,渐渐深耕。让他一起走近这位人大青年传授的“科研之路”。

  近年来,物色大数据、人工智能的热潮正兴,例如近期备受合切的AI作画、ChatGPT等武艺。随着大数据技能的开展,高校的联系商量也亟待限定时候给予的时机,进展全力于擢升人类生存品德的创新讨论。举动CCF-腾讯犀牛鸟基金“杰出项目奖”获奖学者,中原群众大学张峰副辅导和腾讯数据库团队互助研发了“新型数据库存在引擎”,可接济在缩小数据上的直接筹划,颠末将数据把持下推到存在层,告终直接在存在系统中引申数据调查和改善,从而大幅先进了数据库编制的成效。

  张峰及其团队早在2017年就意识到保全空间和处分工夫会是大数据保全与意会技能转机的瓶颈,并提出了缩小数据直接揣度这一基本商酌目的,即在中断的处境下直接对数据举行解决,干系的根本目标、寻事、管理想路等公告在了2018年的国际数据库大会VLDB上。之后,全部人的磋商事务从来缠绕压缩数据直接阴谋展开,并在萎缩直接计算算法、性能提升本领,以及体例结束等差异维度均有突破。2021年加入CCF-腾讯犀牛鸟基金项目申请,正是冲动成效落地的好机遇,张峰便和腾讯数据库团队一同寻觅了收缩数据直接揣度的新型数据库留存引擎。

  张峰感到,校企间的产学研协作是一种出格好的联合更始模式。一方面,人大数据库团队有迥殊浓密的数据库身手积淀,这是项目关作的技艺根本,也是高校的优势住址;另一方面,企业会有实质利用须要,会直接涉及到现实制造系统,而这些不绝产生的新需求则是技艺收效落地的土壤。惟有聚焦可靠、有用、有挑拨的数据库体系商酌,才力处置信得过的体例研究题目牛宝体育。

  张峰表现:“本次获奖是对人大数据库团队的必然。经过本次合营,我知悉了集科研合作、功效曲折、人才扶植为一体的产学配关模式,也更深刻知讲了企业须要,为后续科研思路打开了财产视角,这对我们而言意想出众。”

  互助时候,张峰在SIGMOD、VLDB等CCF A类会议及期刊上揭晓论文8篇,申请专利3项。其磋议收获吃紧齐集在将缩小数据直接盘算推算本事到各实质行使场景的行使。张峰申报道:“大家们发现图相干在实践使用中一样比古代干系型数据库能更好地对酬酢汇集数据举行表示,可是图关联所占空间支拨强大,且生活大量冗余。于是,全班人将所研发的减弱数据直接处理身手应用在了图数据中。例如,假如全部人和您有联合的一组诤友,那就无妨用一条规则对配合恩人举办表示,而不必要将配合同伙在大家的数据库中留存频频;同时,反应的领略使命也只必要对一条文则举行处理,而后复用中间成就就能起到俭约光阴的成效。除了图数据,所有人也将所磋议的技术实行到流数据和GPU等场景。”

  IoT本事和云策画技能的起色催生了边端云企图架构的速疾转机,各式异构嵌入式安排接入到互联网。但这些异构摆设的容量受限功用较弱,这些布置上的呆板进筑职业需要转达到第三方云做事平台牛宝体育、由算力更强的GPU就事器告终。而这会带来数据沉静的新标题。张峰行为第一作者布告在TPDS上的论文“An Efficient Parallel Secure Machine Learning Framework on GPUs”提出了基于宁静多方估计打算的GPU自在机器学习系统,这是国际上较早可能运用GPU的平安机器练习框架任务的商酌,荣获TPDS 2021年度最佳论文。

  比较于不利用GPU的自在呆板研习措施,张峰的就业不妨在担保数据稳固的条目下带来30倍以上的效力扶助。全部人在筹议历程中遇到了奈何举办复杂计较模式并行、节点内CPU- GPU间数据传输支付、节点间依靠等本领问题,也对应提出了基于了解的自适关GPU优化、节点内计算和访存沉叠、节点间数据传输减少等一系列管理谋略。该商酌能够让这些新硬件处置更大范围的题目,这就能够缓解新硬件自己的担任,在数据传输、数据生存方面阐扬较大感化。

  IEEE TPDS是中原谋划机学会(CCF)举荐的A类期刊,在并行与分布式阴谋周围享有很高的学术光荣。经统计,2021年TPDS总发文量为297篇,根据老例会评选出一篇年度最佳论文和一篇最佳论文提名。

  在叙及本人的练习、发展履历时牛宝体育,张峰向来在强调身为人大“数据人”的就业与担任。张峰曩昔的讨论方针是准备机体系结构,达到人大后下手戮力于体例结构与数据库本领交织题目的接洽,拣选深耕基于语法法则会意的萎缩数据直接策动数据库技能。在找到了如此的一个集关点之后,一向在探寻怎样对此筹商举办体系化的长久,比如,奈何同GPU等新硬件部署进行连系、奈何并行、怎么举行索引等。

  在这条“科研之叙”上,大都的人大“数据人”如故诱导了前路。张峰谈:“不管是他在清华大学读博士阶段的导师陈文光哺育,依旧全班人博后阶段的导师杜小勇指导,都卓殊强调做实际有用的科研。理论商榷实际,做有用的商讨,这也是群众大学数据库团队的科研规则。”在20世纪80年月,中原没有自决知识产权的数据库产品,国内阛阓简直全为国外巨擘企业的产品所垄断。人大的数据库团队一方面踊跃为国家大型谋略机体例相闭项目进言献策,另一方面更重视对技艺难度大、加入多的数据库基本软件的研制,发轫了国产数据库的产品化研发,使得数据库的应用从边缘行业一点点久远中心一面。“动作新一代年轻科研人员,大家一方面要职掌老一辈科研人员的守旧,另一方面也要积极立异,让人大在数据库范畴希望得更好”,张峰傲慢地叙。

  在用心本身商量的同时,张峰也累赘起将人大“数据人”的仔肩与职业传递给下一代的处事。你们们从2019年起控制人大音信学院图灵班的班主任,并详尽到同砚们在进修生存中生计毛病理论咨询实际的开始枢纽问题。行为谈授,他踊跃煽动同砚们在本科阶段就走进测验室。他叙:“全部人们也会带本科生一块到场科学商讨,不少同砚本科阶段就告示了高水准学术论文。”据悉,许多讯息学院本科生经历实践室科研早培在数据科学周围宣告顶级学术论文,受到国内外同行的承认,在人大、清华、北大等海内外名校直接攻读博士学位。2019级新闻学院图灵班更是有本科生就公布了ASPLOS、VLDB等顶会论文,拿到了UIUC等全国名校的PhD offer。集合人大在数据科学的优势,音讯学院有一套完全的“3+X”的新型估量机专业课程体系来选拔高足的科研兴趣,《以数据为主旨的策画机性子领甲士才扶植——图灵试验班的教改施行》效果,获评2022年度北京市高等教化教授结果一等奖。

  运用导向,处置数据库体例发呈现实标题。承上启下,传承人大“数据人”的事务与继承。在大数据揣测商议范围这条“攀峰”之路上,谁们无间收效,并平昔前行。

搜索