网易首页 > 网易号 > 正文 申请入驻

南京人才地图出炉,在多个学科与研究领域形成特色优势

0
分享至

对于南京,你的第一印象是什么?

对于南京市近年来出台的各项人才政策,你的感受又如何?

你有想过去南京生活吗?

来源:PixaBay

当今时代,国际竞争、国内竞争、城市竞争、企业竞争,归根到底是人才的竞争。也许,大家或多或少都能从各种渠道,对南京这座古老又现代的城市有所了解。但是今天,学术君就带领大家一起通过 AI+大数据,了解一下南京的人才现状和人才环境。


众所周知,过去三十年,南京集聚了优质学者人才,不断推动着南京综合实力和核心竞争力的增长。而根据不久前,智谱·AI 在清华校友三创大赛颁奖典礼暨南京中华门创将创新成果大会上发布的《宁聚宁需人才地图》,过去五年,南京凝聚了江苏省内重点领域大部分的高端人才。


其中,南京的生物医药领域高层次人才凝聚最多,约占江苏省 28%,占全国 2%;南京的人工智能领域高层次人才第二,约占江苏省 52%,约占全国 3%;南京的集成电路领域高层次人才第三,约占江苏省 62%,约占全国 4%。


从重点领域来看,南京高端科技人才在材料领域的数量最多,在人工智能、新能源汽车和智能电网领域较强。其中,人工智能领域,南京市关键人才数量前十的机构之中,南京大学的高层次学者数量最多,为 48 位,论文总发表量和被引用数也最高。

《宁聚宁需人才地图》

《宁聚宁需人才地图》是智谱·AI 借助科技情报大数据挖掘与服务系统平台 AMiner,针对南京重点发展科技领域(材料技术、生物医药、人工智能、集成电路、新能源汽车、智能制造、智能电网)建立的智慧人才系统。


该系统选取近 5 年期间相关领域国际顶级期刊和会议所收录的全部论文数据,通过挖掘和分析论文数据,获取论文学者信息;通过命名排歧和信息抽取等大数据分析和挖掘技术,对重点科技领域的专家学者进行学者画像,构建领域人才智库,然后根据学者画像信息进行领域人才相关情报挖掘分析。


从图中我们可以看到人工智能、生物医药、材料技术、集成电路等等多个当下热门领域的多方面信息。所呈现的数据点面结合,既包括南京该领域的人才动态、城市人才分布、南京人才机构排名,也有该领域的全国人才分布、全国发展情况以及南京与省份城市的影响力对比。

南京市人才影响力

南京市与其他省份中心城市人才与产业能力比较

南京市人工智能领域人才指数

在人工智能领域,南京市的人才健康指数在全国排行第三,人才主要集中在栖霞区与玄武区;在基础科研影响力上较为突出,南京大学和东南大学在该领域人才数量较多、成果影响较大。“数据挖掘”、“特征提取”、“人脸识别”等词是该城市该领域的科研热点。

南京市生物医药领域人才指数

在生物医药领域,南京市的人才健康指数在全国排名第四,人才主要集中在栖霞区与江宁区;在基础研究热度与基础科研影响力上较为突出,在该领域的人才机构排名中,南京大学一骑绝尘。“细胞凋零”、“细胞周期”、“非小细胞肺癌”等词是该城市该领域的研究热点。

南京市材料技术领域人才指数

在材料技术领域,南京市的人才健康指数在全国排名第三,人才主要集中在栖霞区;在基础科研影响力上较为突出,产业创新方面稍弱,在该领域的人才机构排名中,南京大学和东南大学在该领域人才数量较多、成果影响较大。“数值模拟”、“晶体结构”、“透射电子显微镜”等词是该城市该领域的研究热点。

南京市集成电路领域人才指数

在集成电路领域,南京市的人才健康指数在全国排名第二,仅次于北京,人才主要集中在栖霞区、秦淮区和玄武区;在基础科研影响力和产业创新上较为突出,在该领域的人才机构排名中,东南大学和南京大学名列前茅。“无线通信”、“Mimo 通信”、“正交频分复用”等词是该城市该领域的研究热点。


此外,科技情报大数据挖掘与服务系统平台 AMiner 还结合人工智能学术知识图谱,深度挖掘了目前南京各个领域学者的职业生涯信息。感兴趣的读者可以访问 AMiner 平台进行查看。


那么,这么详细、可视化的人才地图,是怎么做出来的呢?


学术君也和《宁聚宁需人才地图》背后的研发团队进行了交流。研究人员指出,该智慧人才系统依托清华大学高质量大规模知识图谱、深度隐含关联挖掘算法和认知图谱等核心技术,服务地方科技产业发展,展示符合地方发展方向的本地、全国和全球人才分布态势、人才流动趋势,可以为地方人才引进工作中的寻、评、引、用提供基于大数据的智能化支持,构建全球人才 GPS,实现人才工作的按图索骥。

以下为智谱.AI 研发人员对学术君问题的回答:


Q:在进行不同领域人才相关情报挖掘分析的时候,运用了哪些 AI 算法?


A:使用 AMiner 库中学者论文信息数据, 我们主要使用了下面两类算法应用对学者进行领域分析标注,其中包含多个 NLP 算法。


(1)利用 AMiner 学科知识图谱:先对学者的发表论文中的实体,关系等信息进行抽取(其中实体抽取方法使用 word2vec+LSTM+CRF 和规则匹配,关系抽取采用多种方式结合:包括规则和远程监督),再利用已构建的学科知识图谱推理对学者进行领域标注。


(2)领域标注系统:这是一个以深度学习为核心算法的多标签标注系统,算法网络结构简单说明:先用 bert 对学者多篇代表性论文进行 Emmbedding,再使用多个的局部 Attention 层和全局 Attention 层进行特征的融合和提取,最后基于这些语义特征向量进行标签预测,即对学者进行领域的标注。

Q2:在收集近 5 年论文数据的时候,主要以什么为基准?


A:AMiner 库的期刊会议数据覆盖多领域,这些期刊数据具有一定影响力和代表性,并且持续更新维护;这些期刊会议通过专家和算法的标注所属领域,并且定期更新该期刊会议所在领域的影响力。我们在收集学者代表性论文数据时,就是利用这些具有领域代表性和高影响力的期刊会议进行论文的收集。

Q:《宁聚宁需人才地图》运用大数据技术并通过数据可视化的方式呈现给读者,这种方式在推动城市未来科技发展中有什么作用?这些技术还可以用在哪些领域?


A:人才地图依托高质量大规模知识图谱、深度隐含关联挖掘算法和认知图谱等核心技术,服务地方科技产业发展,展示符合地方发展方向的本地、全国乃至全球人才分布态势、人才流动趋势。下一步我们预计会针对长三角(护航苏宁常等)和深圳的人工智能、新材料、生物医药等领域,基于大数据的智能化支持,建构更进一步的人才 GPS。相关技术在其他应用领域应用也用很多,例如工业系统运行监控,社交网络信息分析等。

Q:在系统中的“科研热点”板块:所展示的文本数据是用什么模型学习得到?训练这个模型需要花费多少时间呢?是否对比了不同的模型效果?


A:“科研热点”板块,实质上是文本关键词抽取。这里的抽取算法的主要思想是利用词向量与所在文本向量的近似程度作为是否抽取的依据,并且累加每个词的近似得分,作为可视化突出显示的依据。用到的主要的模型是 word2vec。然后再使用 Spherical K-means, 以及首尾 N-Gram 联想等算法进行领域匹配优化,使抽取的关键词达到最优。


对于这个文本抽取模型,训练数据量大概是1亿篇左右的论文摘要。模型的训练时间是20 小时左右。


我们的模型与常用的开源抽取关键词工具(如:TextRank,Jieba,NLTK 等)比较,具有如下 3 个效果的明显提升:

1. 更具学术领域针对性。常用的抽词工具的训练数据,通常使用的是通用文本数据,使得结果集中包含大量的非学术性词汇。测试结果,学术研究领域关键词抽取准确率提升 32%。

2. 对英文关键短语的抽取,效果明显好于常用开源工具。测试结果,学术研究领域关键短语抽取召回率提升 45%。

3. 算法流程的最后,会对于抽取结果会利用学科领域知识图谱进行一轮筛选和排序,以提高所展示的词与领域的匹配度。

来源:

智谱.AI 智慧人才
http://talent.zhipu.ai/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日本26岁消防员兼职AV男优副业,被处以6个月停职,片酬和动机曝光后闻者落泪

日本26岁消防员兼职AV男优副业,被处以6个月停职,片酬和动机曝光后闻者落泪

日本物语
2024-04-25 20:12:21
闹大了!苏州女子说燃气费翻了一倍,现想道歉,怕老公工作保不住

闹大了!苏州女子说燃气费翻了一倍,现想道歉,怕老公工作保不住

汉史趣闻
2024-04-23 18:36:31
泰山高不高?有的人觉得泰山可能不高,还不到1600米,实际上不低

泰山高不高?有的人觉得泰山可能不高,还不到1600米,实际上不低

作家李楠枫
2024-04-25 21:38:28
中国车企“五常”激战北京车展:比亚迪不可撼动,长城超出预期

中国车企“五常”激战北京车展:比亚迪不可撼动,长城超出预期

电车通
2024-04-26 09:39:19
外媒:美商务部致信美国会,称正审查中国使用RISC-V芯片技术带来的“风险”,借口还是“国家安全”

外媒:美商务部致信美国会,称正审查中国使用RISC-V芯片技术带来的“风险”,借口还是“国家安全”

环球网资讯
2024-04-25 15:02:31
爆冷不敌印尼,韩国国奥主帅黄善洪赛后未出席发布会&助教顶替

爆冷不敌印尼,韩国国奥主帅黄善洪赛后未出席发布会&助教顶替

直播吧
2024-04-26 10:14:19
售后背锅!华为放大镜定损惹争议,1毫米划痕都不让保修

售后背锅!华为放大镜定损惹争议,1毫米划痕都不让保修

映射生活的身影
2024-04-25 03:19:53
1万6千多辆合规网约车退出营运,司机:下辈子再跑网约车

1万6千多辆合规网约车退出营运,司机:下辈子再跑网约车

用车指南
2024-04-25 10:01:05
抛弃中国选西班牙!沙特撤回140亿军舰大单背后,原因太心酸

抛弃中国选西班牙!沙特撤回140亿军舰大单背后,原因太心酸

军机图
2024-04-25 17:06:21
如何面对九二共识?赖清德给出终极答案,台军方助威,国台办回应

如何面对九二共识?赖清德给出终极答案,台军方助威,国台办回应

DS北风
2024-04-25 18:00:11
用微信给别人转账以后,一定要记得多加一步,否则到时候打水漂了

用微信给别人转账以后,一定要记得多加一步,否则到时候打水漂了

花小萌和你聊情感
2024-04-25 22:25:44
基努·里维斯:帅到令人发指,59岁才结婚,新娘比他小5岁满头白发

基努·里维斯:帅到令人发指,59岁才结婚,新娘比他小5岁满头白发

毒舌小红帽
2024-04-23 19:12:55
中国的出生率,永远都不会回来了

中国的出生率,永远都不会回来了

请辩
2024-04-23 13:50:49
没人敢动的军中巨贪,背后有两大保护伞,刘源:丢乌纱帽也拿下他

没人敢动的军中巨贪,背后有两大保护伞,刘源:丢乌纱帽也拿下他

旧时楼台月
2024-04-22 14:42:41
这也敢让看?台媒记者罕见登上052D拍摄,周围解放军的反应亮了

这也敢让看?台媒记者罕见登上052D拍摄,周围解放军的反应亮了

青辉
2024-04-25 14:09:53
俄罗斯国防部副部长被捕原来是乌克兰情报总局的杰作

俄罗斯国防部副部长被捕原来是乌克兰情报总局的杰作

探索星空
2024-04-25 20:37:19
公诉人:“别人打你,你为何要还手”?这起案子引起网友的民愤!

公诉人:“别人打你,你为何要还手”?这起案子引起网友的民愤!

辉哥说动漫
2024-04-24 18:49:38
美国务卿布林肯访华,台湾问题摊牌

美国务卿布林肯访华,台湾问题摊牌

金羊网
2024-04-25 09:20:27
公开拒绝数月后,美国证实秘密向乌军提供远程导弹

公开拒绝数月后,美国证实秘密向乌军提供远程导弹

环球时报军事
2024-04-25 16:02:34
浙江女子和驴友爬山,“迷路”一天一夜老公报警,圈内人道破真相

浙江女子和驴友爬山,“迷路”一天一夜老公报警,圈内人道破真相

苏大强专栏
2024-04-25 15:51:01
2024-04-26 12:16:49
学术头条
学术头条
致力于学术传播和科学普及,重点关注人工智能、生命科学等前沿科学进展。
1002文章数 5021关注度
往期回顾 全部

教育要闻

张老师年龄比小明2倍多8岁,10年前的年龄和小明8年后的年龄相等

头条要闻

王毅:中美关系回不到过去 但应该能够有一个好的未来

头条要闻

王毅:中美关系回不到过去 但应该能够有一个好的未来

体育要闻

库里当选最佳关键球员 10项数据联盟第一

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

24年后再产纯净水 农夫山泉为何要打自己脸

科技要闻

中国车企“五常”激战北京车展

汽车要闻

2024北京车展 比亚迪的自驱力让对手紧追猛赶

态度原创

数码
本地
时尚
教育
公开课

数码要闻

云鲸逍遥001扫拖机器人,长「脑子」了!| 体验

本地新闻

蛋友碰碰会空降西安!5.1山海境等你!

女人再美不如会穿!参考这些搭配解析更有魅力,美到老很简单

教育要闻

本科招生数前十名专业,亦是高考热门专业,它们分别有哪些特点?

公开课

睡前进食会让你发胖吗?

无障碍浏览 进入关怀版