HyperAIHyperAI

Command Palette

Search for a command to run...

探索政府资助图谱:利用UKRI数据优化科研资金申请

近期,一名科技爱好者推出了一个新的开源项目——“政府资助图”(Government Funding Graph)。该项目旨在通过构建政府资助数据的关系图谱,为撰写申请研究基金的个人或机构提供辅助工具。项目的核心功能包括建议研究主题、资助机构、研究机构以及研究人员,主要利用了英国研究与创新(UKRI)的数据接口。 项目背景与目的 英国研究与创新(UKRI)是一个由英国科技部赞助的独立公共机构,每年投资约80亿英镑用于科研和创新。该项目的灵感来源于作者对政府资助领域的长期兴趣,尤其是在撰写英国创新署(Innovate UK)资助申请书时的经验。这一项目在当前政治讨论中关于政府支出的问题上也显得恰逢其时。随着美国特斯拉CEO埃隆·马斯克提出建立“政府效率部”(Department of Government Efficiency),以及英国工党领袖基尔·斯塔默寻求将人工智能整合到政府决策中,该项目有望为更多人探索公开数据集提供启示。 技术实现 1. UKRI API 作者使用了UKRI API来获取公开的资助数据。API提供了两个主要端点:一个是按关键词搜索项目的端点,另一个则是获取具体项目信息的端点。通过这些端点,用户可以基于关键词搜索项目并获取详细的信息。 2. 构建关系图谱 为了构建关系图谱,作者选择了NetworkX库,该库支持多种类型的关系图。关系图中的节点包括资助者、研究机构、项目名称和个人。通过遍历API返回的数据,作者创建了一个有向图(DiGraph),并通过自定义属性“funding”来记录每个节点的资助金额,以便后续对节点大小进行归一化处理。 3. 过滤子图 项目还包括一个用户界面功能,允许用户通过筛选节点来生成子图。这一功能通过Streamlit框架实现,用户可以选择特定的研究机构、资助者或项目名称,然后系统会自动查找与其相关的所有节点,生成一个更小的图谱,以便更好地展示相关数据。 4. 图谱可视化 为了将关系图谱可视化,作者使用了PyVis库。PyVis是一个Python包装器,基于流行的JavaScript库visJS,能够快速生成动态网络图。通过将NetworkX图转换为PyVis图,并在Streamlit应用中渲染HTML文件,用户可以直观地看到不同节点之间的关系。 5. 使用LlamaIndex进行图谱增强生成 LlamaIndex是一个流行的LLM(大型语言模型)应用框架,支持图谱增强生成(RAG)。在这一部分,作者介绍了如何通过LlamaIndex查询关系图谱中的数据。当用户输入查询时,系统会从图谱中提取实体,为AI模型提供具体的上下文,从而生成更加准确和相关的答案。作者还实现了一个聊天引擎,可以将用户的查询历史记录保存下来,以便在后续查询中提供更好的支持。 总结 “政府资助图”项目展示了如何综合利用多种开源技术和工具,如UKRI API、NetworkX、PyVis和LlamaIndex,来创建一个有用且直观的资助数据分析平台。项目不仅为科学研究和创新的资助申请提供了有力的支持,还为探索政府资助数据的公开性和透明性提供了新的途径。 行业评价与公司背景 业内人士认为,“政府资助图”项目的推出具有重要意义,它不仅提高了科研资金申请的效率,还促进了政府资助数据的可见性和透明性。这有助于更多的研究者和机构了解资助情况,优化资源配置,提升科研成果的质量。项目的主要开发者是一位在科技创新领域有着丰富经验的科技爱好者,曾多次参与英国创新署的资助申请。目前,该项目已经在GitHub上开放源代码,受到了社区的广泛关注和支持。

相关链接

Towards Data ScienceTowards Data Science
探索政府资助图谱:利用UKRI数据优化科研资金申请 | 热门资讯 | HyperAI超神经