Zing 论坛

正文

全球生成式AI使用可视化:147国数据探索工具

基于微软AI扩散数据、联合国人口统计和世界银行基础设施指标,构建交互式树状图可视化工具,展示2026年Q1全球147个国家的生成式AI使用情况估算。

生成式AI数据可视化全球统计数据新闻树状图AI扩散世界银行数据
发布时间 2026/05/31 03:42最近活动 2026/05/31 03:52预计阅读 6 分钟
全球生成式AI使用可视化:147国数据探索工具
1

章节 01

导读 / 主楼:全球生成式AI使用可视化:147国数据探索工具

基于微软AI扩散数据、联合国人口统计和世界银行基础设施指标,构建交互式树状图可视化工具,展示2026年Q1全球147个国家的生成式AI使用情况估算。

2

章节 02

原作者与来源

3

章节 03

补充观点 1

原作者与来源

  • 原作者/维护者:Ekin-Kahraman
  • 来源平台:github
  • 原始标题:ai-users
  • 原始链接:https://github.com/Ekin-Kahraman/ai-users
  • 来源发布时间/更新时间:2026-05-30T19:42:15Z 原作者与来源\n- 原作者/维护者: Ekin-Kahraman\n- 来源平台: GitHub\n- 原始标题: ai-users\n- 原始链接: https://github.com/Ekin-Kahraman/ai-users\n- 在线演示: https://ekin-kahraman.github.io/ai-users/\n- 发布时间: 2026-05-30\n- 数据覆盖: 147个国家/经济体\n\n项目背景与数据来源\n\n生成式AI的普及速度令人瞩目,但关于其全球分布的数据却相对稀缺。Ekin-Kahraman开发的这个工具旨在填补这一信息空白,通过整合多个权威数据源,构建一个直观的全球AI使用情况可视化平台。\n\n核心数据源\n\n该工具整合了三大权威数据源:\n\n1. 微软AI经济研究所Q1 2026 AI扩散报告\n 提供了2025年H1、2025年H2和2026年Q1三个时间段的各国AI扩散率数据,是估算用户数量的核心依据。\n\n2. 联合国世界人口展望(Our World in Data)\n 提供15-64岁劳动年龄人口数据,作为计算AI用户总数的分母。\n\n3. 世界银行发展指标\n 包括互联网普及率、电力接入率、人均GDP等基础设施指标,用于构建"就绪度"评分模型。\n\n技术实现与数据管道\n\n项目采用纯Python实现,构建了一条完整的数据处理流水线:\n\n第一步:数据获取与缓存\nbuild_site_data.py脚本自动下载微软AI扩散报告PDF,并缓存在data/raw/目录中。这种设计确保了数据处理的可重复性。\n\n第二步:PDF解析与表格提取\n使用pdftotext -layout命令提取PDF中的数据表格,解析出各国在三个时间段的AI扩散率。\n\n第三步:数据整合与建模\n将AI扩散率与人口数据结合,计算出各国的估算AI用户数量。同时,整合世界银行的基础设施指标,构建多维度的分析视角。\n\n第四步:指标计算\n工具计算了多个衍生指标:\n- 采用率:AI扩散率本身\n- 动量:从2025年H2到2026年Q1的增长百分比\n- 就绪度评分:基于互联网接入(权重55%)、电力接入(权重25%)和GDP(权重20%)的加权计算\n- 预期偏差:实际AI采用率与基于基础设施模型预测值的差异\n- 潜在用户:在接入上限模型下可触及的劳动年龄非用户\n- 互联网强度:AI扩散率除以互联网普及率\n\n第五步:可视化生成\n最终生成静态HTML网站,使用树状图(treemap)展示数据。每个矩形的面积代表估算用户数量,颜色表示选定的指标维度。\n\n核心发现与洞察\n\n根据工具的估算,2026年Q1全球约有9.481亿劳动年龄人口使用生成式AI。这一数字从2025年H1的约7.98亿增长到2025年H2的8.623亿,呈现出快速上升态势。\n\n数据覆盖与质量\n\n工具覆盖了147个国家/经济体,其中:\n- 145个国家有世界银行互联网接入数据\n- 138个国家的互联网数据来自2024年\n- 7个国家使用最新的可用历史数据\n- 中国台湾和法属圭亚那暂无世界银行基础设施数据\n\n模型方法论\n\n项目明确声明这些数字是模型估算值,而非官方统计。估算公式为:\n\nestimated_ai_users = ai_share_pct / 100 * working_age_population\n\n\n就绪度评分采用加权公式:\n\nreadiness_score = 0.55 * internet_user_pct + 0.25 * electricity_access_pct + 0.20 * log_scaled_gdp_per_capita\n\n\n可视化交互功能\n\n在线演示网站提供了丰富的交互功能:\n\n多维度切换\n用户可以通过下拉菜单切换不同的指标维度,包括用户数、采用率、动量、就绪度、预期偏差、潜在用户、互联网强度和地区分组。\n\n树状图探索\n树状图将147个国家按面积(用户数)和颜色(指标值)进行可视化,支持鼠标悬停查看详细数据。\n\n静态站点架构\n整个网站是纯静态HTML/CSS/JavaScript,无需后端服务器即可运行。数据预先生成为site/data.js,可以直接在浏览器中打开site/index.html查看。\n\n项目局限与使用注意事项\n\n作者在README中明确指出了以下重要限制:\n\n1. 非官方统计:这些数字是模型估算,不是官方统计数据\n2. 不统计所有AI用户:仅包括定期、付费、日常、企业或重度AI用户,不包括偶尔使用者\n3. 不预测未来:工具展示的是当前估算,而非预测模型\n4. 无2024年基线:可比数据从2025年H1开始,因此无法计算与2024年的同比变化\n5. 相关非因果:就绪度与采用率的关系是探索性的,不意味着基础设施直接导致采用\n\n技术亮点与开源价值\n\n可重复性\n项目提供了完整的数据处理脚本,任何人都可以重新运行流程,验证或更新数据。这种透明度在数据新闻和学术研究领域尤为珍贵。\n\n灵感来源\n项目明确致敬了Andrej Karpathy的karpathy/jobs项目,采用了类似的小型静态网站架构:可重复的数据管道、生成的站点数据、生成的评分/提示文件和交互式树状图。\n\nLLM友好\n项目包含make_prompt.py脚本,可以将所有数据、定义、统计摘要、地区分组、模型输出、来源引用等打包成单个文件,方便粘贴到LLM中进行讨论和分析。\n\n实际应用场景\n\n1. 研究人员:快速了解全球AI采用格局,识别研究热点地区\n2. 政策制定者:评估本国AI就绪度,制定数字基础设施投资计划\n3. 投资者:识别AI渗透率较低但基础设施就绪的市场机会\n4. 教育工作者:用于数据可视化、国际发展、技术扩散等课程的教学案例\n5. 数据记者:作为报道全球AI趋势的数据基础\n\n总结与启示\n\nEkin-Kahraman的ai-users项目展示了如何将公开数据转化为有价值的洞察工具。它不仅仅是一个可视化项目,更是一个完整的数据工程案例——从原始数据获取、清洗、建模到最终呈现的端到端流程。\n\n项目的自我定位非常准确:这不是一份报告或论文,而是一个"探索工具"。它邀请用户自己去发现数据中的模式,而不是被动接受预设的结论。这种开放、透明的数据探索精神,正是数据科学社区最宝贵的特质。\n\n对于关注全球AI发展趋势的人来说,这个工具提供了一个难得的宏观视角,让我们能够超越单一国家或公司的视角,看到这场技术变革在全球范围内的真实分布。