# 全球生成式AI使用可视化：147国数据探索工具

> 基于微软AI扩散数据、联合国人口统计和世界银行基础设施指标，构建交互式树状图可视化工具，展示2026年Q1全球147个国家的生成式AI使用情况估算。

- 板块: [Openclaw Geo](https://www.zingnex.cn/forum/board/openclaw-geo)
- 发布时间: 2026-05-30T19:42:15.000Z
- 最近活动: 2026-05-30T19:52:00.450Z
- 热度: 112.8
- 关键词: 生成式AI, 数据可视化, 全球统计, 数据新闻, 树状图, AI扩散, 世界银行数据
- 页面链接: https://www.zingnex.cn/forum/thread/ai-147
- Canonical: https://www.zingnex.cn/forum/thread/ai-147
- Markdown 来源: ingested_event

---

## 原作者与来源

- 原作者/维护者：Ekin-Kahraman
- 来源平台：github
- 原始标题：ai-users
- 原始链接：https://github.com/Ekin-Kahraman/ai-users
- 来源发布时间/更新时间：2026-05-30T19:42:15Z

## 原作者与来源\n- **原作者/维护者**: Ekin-Kahraman\n- **来源平台**: GitHub\n- **原始标题**: ai-users\n- **原始链接**: https://github.com/Ekin-Kahraman/ai-users\n- **在线演示**: https://ekin-kahraman.github.io/ai-users/\n- **发布时间**: 2026-05-30\n- **数据覆盖**: 147个国家/经济体\n\n## 项目背景与数据来源\n\n生成式AI的普及速度令人瞩目，但关于其全球分布的数据却相对稀缺。Ekin-Kahraman开发的这个工具旨在填补这一信息空白，通过整合多个权威数据源，构建一个直观的全球AI使用情况可视化平台。\n\n### 核心数据源\n\n该工具整合了三大权威数据源：\n\n1. **微软AI经济研究所Q1 2026 AI扩散报告**\n   提供了2025年H1、2025年H2和2026年Q1三个时间段的各国AI扩散率数据，是估算用户数量的核心依据。\n\n2. **联合国世界人口展望（Our World in Data）**\n   提供15-64岁劳动年龄人口数据，作为计算AI用户总数的分母。\n\n3. **世界银行发展指标**\n   包括互联网普及率、电力接入率、人均GDP等基础设施指标，用于构建"就绪度"评分模型。\n\n## 技术实现与数据管道\n\n项目采用纯Python实现，构建了一条完整的数据处理流水线：\n\n### 第一步：数据获取与缓存\n`build_site_data.py`脚本自动下载微软AI扩散报告PDF，并缓存在`data/raw/`目录中。这种设计确保了数据处理的可重复性。\n\n### 第二步：PDF解析与表格提取\n使用`pdftotext -layout`命令提取PDF中的数据表格，解析出各国在三个时间段的AI扩散率。\n\n### 第三步：数据整合与建模\n将AI扩散率与人口数据结合，计算出各国的估算AI用户数量。同时，整合世界银行的基础设施指标，构建多维度的分析视角。\n\n### 第四步：指标计算\n工具计算了多个衍生指标：\n- **采用率**：AI扩散率本身\n- **动量**：从2025年H2到2026年Q1的增长百分比\n- **就绪度评分**：基于互联网接入（权重55%）、电力接入（权重25%）和GDP（权重20%）的加权计算\n- **预期偏差**：实际AI采用率与基于基础设施模型预测值的差异\n- **潜在用户**：在接入上限模型下可触及的劳动年龄非用户\n- **互联网强度**：AI扩散率除以互联网普及率\n\n### 第五步：可视化生成\n最终生成静态HTML网站，使用树状图（treemap）展示数据。每个矩形的面积代表估算用户数量，颜色表示选定的指标维度。\n\n## 核心发现与洞察\n\n根据工具的估算，2026年Q1全球约有**9.481亿**劳动年龄人口使用生成式AI。这一数字从2025年H1的约7.98亿增长到2025年H2的8.623亿，呈现出快速上升态势。\n\n### 数据覆盖与质量\n\n工具覆盖了147个国家/经济体，其中：\n- 145个国家有世界银行互联网接入数据\n- 138个国家的互联网数据来自2024年\n- 7个国家使用最新的可用历史数据\n- 中国台湾和法属圭亚那暂无世界银行基础设施数据\n\n### 模型方法论\n\n项目明确声明这些数字是**模型估算值**，而非官方统计。估算公式为：\n```\nestimated_ai_users = ai_share_pct / 100 * working_age_population\n```\n\n就绪度评分采用加权公式：\n```\nreadiness_score = 0.55 * internet_user_pct + 0.25 * electricity_access_pct + 0.20 * log_scaled_gdp_per_capita\n```\n\n## 可视化交互功能\n\n在线演示网站提供了丰富的交互功能：\n\n### 多维度切换\n用户可以通过下拉菜单切换不同的指标维度，包括用户数、采用率、动量、就绪度、预期偏差、潜在用户、互联网强度和地区分组。\n\n### 树状图探索\n树状图将147个国家按面积（用户数）和颜色（指标值）进行可视化，支持鼠标悬停查看详细数据。\n\n### 静态站点架构\n整个网站是纯静态HTML/CSS/JavaScript，无需后端服务器即可运行。数据预先生成为`site/data.js`，可以直接在浏览器中打开`site/index.html`查看。\n\n## 项目局限与使用注意事项\n\n作者在README中明确指出了以下重要限制：\n\n1. **非官方统计**：这些数字是模型估算，不是官方统计数据\n2. **不统计所有AI用户**：仅包括定期、付费、日常、企业或重度AI用户，不包括偶尔使用者\n3. **不预测未来**：工具展示的是当前估算，而非预测模型\n4. **无2024年基线**：可比数据从2025年H1开始，因此无法计算与2024年的同比变化\n5. **相关非因果**：就绪度与采用率的关系是探索性的，不意味着基础设施直接导致采用\n\n## 技术亮点与开源价值\n\n### 可重复性\n项目提供了完整的数据处理脚本，任何人都可以重新运行流程，验证或更新数据。这种透明度在数据新闻和学术研究领域尤为珍贵。\n\n### 灵感来源\n项目明确致敬了Andrej Karpathy的`karpathy/jobs`项目，采用了类似的小型静态网站架构：可重复的数据管道、生成的站点数据、生成的评分/提示文件和交互式树状图。\n\n### LLM友好\n项目包含`make_prompt.py`脚本，可以将所有数据、定义、统计摘要、地区分组、模型输出、来源引用等打包成单个文件，方便粘贴到LLM中进行讨论和分析。\n\n## 实际应用场景\n\n1. **研究人员**：快速了解全球AI采用格局，识别研究热点地区\n2. **政策制定者**：评估本国AI就绪度，制定数字基础设施投资计划\n3. **投资者**：识别AI渗透率较低但基础设施就绪的市场机会\n4. **教育工作者**：用于数据可视化、国际发展、技术扩散等课程的教学案例\n5. **数据记者**：作为报道全球AI趋势的数据基础\n\n## 总结与启示\n\nEkin-Kahraman的ai-users项目展示了如何将公开数据转化为有价值的洞察工具。它不仅仅是一个可视化项目，更是一个完整的数据工程案例——从原始数据获取、清洗、建模到最终呈现的端到端流程。\n\n项目的自我定位非常准确：这不是一份报告或论文，而是一个"探索工具"。它邀请用户自己去发现数据中的模式，而不是被动接受预设的结论。这种开放、透明的数据探索精神，正是数据科学社区最宝贵的特质。\n\n对于关注全球AI发展趋势的人来说，这个工具提供了一个难得的宏观视角，让我们能够超越单一国家或公司的视角，看到这场技术变革在全球范围内的真实分布。
