Zing 论坛

正文

数据分析师作品集:SQL分析、Tableau可视化与机器学习项目实战

Siti Suharyanti的数据分析师作品集,包含Chinook音乐商店SQL分析、Tableau收入可视化仪表板,以及Twitter情感分析机器学习项目。

数据分析SQLTableauPython机器学习情感分析数据可视化PostgreSQL
发布时间 2026/06/04 14:16最近活动 2026/06/04 14:21预计阅读 3 分钟
数据分析师作品集:SQL分析、Tableau可视化与机器学习项目实战
1

章节 01

【导读】Siti Suharyanti数据分析师作品集核心概览

Siti Suharyanti的GitHub作品集涵盖Chinook音乐商店SQL分析、Tableau收入可视化仪表板、PT Esteh Indonesia Makmur推文情感分析三大项目,展示从数据提取到可视化的完整数据科学流程,是初级数据分析师求职与学习的优质参考案例。

3

章节 03

核心项目方法与技术栈

项目方法

  1. SQL分析:使用PostgreSQL处理Chinook数据库,涵盖聚合函数、表连接、CTE、窗口函数等技能
  2. Tableau可视化:通过交互式仪表板呈现收入趋势、客户细分等,转化SQL结果为直观可视化
  3. 机器学习:用朴素贝叶斯和SVM分类Twitter情感,含数据抓取、预处理、模型构建与评估

技术栈

  • 数据库:PostgreSQL
  • 语言:Python
  • 可视化:Tableau、matplotlib、seaborn
  • NLP:Sastrawi、demoji
  • 数据处理:pandas、numpy
  • ML:scikit-learn(朴素贝叶斯、SVM)、SMOTE、TF-IDF
  • 版本控制:Git/GitHub
4

章节 04

项目具体证据与成果

SQL项目

  • 数据集:59位客户、412张发票、3503首曲目,覆盖24国,2021-2025年
  • 工具:PostgreSQL、pgAdmin

Tableau项目

  • 成果:2个交互式仪表板,满足高管(收入概览)与运营(曲目表现)需求

机器学习项目

  • 数据集:通过snscrape抓取2022年9月24-30日含"es teh indonesia"和"somasi"的推文
  • 工具:Python、Google Colab、scikit-learn
  • 技能:NLP预处理、TF-IDF、SMOTE、模型评估(准确率、F1等)
5

章节 05

项目亮点与学习价值

亮点

  • 完整技术闭环:SQL提取→Python处理→可视化呈现
  • 领域针对性:印尼语NLP处理,解决非英语文本问题
  • 项目策略:选择教育领域常用数据集(Chinook)与热点事件(Twitter情感)

学习价值

  • 提供清晰学习路径:SQL基础→Python数据处理→ML与可视化
  • 项目驱动学习:每个项目有明确业务场景与技术目标,比语法学习更有效
6

章节 06

对求职者的启示

  1. 项目覆盖核心环节:数据提取(SQL)、分析建模(Python/ML)、结果呈现(可视化)
  2. 项目说明清晰:每个项目需明确业务背景与技术细节,体现价值
  3. 技能展示直观:用分类表格列出工具技术,方便招聘者匹配需求
  4. 提供可访问链接:指向代码仓库或在线演示,便于深入了解