莫纳什大学数据科学硕士在读(QS 2026 第36位,预计 2026 年 7 月毕业)。具有扎实的统计学与数据分析背景,熟练掌握 R 与 Python 等编程语言,擅长数据的清洗、探索、建模与可视化,有使用 OpenAI 接口、TTS、语音识别、音乐合成等模型构建交互式智能体的经验,专注于以数据智能驱动决策与创新。
数据科学硕士 Master of Data Science
2024 - 至今
大数据技术与数据科学学士 Bachelor of Data Science and Big Data Technology
2019 - 2023
能够熟练的使用 Python 和 R 进行数据检查、清洗、转换与结构化处理,熟练掌握 NumPy、Pandas、PySpark、data.table 与 dplyr 等常用库。
能够结合业务需求设计三类模型(数据模型、逻辑模型、物理模型),并使用 SQL 高效完成数据库构建与查询。
能够运用 R 和 Python 搭建机器学习管线,开展机器学习模型的建模、训练、调优与实际部署,掌握 Scikit-learn、PyTorch 等常用机器学习库,以及 Spark MLlib 等分布式库的使用。
能够熟练运用 Matplotlib、Seaborn 等 Python 库以及 R 的 ggplot2 进行数据可视化分析,并基于 R Shiny 搭建交互式可视化面板。
能够利用 OpenAI API 与 Hugging Face Transformers 包调用大模型,开发基于大模型的应用系统。
具有使用 Qt Designer 搭建应用界面、QThread 与 threading 库实现并行处理的实践经验,且对 C 和 Java 的编程思想有一定理解。
一个交互式可视化平台,使非专业用户能够直观探索 2000–2023 年加拿大鸟类观测在时空及气候因素下的分布规律
独立完成系统的设计、开发与部署
一款基于大语言模型与 OCR 技术、以工作流驱动的悬浮式屏幕交互式助手,用于实时解析屏幕内容并进行智能问答。
独立完成系统的设计、开发与实现
基于 Spark 与 Kafka 搭建的实时电力负荷预测系统,支持智能电网动态调度的研究项目。
参与系统设计、开发与优化的核心工作
一款以工作流驱动、融合本地小模型与云端大语言模型的轻量级实时语音对话智能体。
独立完成系统的设计、开发与实现
参与公司数据分析项目,负责数据收集、清洗和预处理工作。运用Python进行数据分析,协助建立统计模型,为业务决策提供数据支持。
技能应用:Python, 数据分析, 统计建模