Some contact details are hidden in this public view. If you received an access link, click here to enter the key.部分联系方式在公开版本中已隐藏。如您收到访问链接,点击此处输入密钥部分聯絡方式在公開版本中已隱藏。如您收到訪問連結,點擊此處輸入密鑰

Desmond (Minglun) Zhu朱明伦朱明倫

Houston, Texas, United States美国德克萨斯州休斯顿美國德克薩斯州休斯頓

Seven years deep in the niche of pulling data out of websites that don't want to give it up. Day-to-day in R + Chrome, with Python and SQL filling out the toolkit. Most of the work is automation — taking manual click-through workflows that used to fill weeks down to scripts that finish in minutes, typically at order-of-magnitude speedups. Comfortable across the full stack from extraction through reconciliation, predictive modeling, and dashboards. The part I actually enjoy is the puzzle of scraping sites that weren't built to be scraped — forms to fill, AJAX responses to parse, sessions to manage.在从不愿放出数据的网站中提取数据这一细分领域深耕已有七年。日常使用R + Chrome,Python和SQL作为补充工具。大部分工作是自动化——把过去要花上数周的手动点击流程压缩成几分钟内完成的脚本,效率通常提升一个数量级。从数据提取到核对、预测建模、看板,全栈都能驾驭。我真正享受的是攻克那些没有设计成能被轻易抓取的网站的难题——填写表单、解析AJAX响应、管理会话。在從不願放出資料的網站中擷取資料這一細分領域深耕已有七年。日常使用R + Chrome,Python和SQL作為補充工具。大部分工作是自動化——把過去要花上數週的手動點擊流程壓縮成幾分鐘內完成的腳本,效率通常提升一個數量級。從資料擷取到核對、預測建模、看板,全端都能駕馭。我真正享受的是攻克那些沒有設計成能被輕易擷取的網站的難題——填寫表單、解析AJAX回應、管理工作階段。

01 01

Skills技能技能

🕸

Web Scraping网络数据抓取網路資料擷取

R: rvestR: crrriHeadless ChromeDistributed ScrapingParallel ScrapingRegex
Mostly headful Chrome; headless rarely used.主要使用有头Chrome;很少使用无头模式。主要使用有頭Chrome;很少使用無頭模式。
📊

Data Processing & Analysis数据处理与分析資料處理與分析

RSQLPythonData CleaningOLAP CubeCube FormulaExcelMDXGoogle BigQuery
📈

Visualization & Reporting可视化与报告視覺化與報告

Power BIR: openxlsx2R: kableExtraR: MarkdownR: ShinyR: BlastulaR: Microsoft365R
🧠

Machine Learning机器学习機器學習

KerasPyTorchDeep LearningConv NetLSTMGANTransfer LearningStacking EnsembleGenetic Algorithm
From coursework and side projects; not a primary day-to-day toolkit.源自课程学习和业余项目;并非日常主要使用的工具。源自課程學習和業餘專案;並非日常主要使用的工具。
🌐

Web Development网页开发網頁開發

HTML5CSS / LESSJavaScriptPHPReactSVGGulpBack-end
Early career focus; foundational knowledge now applied primarily to web scraping work.职业初期专注的领域;基础知识现主要应用于网络数据抓取工作。職業初期專注的領域;基礎知識現主要應用於網路資料擷取工作。
🤖

AI & Automation人工智能与自动化人工智慧與自動化

ClaudeAI AssistantsBrowser AutomationAI Image GenAI Text Analysis
Image gen and text analysis only used occasionally as needed.图像生成和文本分析仅在需要时偶尔使用。圖像生成和文字分析僅在需要時偶爾使用。
03 05

Languages语言語言