GoForum🌐 V2EX

高级数据挖掘工程师 上海宜山路

Tony1231233 · 2026-04-14 09:40 · 0 次点赞 · 0 条回复

时空数据挖掘:负责⼤规模 GPS 轨迹数据的深加⼯。利⽤ Uber H3 / Geohash 等空间索引 算法,进⾏职住识别、商圈热度分析、⼈群轨迹相似度计算。 训练语料构建 (Corpus):负责将⾮结构化的⾏为⽇志转化为 ⼤模型可理解的⾃然语⾔⽂ 本。例如:将数据库中的标签转化为⾃然语⾔描述,供 AI 团队进⾏预训练使⽤。 ⽤户画像构建:基于 App 安装列表和地理位置特征,构建多维度的⽤户标签体系( Tagging System ),如“加密货币重度⽤户”、“⾼频商旅⼈⼠”等。 数据资产化:配合架构师,将挖掘出的中间结果沉淀为标准化的数据资产表( Data Mart )。Ym9iY3J0Z3ZzQGdtYWlsLmNvbQ==

0 条回复
添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: Tony1231233
发布: 2026-04-14
点赞: 0
回复: 0