
1. 商业逻辑与思考
将实际应用中的业务问题转化为数据需求,进行数字化场景的设计,生成数据建模或数据分析问题。
2. 数据检查与清洗
为数据问题寻找合适的、高质量、可靠的数据源,对数据源进行筛选和预处理,统一数据格式。
3. 特征工程
选择用于建模或分析的数据特征,特征工程的工作体现数据科学家对业务的深刻、准确理解。
4. 数据建模
尽管在技术维度,数据建模看起来有一定门槛,实际上在一些成熟的算法框架、大数据框架下,但是该环节很可能是花费时间最少的。
5. 沟通和优化
数据科学家构建数据模型的最终目的是为了对业务进行有效支撑,因此数据模型在正式上线应用之前,需要进行多方验证,数据科学家需要与业务人员以及管理人员进行模型的效果确认,汲取业务端的反馈,并对模型进行及时的调整和优化。
6. 撰写文档
将数据模型成果进行文档撰写,说明模型的使用场景、规范、以及调用方式等,汇报技术工作成果。
本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(专业造就领导者)默然。

