目录 任务分配问题 hive问题 etl代码问题 任务调度问题 任务分配问题 立项开始就需要梳理开发流程,精确到每一个开发环节。 开发定义好接口尽量并行开发。 建立规范、代码版本同步。 定义ods层表名,dws层表名。 有人跟踪项目进度有没有阻碍,进度落后需要帮忙 hive问题 建表需要加注释,规范表名。 重建外部表需要删除数据。 etl代码问题 ip解析应该放在setup上。 searcher 提到全局静态变量 任务调度 每个统计任务直接跟sqoop同步任务 数据倾斜group by 优化 skewindata = true