造价师证书在建设部网站查询,常熟网站,软件汇,上海网络维护哪家品质好基于大数据的K-means广告效果分析
项目运行效果#xff1a; 毕业设计 基于大数据的K-means广告效果分析#x1f9ff; 项目分享:见文末!
一、分析背景和目的
在大数据时代的背景下#xff0c;广告主可以购买媒介变成直接购买用户#xff0c;广告的精准投放对广告主、服务…基于大数据的K-means广告效果分析项目运行效果毕业设计 基于大数据的K-means广告效果分析 项目分享:见文末!一、分析背景和目的在大数据时代的背景下广告主可以购买媒介变成直接购买用户广告的精准投放对广告主、服务平台与潜在用户而言在提升效率与商业效益方面有了更迫切的需求然而网络广告形式多样很多广告投放系统相对缺乏针对性使得网络广告精准度不够高因此对推广数据的研究是十分必要的。所有本次项目将从用户特征投放时间投放位置以及高点击率广告的特征等方面多维度进行数据分析以提高用户点击率实现淘宝展示广告精准投放实现广告投放效果最大。注意本文是博主自主探索数据分析的记录和总结有些方法和结论会存在错误希望对你学习有帮助的话我很高兴但是有问题的话希望给小弟批评和指正。本文使用的数据工具为mysql 和 tableau二、数据集数据来源阿里天池数据集数据名称说明属性raw_sample原始样本骨架用户id广告id时间资源位是否点击ad_feature广告的基本信息广告id广告计划id类目id品牌iduser_profile用户的基本信息用户id年龄层性别等raw_behavior用户的行为日志用户id行为类型时间商品类目id品牌id具体字段如图三、分析框架和思路对于衡量广告投放效果有三种模式对于cpc模式点击率 点击量 / 展示量可以使用点击量衡量投放效果对于品牌来说是根据点击量来进行付费的点击率则可以体现广告的吸引力。对于cpa模式可以构建两个漏斗即浏览—收藏—购买浏览—加入购物车—购买观察转换率可以衡量投放效果。四、数据预处理原数据集太大为了方便分析在raw_sample数据集中截取300w条数据数据缺失值处理如果出现缺失将缺失的行删除即可简单方法select count(user_id),count(adgroup_id),count(time_stamp),count(pid),count(noclk),count(clk)from raw_sample;在 user_profile 数据中 pvalue_level 字段缺失率高达53.1%这里可以使用knn算法进行预测填充(我比较菜先直接忽略后续学习python之后进行补充而 new_user_class_level 字段的缺失率也有27.4%可以使用众数进行补充。数据重复值处理select user_id, adgroup_id, time_stamp, pid, noclk, clkfrom raw_samplegroup by user_id, adgroup_id, time_stamp, pid, nonclk, clkhaving count(user_id) 1;数据异常值比如有无超出时间范围时间处理将时间戳分解为日期和时间alter table raw_sample add time_date varchar(20);alter table raw_sample add time_hour varchar(20);update raw_sample set time_date left(from_unixtime(time_stamp),10);update raw_sample set time_hour right(from_unixtime(time_stamp),8);五、数据分析1. 广告投放渠道分析select pid ‘资源位’,(select COUNT() from raw_sample) ‘展示量’,sum(clk) ‘点击量’,sum(clk) / (select COUNT() from raw_sample) ‘点击率’from raw_samplegroup by pid;结论4300548_1007的广告投放效果会更好而且广告吸引力也更大。2. 广告投放时间分析2.1 24h的投放效果select left(time_hour,2) ‘小时’,COUNT() ‘展示量’,sum(clk) ‘点击量’,sum(clk) / COUNT() ‘点击率’from raw_samplegroup by left(time_hour,2)order by left(time_hour,2) ;结论点击量基本符合人们的作息规律而点击率在9-10点、13-14点和20-21点都比较高这些时间基本就是人们工作前、中奇怪的是在半夜1点和3点的时候点击率居然比较高问题可能是展现量较低但点击量高夜猫子刷淘宝的时候不容易被其他事情分散注意力我觉得可以探索一下哪个品类的东西深得夜猫子浏览和点击适当的进行实验性营销。说干就干首先查看整体展现量分布发现将近90%的展现量在1000以内所以我截取了时间在0-4点并且展现量大于500的商品类目如下图确实有几个点击率很高的类目不过他们的投入产出是否合理这个还是看具体情况吧。2.2 一周8天的投放效果select right(time_date,2) ‘日期’,COUNT() ‘展示量’,sum(clk) ‘点击量’,sum(clk) / COUNT() ‘点击率’from raw_samplegroup by right(time_date,2)order by right(time_date,2) ;结论2017年5月6号是星期六周末的展现量较高比较符合作息规律周二的点击率比较高但是周末点击率为什么比较低因为展现量高周五的点击率最低是什么原因造成这些可能需要具体分析可以进行与其他日期进行对比分析对比不同日期24小时效果分析。3、广告投放人群分析3.1 用户性别分析select if(final_gender_code 1, ‘男’,‘女’) ‘性别’,sum(clk) ‘点击量’,sum(clk) / (select COUNT(*) from raw_sample) ‘点击率’from raw_sample,user_profilewhere raw_sample.user_id user_profile.useridgroup by final_gender_code结论相比于男性女性更容易被广告吸引点击量更高。3.2 用户消费档次分析select case when pvalue_level 1 then ‘1’when pvalue_level 2 then ‘2’when pvalue_level 3 then ‘3’end ‘消费档次’,sum(clk) ‘点击量’,sum(clk) / (select COUNT(*) from raw_sample) ‘点击率’from raw_sample,user_profilewhere raw_sample.user_id user_profile.userid andpvalue_level is not null – 缺失值未处理直接排除group by pvalue_levelorder by pvalue_level;结论由于缺失值未处理所以结论有问题但不影响本文分析消费档次为2的用户更容易被吸引。3.3 用户购物深度分析select case when shopping_level 1 then ‘浅层’when shopping_level 2 then ‘中层’when shopping_level 3 then ‘深层’end ‘购物深度’,sum(clk) ‘点击量’,sum(clk) / (select COUNT(*) from raw_sample) ‘点击率’from raw_sample,user_profilewhere raw_sample.user_id user_profile.useridgroup by shopping_levelorder by shopping_level;结论深度使用的用户更容易被广告吸引。3.4 用户人群分析select case when occupation 1 then ‘大学生’when occupation 0 then ‘非大学生’end ‘用户人群’,sum(clk) ‘点击量’,sum(clk) / (select COUNT(*) from raw_sample) ‘点击率’from raw_sample,user_profilewhere raw_sample.user_id user_profile.useridgroup by occupation;结论非大学生群体更容易被广告吸引。3.5 用户年龄分析select age_level ‘年龄层次’,sum(clk) ‘点击量’,sum(clk) / (select COUNT(*) from raw_sample) ‘点击率’from raw_sample,user_profilewhere raw_sample.user_id user_profile.useridgroup by age_level;结论年龄在3层的用户更容易被吸引3.6 用户城市层次分析select new_class_level ‘城市层次’,sum(clk) ‘点击量’,sum(clk) / (select COUNT(*) from raw_sample) ‘点击率’from raw_sample,user_profilewhere raw_sample.user_id user_profile.useridgroup by new_class_level;结论在城市层次2的用户更容易被广告吸引。4、用户行为指标衡量广告投放效果CPAselect btag,count(btag)from behavior_loggroup by btagorder by count(btag);浏览—加入购物车—购买的漏斗模型用户在点击广告浏览后加入购物车的转化率为2.31%购买的转化率为1.24%选择CPA模式衡量投放效果的话必须提高用户的加入购物车、收藏和购买的转化率如果转化率低的话可能是因为用户进入商品详情界面时较难激发购物欲望需要对落地页进行优化才能提高转化率。六、结论和建议渠道4300548_1007资源位的广告投放效果会更好时间在9-10点、13-14点和20-21点的时候点击率会更高周二的点击率更高用户女性、中档消费、深度购物、非大学生、年龄3档、城市层级2层的用户投放效果会更好。本文只分析了全体的投放效果正常需要结合品牌、商品类目和价格等进行分析也可以结合转化率一起分析。项目运行效果毕业设计 基于大数据的K-means广告效果分析 项目分享:见文末!