醉江湖论坛

 找回密码
 注册账号

QQ登录

只需一步,快速开始

搜索
楼主: 杲杲

《侠客档案》之杲杲

[复制链接]
 楼主| 发表于 2023-3-5 22:27:02 | 显示全部楼层
电商实战分析
用Excel进行数据分析
        1. 理解数据
                a. 找到数据源,分成两张表
                b. 购买商品表字段信息:
                        i. 用户ID 商品ID
                        ii. 商品二级类 商品一级分类 商品属性
                        iii.  购买数量 购买日期
                c. 婴儿信息表字段信息:
                        i. 用户ID 出生日期 性别
        2. 提出问题
                a. 相关指标(根据指标体系,确立指标,也就是有多少变量)
                        i. 婴儿用品
                                1) 运营指标
                                        a) 成交:金额;数量;用户数
                                        b) 订单:金额;数量;用户数
                                        c) 效率:客单价
                                2) 会员
                                        a) 购买使用率:复购率,平均购买次数
                                        b) 会员数量:注册会员数;活跃会员数;会员留存率;会员??率
                b. 提出问题
                        i. 1.在2012年7月-2014年12月,为什么销量呈现上涨趋势?
                        ii. 2.哪类商品最热销,可主推?
                        iii. 3.用户年龄段、性别对于销量的影响?如何做到精准营销?
                c. 分析思路(可以按照逻辑树分析)
                        i. 销量上涨
                                1) 老用户
                                2) 新用户购买数量
                                        a) 对比分析
                                        b) 假设验证
                                        c) 多维度拆解
                                        d) 4P营销理论
                                                i) 产品:假设不成立
                                                ii) 价格假设不成立
                                                iii) 渠道假设不成立
                                                iv) 宣传 假设成立
                                                        One. 如何有效促销
                                                                i) 商品:哪些商品销量暴涨:对比分析,热销产品
                                                                ii) 用户:精准营销
                                                                        i) 不同年龄的不同需求。
                                                                        ii) 不同性别的不同需求。
        3. 数据清洗
                a. 选择子集--去除编号字段--列重命名-英文变中文--一致化处理--日期函数格式统一分列形式
                b. 数据整合:VLOOKUP ID匹配婴儿信息,只提取可以匹配的信息
                c. 异常值处理:可以用IF函数替换成男女,真假判定。
        4. 数据分析
                a. 为什么上涨
                        i. 拆解分析思路,对于第一层进行基本说明
                        ii. 根据图表表示为什么是这样的走向。
                b. 哪个热销
                        i. 4P营销理论,利用假设检验法,分别从产品、价格、渠道、宣传,四个方面进行分析。包括销量不明显和没有数据源所以假设不成立。结论是宣传促进销量成立
                        ii. 不同月份同比环比的数据,得到结论
                                1) 促销非常好
                                2) 商品数目增加促进销量增加
                c. 如何进行有效促销
                        i. 主推热销产品不同商品在一类二类时订单量对比。结论:针对特殊日期促销
                        ii. 针对不同用户精准营销
                                1) 不同年龄性别,这些1级分类的商品销量如何。每年总销量男女对比
        5. 得到结论
                1.促销活动一定要有针对性,50013636类商品是热销商品,评估后,可以采取相应的促销手段。
                2.精准营销,针对需求的多少去针对性推送广告以此来减免广告费用,提高广告效率,对于女婴产品可以集中在1岁进行15结尾类的商品进行推广,男婴产品可以在0-2岁集中推广。
                3.推广渠道按照年龄划分,如果需求量在0-1岁比较大,线上推广可以结合母婴类APP在不同模块和功能点处进行针对性推广。
                4.对于28的商品类和68结尾的商品类销量最大,可以进行大力的宣传和推广,在保证产品质量的同时提高产品的销量。
--------------------------------------------------------------------------------------------------------------------------------------------
用mysql进行数据分析
1. 分析背景
        1. 分析背景
        2. 数据说明:来自淘宝天猫
                a. 数据说明:
                        i. user id, item id, category id商品所属类目,
                        ii.  behavior type 包括('pv','buy','cart','fav'), timestamp行为发生的时间戳
                b. 行为类型:仅对于100W数据进行分析
                        i. Pv :商品详情页点击量
                        ii. Buy 购买量
                        iii. Cart 加入购物车量
                        iv. fav收藏商品量
2. 分析思路:用户数据、行为数据、商品数据
        1. 提问
                1.哪些商品是热搜商品?哪些是畅销商品?热搜商品是否就是畅销商品?
                2.用户各个行为类型的占比是多少?行为之间的转化率是怎样的?哪个环节流失比较严重?
                3.工作日或周末,每天不同时间段对于用户行为的影响
                4.使用RFM方法对用户进行分类
        2. 方法:
                a. 采用多维度拆解分析方法对问题进行拆解,
                b. 使用漏斗模型、对比分析法、RFM模型分析法、假设检验分析方法分析
        3. 分析思路(转化率->核心指标 ->用户行为分析)
                a. 用户行为分析
                        i. 产品:
                                1) 热搜产品;热卖产品;热搜类别;热卖类别
                                2) 分析对剑商品是否是用户喜欢的商品,及推荐机制是否合理
                        ii. 行为
                                1) 浏览次数,购买次数,收藏次数,加购次数
                                2) 行为漏斗分析各个环节的转化率,通过多维度拆解分析那个环节转化率低。
                        iii. 时间
                                1) 探索用户行为规律提出对应的策略
                                2) 用户行为与时间关系,一天内不同时间的销量分析。
                                3) 用户行为和星期关系,一周内不同天销量分析
                        iv. 用户
                                1) 最近购买时间;购买频率;购买金额
                                2) 运用FRM 分析,对用户分层
3. 数据清洗
        1. 选择子集:各字段有分析价值
        2. 列重命名:通过navicate 操作
        3. 删除重复值
                Select userID,  itemID, ItemStamp from userbehavior
                Groupr by userID, itemID, Timestamp having count(1)>1;
        4. 缺失值处理
                Select count(UserID), count(ItemID),count(CategoryID), count(BehaviorType),
                Count(Timestamp) from userbehavior;
        5. 一致化处理
                a. 新增日期和时间字段
                alter table userbehavior add Date date not null,add Time varchar(10) not null;
                b. 更新字段内容
                UPDATE userbehavior set Date = FROM_UNIXTIME(TimeStamp,'%Y-%m-%d'),
Time = FROM_UNIXTIME(TimeStamp,'%k');
        6. 异常值处理
                a. SELECT max(Date),MIN(Date) from userbehavior;
                b. 删除异常值:select count(1) from userbehavior WHERE Date < '2017-11-25';
                c. 共1099999条数据,异常数据520条
                        DELETE from userbehavior WHERE Date < '2017-11-25';
                        select count(1) from userbehavior;
4. 数据分析
        1. 用户行为路径分析:
        SELECT BehaviorType,count(1) 行为类型计数 from userbehavior GROUP BY BehaviorType;
        2. 发现浏览到购物转化率低,用漏斗法观测。
        3. 分析:浏览量:购买,加购:购买,收藏:购买,加购收藏:购买,流失。
        4. 分析每种转化率
                create view  user_P  
                AS
                select UserID, ItemID,
                sum(case when BehaviorType = 'pv' then 1 else 0 end) as '点击',
                sum(case when BehaviorType = 'cart' then 1 else 0 end) as '加购',
                sum(case when BehaviorType = 'fav' then 1 else 0 end) as '收藏',
                sum(case when BehaviorType = 'buy' then 1 else 0 end) as '购买'
                from userbehavior
                GROUP BY UserID, ItemID;
                a. 用户在每个商品上的行为记录,分别包括点击次数,加购次数,收藏次数和购买次数
                        -- 点击量
                        SELECT sum(点击) from user_p;
                        -- 点击--购买--10834
                        SELECT sum(购买) from user_p
                        where 点击>0 and 购买>0 and 收藏=0 and 加购=0;
                        -- 点击--加购--29628
                        SELECT sum(加购) from user_p
                        where 点击>0  and 收藏=0 and 加购>0;
                        -- 点击--加购--购买--3169
                        SELECT sum(购买) from user_p
                        where 点击>0 and 购买>0 and 收藏=0 and 加购>0;
                        -- 点击--收藏--11957
                        SELECT sum(收藏) from user_p
                        where 点击>0  and 收藏>0 and 加购=0;
                        -- 点击--收藏--购买--1044
                        SELECT sum(购买) from user_p
                        where 点击>0 and 购买>0 and 收藏>0 and 加购=0;
                        -- 点击--收藏+加购-1847
                        SELECT sum(收藏)+sum(加购) from user_p
                        where 点击>0 and 收藏>0 and 加购>0;
                        -- 点击--收藏+加购 -- 购买 -- 158
                        SELECT sum(购买) from user_p
                        where 点击>0 and 收藏>0 and 加购>0 and 购买>0;
                        -- 点击--流失--867742
                        SELECT sum(点击) from user_p
                        where 点击>0 and 收藏=0 and 加购=0 and 购买=0 ;
                b. 原因分析
                        i. 平台问题==》推荐机制不合理==》浏览购买TOP10,分析两者是否合理
                                1) 浏览10
                                        SELECT CategoryID,count(CategoryID) 点击次数 from userbehavior
                                        where BehaviorType = 'pv'
                                        GROUP BY CategoryID ORDER BY 点击次数 DESC limit 10;
                                2) 购买10
                                        where BehaviorType = 'buy'
                                3) 点击10
                                        select * from
                                        (SELECT itemid,count(BehaviorType) as 购买量
                                        from userbehavior
                                        where BehaviorType = 'buy'
                                        group by itemid ) as a
                                        where itemid in('812879','138964','3845720','3708121','2032668','2331370','2338453','1535294','3031354','4211339');
                                       
                        ii. 商品
                                1) 质量不好==》用户对质量没有信心
                                2) 种类少==》种类少,相似度高
                                3) 样式陈旧==》样式不新颖
                                4) 刷单行为==》评论是假的
                                5) 聚焦于点击量高购买量低的上商品。
                                6) 推荐的商品顾客并不喜欢购买,由于高浏览量并没有带来购买,所以转化率低。
                        iii. 总结:
                                1.优化推荐机制,把更多流量给到顾客愿意购买的商品
                                2.通过更好的商品推荐,页面交互,积分会员等功能等降低流失率
                                3.引导加购,可以加强营销机制引导顾客加购,比如加购物车联系客服领优惠券
                               
                c. 用户什么时候浏览
                        i. 提出假设:周末
                        ii. 收集证据
                                select Date,count(BehaviorType) as '总数',
                                sum(case when BehaviorType = 'pv' then 1 else 0 end) as '点击',
                                sum(case when BehaviorType = 'cart' then 1 else 0 end) as '加购',
                                sum(case when BehaviorType = 'fav' then 1 else 0 end) as '收藏',
                                sum(case when BehaviorType = 'buy' then 1 else 0 end) as '购买'
                                from userbehavior GROUP BY Date;
                d. 基于FRM分析模型的用户分层
                        select UserID,datediff('2017-12-3',max(Date))+1 as R ,count(BehaviorType) as F from userbehavior //最早的,到现在的,频率==》购买量==》按用户分类
                        where BehaviorType = 'buy'
                        group by UserID
                        i. 给R和F按价值打分
                                select *,
                                (case when R<=2 then 4
                                 when R between 3 and 4 then 3
                                when R between 5 and 7 then 2
                                when R between 8 and 9 then 1 end) as Rscore,
                                //4:<2; 3:3~4; 2:5~7; 1:8~9作为R分数的评判
                                (case when F between 1 and 6 then 1
                                when F between 7 and 12 then 2
                                when F between 13 and 18 then 3
                                when F>=19 then 4 end)  as Fscore
                                //1:1~6; 2:7~12;3:13~18;4:>=19作为F分数的评判
                                from //select * from table
                                //按照用户分类分层
                                (select UserID,datediff('2017-12-3',max(Date))+1 as R ,count(BehaviorType) as F
                                from userbehavior
                                where BehaviorType = 'buy'
                                group by UserID) m//应该是命名为m
                        ii. 用户分类
                                select 用户分类,count(UserID) as '人数' from//select 表头 from f
                                (select userid,
                                (case when RScore>'3.0533' and FScore>'1.1043' then '重要价值用户'
                                      when RScore>'3.0533' and FScore<'1.1043' then '重要发展用户'
                                      when RScore<'3.0533' and FScore>'1.1043' then '重要保持用户'
                                      when RScore<'3.0533' and FScore<'1.1043' then '重要挽留用户'
                                 else 0 end) as '用户分类'
                                from //select userid,? From n
                               
                                (select *,
                                (case when R<=2 then 4
                                when R between 3 and 4 then 3
                                when R between 5 and 7 then 2
                                when R between 8 and 9 then 1 end) as Rscore,//R
                                (case when F between 1 and 6 then 1
                                when F between 7 and 12 then 2
                                when F between 13 and 18 then 3
                                when F>=19 then 4 end)  as Fscore//F
                                from
                                (select UserID,datediff('2017-12-3',max(Date))+1 as R ,count(BehaviorType) as F
                                from userbehavior
                                where BehaviorType = 'buy'
                                group by UserID) m)  n) f
                                group by 用户分类; //觉得这一句很重要,但是不知道没有这一句会发生什么。
5. 结论:
6. 建议:
                               
                               
                       
                               
                               
               

               
                       
                               
                       
                       
               
                               
                       
                       
       
                                       
                       
                                                                       
                                                                               
                       
               
                                               
                                       
       





















       
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-5 22:27:27 | 显示全部楼层
1. 描述统计
        1. 集中趋势:高峰组段在什么位置
                a. 均值
                        i. 优点:敏感,变化快。
                        ii. 缺点:掩盖差异性;均值受极值的影响很大
                b. 中位数
                        i. 优点:在具有个别极值数列中,中位数比均数更具有代表性
                        ii. 缺点:很多人不理解;只考虑居中位置
                        iii. 应用:对称性数据
                c. 众数
                        i. Excel:均值average() ;中位数median() 众数mode()
        2. 离散趋势(变异系数):是否对称,分布曲线的形状,正负偏
                a. 离均差:x-μ:可以代表其离散程度大小
                        i. 问题:可否用离均差的总和来表示整个样本的离散程度。
                                1) 答:不能,因为加减抵消为0,
                                2) 所以加绝对值,但是不好算
                                3) 所以求离均差的平方和
                                4)
                                5) 可是若是因为样本量差异过大导致这个值不准,就是有了总体的方差公式
                        ii. 方差-标准差-变异系数 应用场景:以均值作为集中趋势代表值,也就是正态分布的数据。
                b. 正态分布
                        i. 方差:有了总体样本
                                       
                        ii. 标准差:
                                1) 总体标准差:日常没有总体样本,只能堆积抽取部分数据计算
                                                                               
                                2) 样本标准差:
                               
                                        a) 存在的问题:
                                                i) 1.测量尺度的相差太大:例如蚂蚁和大象的体重变异
                                                ii) 2.计算单位不同:比较身高和体重的变异程度
                        iii. 变异系数:可以解决这个问题:变异系数=标准差/均值 进行对比
                                       
                c. 非正态分布
                        i. 百分位数
                                1) 一个百分位数Px将一组观察值分为两部分,理论上有x%的观察值比它小,有(100-x)%的观察值比它大。这是一定的因为横着切一刀。
                        ii. 四分位数/差
                                1) 把一组数拆成4份,所以每一份的数量是差不多的,所以P25,P50,P75之间的差值不固定。
                                2) P25、P50和P75分位数分别称作下四分位数,中位数 上四分位数
                                3) 四分位数间距既排除了两端极端值的影响,又能够反映较多数据的离散程度。
                        iii. Excel:方差:var.s(num1,num2) 标准差 stdev.s(num1,num2) 变异系数:标准差/均值;百分位数:percentile.inc(array,k);四分位数:quartile.inc(array,k)
               
        3. 分布形状:是否对称,分布曲线的形状,正负偏
                a. 偏度
峰度
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-5 22:28:17 | 显示全部楼层
数据可视化牵扯的推断统计,由于没有安排那么多的时间所以就只能暂时放弃了。等下一次复习的时候再说吧。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-6 12:38:58 | 显示全部楼层
成绩出来的,还不如上一次考试的,感觉很难受,已经是快第十次考试了。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-6 12:40:10 | 显示全部楼层
做一次的作文题目【描述一项最近的发明,并解释你认为它对社会的影响,无论是有益的还是有害的】
我写的是互联网的作用,结果分数很低,经过我亲身经历,一句话RA 有点时候并不是那么保险。还是不太建议使用。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-6 12:41:12 | 显示全部楼层
SST 是使用信用卡时激励和惩罚的不同作用
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-6 12:41:35 | 显示全部楼层
【目的】


在一个研究客户行为的实验中(experiment on customers’ behaviors )。





【过程】


一组停滞使用信用卡的用户(inactive credit card users)收到信息说如果他们使用信用卡就可以得到福利(a message offering benefits ),另一组收到信息说如果他们不适用信用卡就会得到罚款(implying a penalty)。





【结果】


表明:相较于潜在的福利,客户更容易被潜在的损失所激发(more motivated by a potential loss)。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-6 12:42:32 | 显示全部楼层
所以这一类题我失败的原因在于我没有很好的吧英文写出来,意思就是如果之按照中文的意思去写,是没有一点分数的
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-6 12:59:53 | 显示全部楼层
看了看发现WFD 应该就只有一道题没有遇到过,或者没有听出来。
已经听出来的句子里面,少了both,和succeed 少了一个e错了,扣了2分但是这一方面应该是比上一次好才对,娜美问题应该是出在FIB听力上面
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-6 13:00:53 | 显示全部楼层
这一次的听力FIB 没有一道原题,也是十分郁闷的,可能接下来我的重点除了整合其他网站的题目以外也需要对这些多练习一下听力和发音。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-7 15:31:09 | 显示全部楼层
说一说天空里面的进展和遇到的问题
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-7 15:31:44 | 显示全部楼层
首先就是匠魂,匠魂模组里面的熔炼炉很简单也很难,那我来简单介绍一下。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-7 15:34:17 | 显示全部楼层
首先必须要有的就是焦黑砖块,一个焦黑砖块需要有4个焦黑砖组成,一个好像是要通过4份碳土+2份砂土+2份黏土土,可以合成一个焦黑砖块,你可以把焦黑砖块看做是,所有的匠魂熔炉最简单的部分。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-7 15:36:18 | 显示全部楼层
然后就是出液孔,这里需要强调一下的就是出液孔由于是多面的,基本上有一面朝向控制器,另一面项墙,上下两面基本上没有用的,所以如果把它放在角上,就只有一个输出,放在边上有两个
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-7 15:37:54 | 显示全部楼层
出口一般要加一个出口,这个口有短长两个型号,可能有的时候和其他的电路啊,红石啊,什么的可能有冲突,所以需要添加长管道,短管道不能续,但是长的好像可以。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-7 15:39:52 | 显示全部楼层
然后就是浇筑盆/台。先说浇筑盆放在出口下面,作用就是可以吧炉子里面的金属整块的拿出来,这个是最方便的,因为金属块可以合成金属锭,而如果直接熔炼金属锭,在现在来说没有黄金筑磨就会十分麻烦。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-7 15:41:36 | 显示全部楼层
浇筑台,这个比较复杂,简而言之就是需要一个物品放在台子上等着被浇筑,一段时间以后浇筑成型就可以获得新的物品,比方说树苗的浇筑,星空苗, 银苗。铅苗,还有一个很高的蓝色的树也是这种方式获得的。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-7 15:43:06 | 显示全部楼层
接下来重中之重就是溶液存储,这里就是存放岩浆之类的地方,当然熔炼以后岩浆也会消失,但是材料上有了质的飞跃,我就是不知道要做这个卡了小半年,
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-7 15:44:34 | 显示全部楼层
最后就是控制器了,当你把所有的东西放好的时候,就有了控制器,这个东西会着火,现在就是不知道会不会要改变大小而不得不拆除,里面的东西不知道会不会保留
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-7 15:45:47 | 显示全部楼层
有了这个以后就按照3*3 的空间开始摆放了,我直到现在才明白有一种更快的方式去获得黑胶转,以前以为必须要黄金,现在看来,似乎不需要就是麻烦一点罢了。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

QQ|手机版|Archiver|小黑屋|醉江湖论坛 |网站地图

GMT+8, 2025-1-7 04:33 , Processed in 0.166144 second(s), 17 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表