PEST是指通过对政治(Political)、经济(Economic)、社会(Social)和技术(Technological)这四个因素进行综合分析,从而判断企业所面临现实状况。
通过PEST对在线教育行业进行宏观的分析,不仅可以使自己更加了解在线教育在今后几年的宏观趋势,并且可以在宏观层面去更深刻的了解在线教育方面的业务。同时,我还会基于2000条TED数据,对在线教育的课程具体形式,提出个人意见。
对于在线教育,按受教育者的年龄分,可以大致一下几个维度。
0 - 6 岁:早幼教领域 —— 早教园、启蒙内容等……
6 - 19 岁:K12教育领域 —— 学科辅导、课后辅导、艺考等……
19岁以上:高等教育领域 —— 成人继续教育、考研留学等……
职业培训领域 —— 职业考试培训、职业技能培训、企业培训等……
政治因素(Political)
政策方面,在线教育监管刚刚开始,在K12在线教育领域受到的监管最强烈,例如:2018年8月国务院出台了《关于规范校外培训机构发展的意见》、2018年12月教育部出台了《关于严禁有害APP进入中小学校园的通知》。
不过在某些细分领域的在线教育中,可能会迎来较好的政策机遇,以及良好的宏观环境。如在考研这个领域,随着近些年考研人数的不断提升,对于在线教育的需求也会继续增长。
经济因素(Economic)
仅2018年各企业营收总和达2517.6亿元,同比增长25.7%,预计未来3-5年市场规模增速保持在16-24%,增速持续降低但增长势头保持稳健。
同时,付费用户规模超1.3亿人,同比增长23.3%。
社会因素(Social)
由于成人在提升学历、求职、考证的市场刚需的推动下,在线教育培训的需求更加强烈。并且在社会竞争日益激励的今天,对于职业技能的提升的需求也会与日俱增。在成人类课程中,B2B2C平台起到了主要的作用,使得有更多的用户利用在线教育的平台进行学习,如编程,美工等当下热门的行业。
科技因素(Technology)
在线教育能迅猛的发展,离不开科技的进步。同时,在线教育又吹生的大量的新科技,以便满足在线教育继续发展的势头。
如:当下最热门的人工智能,人工智能现已经在在线基于的部分环节起到了一些以前人工处理很难达到的精细处理。人工智能利用语音识别、知识图谱、机器学习等多项技术,实现了包括拍题搜题、分层排课、作文批改、作业布置等多方面的需求。使得在线教育可以更加深刻的了解用户的痛点、从而去优化用户的用户体验。
在教育上的具体体现是,通过对学生能力的评估,去进一步去清晰的规划学生的学习路径,以便,可以更加有针对性的去提供个性化的解决方法,动态调整学习的计划,最大化的提升学习的效率。
基于TED数据集的分析
① 主要提出的问题
② 理解数据
③ 数据清洗
2. 删除重复值
通过对“演讲正式名称”来筛选出重复的值。
3. 处理缺失值
通过定位条件进行查找空值,可以有效的把数据填充完整。
6. 一致化处理
对于时间类型,我通常会转化成年月日类型,而不是用时间戳类型。
还有我会把以秒为单位的数据,转换成时间类型。
④ 构建模型
对于清洗好的数据,对于之后再运用EXCLE进行分析,就会避免很多错误。
在计算平局值时,我遇到了value error,这里是说明我的观看数量中有的数据不规范,于是,又进行的筛选数据的步骤,可以看到有些数据并不是整数,当我们把不合格的数据删除时,就可以得出平均值了。
了解平局值的好处是平均值可以大致代表一个大样本的状况,通过求出均值,就可以了解大致的情况。
上面计算过平均的观看时间为13:48分钟。
第一步——把时间每五分钟分成一个区间,进行平均观看时间的比较。
做成条形图之后的图表:
对于演讲时间这个因素,总的来说,并没有影响到观看的数量,而由于TED自身对于演讲时长的限制,因此会出现大部分播放时长在5分钟到20分钟这个时间段内。
首先对评论的人数求平均值,每个视频的评论数大致在200条左右
分析的思路是:首先将不同区间段(0-100,100-200,200-300,300-400,400以上)的数据求总个数和平均数两项,把平均数进行比较。
通过vlookup函数的模糊匹配,在每个评论数据进行区间的划分,我把评论的热度进行5个区间的划分。
再通过countif和averageif函数计算“所在评论区间条数”,“所在评论区间观看数量”。
通过条形图,可以看出0-200之间的评论数超过70%,而评论数和观看的数量确实成正比例关系。
对于发言人数量这个参数,通过插入中的透视表选项。因为发言人的数量不超过5人,因此,我选择用透视表来做。
通过对观看数量的计算,在TED演讲中1人演讲最多,3人以下的演讲,获得的观看数量都在百万以上,并不会使观看数量减少。
在TED演讲中,最少有0中可选择的语言,也就是只有英语,最多有72种语言可以选择,下图为归纳后的表格:
在这张图片中可以清晰的看出可选的语言与观看的数量呈正相关,而大多数的可选择语言在20种到30种不等。
基于2000条数据的分析结果:
对于以上的四个问题,做出了相应的统计分析,发现评论数和可选择语言与观看数量呈比较良好的正相关,而之前一直认为的观看时长,并没有与观看数量呈现良好的正相关关系。
总结
通过PEST分析方法,在不同的四个维度,对在线教育进行了分析,我认为在线教育在经过了几年的发展之后,在各个细分的领域都已经做的十分完善。之后几年,随着人工智能的进一步发展,人工智能对于在线教育的影响越来越深入,使得个性化教学变成可能。
最后通过分析TED的数据集,对于影响观看数量这个变量,与很多因素都有关。其中,一定数量的评论数会比较大的影响到观看数量的多少。