一、场景
玩家每天游戏的各种操作(登录,充值等),这些行为都会记录到日志中,根据这些日志信息统计并分析用户行为。
(1)、时延
由于 Hadoop MapReduce 底层设计因素,在进行计算的过程中,在 Map 阶段的处理结果会写入磁盘中,在 Reduce 阶段再去下载 Map 阶段处理完的结果,Reduce 计算完毕后的结果又会回写磁盘中。
这样反复操作磁盘,I/O 开销很大,所耗费的时间自然也就偏高。这就意味着,Hadoop MapReduce 计算模型适合处理 批处理任务,而对实时统计任务则不适合,如 股票交易系统,银行交易系统。
大约 5 分钟