分享

数据分析实例——如何自己在家鼓捣你的安卓手机?

 学习雪雪 2019-05-14

今日份知识你摄入了么?

你有想过,用你所学的数据科学技能来改善你的日常生活嘛?如今,数据科学已经与吃饭一样common and popular了,来看看我是怎么玩数据的吧!刚开始,我用谷歌允许我们下载的数据来研究我的Android手机应用程序使用的情况。我发布这篇文章的原因是为了让大家好好反省自己花了多少时间在手机上。因此,如果有人想复制我的结果,我将从如何下载数据开始,在后面的步骤中详细说明。

如何下载你Android 手机的使用数据


1. 进入你的 Google Account (使用你安卓手机上使用的Gmail ID)-- 如果你已经登陆进去了,可忽略这一步

2. 进入 Google Takeout

3.点击 SELECT NONE 按钮,滚动到 My Activity。

4. 选择 My Activity(选中成蓝色勾)并在下方的格式中选择 JSON 格式,选择 Next。

5. 在下一个界面,选择你喜欢的方法和下载的文件格式,并点击 Create archive。



一旦你的数据准备好了,你会被提醒可以带走它了。下载的是压缩文件(大多数是Zip格式,这是依据你上一个界面选择的)。你要做的,就是解压它,确保JSON文件准备好,能被进一步分析。

开始我们的表演



要使用的软件包

我们将要在分析中使用以下packages:

 

Library(jsonlite)

Library(tidyverse)

Library(lubridate)

Library(ggrepel)

Library(viridis)

Library(gganimate)

Library(cowplot)

Library(ggthemes)

 

如果你没有上述提及的任何packages,都可以使用install.packages() 来下载。


加载数据

我们已经有一个JSON格式的文件,最好使用数据框(Dataframe) 进行分析它 (因为它非常适合tidyverse)。但是,在jsonlite的omJSON()函数的帮助下,这种数据处理起来非常简单,该函数接受JSON文件并能输出一个扁平的dataframe。

有了上面的代码,我们可以开始进行数据处理了。


数据处理

在我们分析中会使用到的一列 -- 时间,是一个字符串,里面有数据和时间。但是对于我们来说,将时间作为时间来处理 -- 它必须是日期时间格式的,所以我们将使用parse_date_time()函数将字符串格式转换为日期时间,并使用withtz()来更改时区。因为我住在印度,所以我把它改成了印度标准时间。请使用适当的时区进行转换。

正如你在上面的代码中看到的,我们还过滤了数据,使数据只包含2017年、2018年和2019年。这是为了避免部分数据。尽管2019年的也是部分数据,但我决定将其纳入主要数据中,方便我比较这三年我使用的应用程序。有了这些,我们就能很好地进行数据预处理,让我们开始分析。


数据报告

需要注意的是,这个活动数据包括了从打开的应用程序开始的所有行为和应用程序显示在通知,所以我们进行进一步的假设每个通知也是我们的互动(至少在我的例子中,每次通知弹出,我都想点击查看它)。


样本 / 最前排的数据

Top APP -- 每年

本节的代码将绘制三个不同年份的top应用程序使用情况图,并最终将它们拼接在一起。

图形如下:

这个图很清楚地告诉了我这三年来使用app的变化。它还表示我的手机从使用HTC One(带有Sense Launcher功能)到我最近使用的Oneplus (带有Oneplus Launcher功能)的变化。你也可以注意到我已经从Whatsapp转到了Signal messenger。

 

整体日常使用APP趋势·

图形如下:

这个图表吓得我心惊肉跳。自从我买了一部新手机后,我的手机使用量飙升,这对我的工作效率并不是一个好兆头。


工作日 vs 周末

这个图展示了,当我在家和家人一起时,我是否依旧非常依赖手机。

图形如下:

还好还好,幸运的是,我不是那个到了周末依旧抱着手机不放的人。

Messaging 使用情况


过去几年,我使用过各种信息传递的APP,从传统的SMS到IMS。

以下动画描述了情况

这张图显示了信息软件如何就是我整个手机使用的驱动因素之一。相似的峰值出现在相似的时期。


YouTube(油管)使用情况

动画描述如下:


这是我YouTube的使用情况,YouTube是我看媒体信息的主要渠道,它的使用情况也与我手机整体使用类似,这就意味着它可能是另一个潜在驱动。可能是因为我的手机屏幕变大,所以我会更享受看视频,虽然这并不是我想要的。


虽然我一直坚信着我是极少数的数字极简主义者之一,但这项分析证明,我并不是其中的一员,但在减少手机使用量和改善生活方式方面,我的确还有很多工作要做。请注意,这篇文章是用烹饪书的风格而不是教程的风格写的,这样你就可以一步一步跟着我的流程来运行你自己的Android activity analysis了。如果您对代码(逻辑)有任何疑问,请随时在评论中Po出来,我很乐意澄清。希望这篇文章能帮助你进行数据驱动的自我反省——至少是Android手机的使用。


原文作者:AMR

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多