如何用数据捕获一只白富美,泡妞还是需要技术

桂林seo半杯酒博客

R是我的一个好基友,性别男,爱好宅,我平时到他家不是PS4就是LOL打起来。最近他刚从老家济南回到上海。这次去他家,带着刚入手的新游戏,准备大战一场。

满怀激动地敲门后,我却看见顶着黑眼圈来开门的R。开门后的R连招呼都没打,一头就栽倒在了我身上,我深情地看着R,“咋滴啦哥们儿,被人煮了?”R抬起空洞的双眼,“我恋爱了!"

原来R在高铁上遇到了一位白富美,被迷得七荤八素,六神无主。我心想,这小子平时老老实实,没想到一来就是一见钟情。我当下决定,要帮这小子找到这位神秘白富美。在R语无伦次的描述下,我画了张这位奇女子的分析图,以下就将这位奇女子简称Q吧:

可是凭一张照片也不可能找得到Q啊,总不可能去上海的大小街头去贴寻人启事吧。我袖子一撸,眉头一紧,这点事儿,不至于难得到我,真相只有一个我决定大干一场!

但是我不是什么福尔摩斯,也不是柯南道尔,没有自己的记忆宫殿,不过幸好我最近潜心研究大数据。我立刻翻阅起相关的数据研究,说不定在这里面可以找到点有用的信息。

R是从济南上的车(G17,北京-上海),Q应该是在前半段上的车,我翻出一张有关高铁线路昂贵程度的分析图以及一张京沪列车的时价比图:

高铁线路价格图

京沪列车时价比图

R出差回来的时间并不是什么节假日,根据图上的分析,Q应该是刚从家里回到上海,会在这个时候往返自己家,我推断Q应该是一个在家与上海之间经常往返的人,并不拘泥于节假日。

根据上面这两张图,要使用薪资负担起G17京沪高铁的票价,那么时薪应该在110元左右,换算成月薪大约2万/月。在上海,对于一个这样年龄的姑娘,想要达到这样的薪资,那么她很有可能是个——【金融白领】。当你想到上海的金融白领时,有个地方就会在你的脑海中浮现出来——陆家嘴。

可是即使知道她在陆家嘴工作,陆家嘴大大小小的金融公司数不胜数,岂不依然是大海捞针?这女孩儿身上大半是名牌儿,一定是个爱逛街的主儿,我想着如果能够找到这种金融界白富美愿意去哪儿逛街,咱来个守株待兔岂不妙哉。于是我马上翻出了商圈研究图:

上海市主要商圈客流来源分布图

上海一共有九大商圈,拿到客流来源,也许能找出点端倪。我撑着自己的大脑门,看着在一旁瘫坐着的R,又一头扎进了浏览器,我得再看看去陆家嘴逛街的人到底是来自哪。

商圈本地化程度(聚集度)排名

万万没有想到的是,陆家嘴的逛街党都是不安分的主,不仅整个商圈的分布范围之大,让我的脑门冒出涔涔细汗,对于自己商圈的喜爱程度居然排在了倒数。

不行,看来陆家嘴这条线索是断了,更何况Q也不一定就是个金融才女,说不定纯粹是家里有钱,但是有一点我肯定没推错,单单冲着Q一身名牌打扮,她肯定是个白富美。那么,抛开陆家嘴这个限定,我只能来找找有没有哪里可以看到白富美爱在哪儿逛街了。

白富美人均消费次数图

白富美消费频率最高商户排名

我在找到这两张图时,内心是雀跃的,就连旁边的R似乎也闻到了胜利的希望,在那儿开始傻笑。从这两张图上来看,要想偶遇R的梦中情人Q,咱就得往市中心去,静安寺商圈明显是个风水宝地,根据消费频率最高商户图,星巴克又显然是个不二之选,那么久光百货的星巴克则更是优中之选!地点到这儿总算是定下来了,接下来就只要看时间了,我哼着小曲儿,顺利地找到了商圈人流时变图和白富美消费时间图:

商圈人流时变图

白富美消费时间图

堪称完美,这样一来,守株待兔看来已经是瓮中捉鳖了,只要带着R在上午的9点到下午3点,等在久光百货的星巴克,根据我在本科险些挂掉的概率论推算,我们将有巨大的把握等到Q的出现!我回头的一瞬间,被旁边满血复活盯着屏幕的双眼熠熠生辉的R吓了一跳!

第一用“夜店”作为评价标准,使用免费工具,从百度地图中爬出“夜店”信息点;

第二步:希望解决“上海夜店都在哪” ,想到快速在地图落点,并观察他们的聚集度;

第三步:使用在线工具BDP和地理分析工具ArcGIS呈现热图,进一步解读上海的“夜中心”

真正学会数据技能,44分钟当然不够。但无论你选择什么样的学习方式,学会总结套路,一定会有事半功倍的效果。

城市数据团拥有一颗想通过数据认识世界的心,我们的文章涉及房产、城市、娱乐、生活等各个方面。所以,我们每研究一个新的领域,都要经历从一无所知开始的迷茫。

正如接到老板的新任务的你,先需要构建一个工作框架一样,我们想尽快地了解一个新的细分领域,用数据描述事物背后的秘密,就必须总结“数据分析”的整个套路:

确定主题——数据采集——数据分析——细化主题——数据可视化。

城市数据团数据研究思路图,节选自《数据不说谎——大数据之下的世界》一书

零编程网页爬虫

Python网页爬虫

Excel&Stata数据分析

QGIS空间分析

后期更是会教您做出各种赏心悦目的可视化图表

这是一个什么样的课程?

数据达人培养计划是一个组合课程,以“搞得到数据,做得了图表,出得了报告”为目的,培养学员完成从爬数据到数据分析出成果的整套数据技能。

课程内容

课程分为三大板块,共有130+节小课程,包括:

  1. 如何进行数据采集

  2. 如何清洗、整理、分析数据

  3. 如何将数据可视化

板块一:数据采集

这个部分包括《爬虫入门,零编程数据爬取攻略》和《从零到一,Python网页爬虫攻略》,课程将从零编程和编程两个角度为学员提供爬取数据的技能:

板块二:数据分析

这个部分的课程为《小白逆袭,数据分析实战进阶训练》,包括Excel及其更新插件Power BI、Stata大数据处理和Qgis地理数据分析多项技能,让你全方位了解数据分析的基本方法,高效入门数据学习。

板块三:数据可视化

这部分的课程包括《美感培养,数据可视化专题强化》,课程包括Power Map、BDP、PPT等工具的使用方法,也包括如何从审美角度提升数据可视化的美观等,在学习完前面两章课程后,这个部分将是强化技能的重要一环。

如果想了解更多详情,请点击阅读原文看课程目录和试看视频。