学习计算思维书籍 | 追赶流行趋势 | 糟糕的选择06 | 逻辑少年 | 计算思维

首页 » 家庭教育 » 学习计算思维书籍 | 追赶流行趋势 | 糟糕的选择06 | 逻辑少年 | 计算思维

学习计算思维书籍 | 追赶流行趋势 … 版权说明:《Bad Choices》是由Ali Almossawi著作的一套计算思维书籍,可以通过https://bookofbadchoices.com/访问本书英文版本。书中通过一系列人物的故事场景,以插画的方式展示了一个个现实生活中遇到的问题,进而引出了一些计算思维的问题,内容丰富且非常有趣。本书的目标读者是计划学习编程的儿童、学生,通过阅读本书可以开拓眼界,培养计算思维习惯。

学习计算思维书籍 | 本章背景故事(请孩子阅读,家长伴听)

学习计算思维书籍 | 小F最近搬家到了一座以爵士音乐闻名的城市,为了尽快适应城市节奏,他想要尽快的了解和学习前沿的流行音乐文化,并决定真正开始认真听音乐唱片,进而提升自己的音乐领悟力和鉴赏力。

目标:聆听有影响力的音乐。


方法一:找一位有影响力的艺人听他/她的歌,然后再找一位有影响力的艺人听他/她的歌,以此类推。


方法二:去一家音乐商店,挑选几首歌曲,然后听一听。

思考完成再接着往下看哦!

追随流行趋势 | 分析过程(请家长+孩子分段阅读思考)

一般而言,我们认为方法一是比较合理的方法。近些年,由于智能推荐引擎得到了广泛应用,搜索引擎在根据我们的口味策划调整内容前,不会给我们推送很多内容。方法一从根本上,可以归结为是一种称为关联分析的方法。它表示,如果我们有一组具有共同属性的事物,诸如歌曲、视频或者汽车中的组件,那么通过分析它们之间的关系——它们的关联度——我们可以回答诸如“这些东西中哪一个最重要?”之类的问题。这一点正是我们最为感兴趣的。

对于很多人,尤其是大学生而言,可能比较熟悉的一个场景是参考资料的引用。通常,出版物的引用,即指向它的其他出版物的数量,被认为是该出版物重要性的一个很好的指标。这种为指向它们的项目数量最多的项目分配更高价值的方法,正是帮助类似Google这种搜索引擎声名鹊起的方法——它允许其首页搜索结果与用户的相关性,比竞争对手的高得多。

接下来,我们将研究两种类型的关系:事物关联的程度以及这些关联事物间的相似程度。

现在,假设我们收集了世界上所有的歌曲,并且我们通过两首歌曲的对比,能够知道其中一首歌曲的艺术家影响了另一首歌曲的艺术家。我们的图表最初可能如下所示:

说明:A影响了B,箭头指向B

如果我们对所有歌曲都这样做,我们最终会得到很多圆圈和很多箭头链接,或者一个网络。但是这个网络缺少一条关键信息,即间接关联。举例来说,如果BOB MARLEY影响了ERIC CLAPTON,ERIC CLAPTON又影响了PAUL MACCARTNEY,那么我们会说BOBO MARLEY的影响也延伸到了PAUL MACCARTNEY。

为了捕捉这些间接关联,我们采用一种叫做矩阵乘法,在该过程中,我们将艺术家表示为矩阵,从左侧第一行开始,比如从BOB开始,BOB影响到顶部的艺术家的任何位置放置一个点,然后逐行向下,每次都更新到的关联。最后,我们将得到如下图所示的结果。

矩阵关联

关联度

通过计算每个艺术家行中的点数,并查看具有很多点的行,即影响了许多其他艺术家的艺术家,我们可以确定一组具有高影响力的艺术家,从而确定他们的歌曲。

这个过程与所处的领域无关——我们可以将完全相同的步骤应用于汽车零件,例如,通过简单地改变关联的含义。在汽车零件的情况下,一个点可能表示物理依赖,如车轮依赖于轴,轴依赖于底盘。

关联分析的一个实际应用是帮助回答一个问题,例如“收到了很多投诉。我们认为这是由于该车型的高度复杂性。你能给我一份关联最高的部分的清单吗?”轮子直接或间接地连接到其他两个部分。是否有部分与其他四个部分或五个或十个部分相连?就艺术家而言,更多的关联是一件好事,因为它表明了影响力。就汽车零部件而言,这可能是一件坏事,因为它可能预示着潜在的故障倾向。

这个开始对我们来说很有用。然而,我们选择从最具影响力的艺术家转移到第二大影响力的艺术家,可能会损失掉艺术家的种类,并产生较大的差异,比如从一位古典音乐跳到了流行音乐。比如某些时候,我们更希望从一首歌曲跳到另一首与我们正在听的歌曲相似的歌曲,因此我们将采用另一种不同的方法。

相似性

确定哪些歌曲可能与特定歌曲相似的方法之一,是查看这些歌曲背后的艺术家。

确定哪些艺术家可能与BOB MARLEY相似的一种方法是考虑听众——有多少听ERIC的人也听BOB?有多少听 Stevie Wonder 的人也听BOB的?

如果我们对所有艺术家都这样做,并将结果值从高到低排列,我们就会知道哪些其他艺术家可能与 BOB Marley 最相似。这个过程有点微妙,可以通过使用一些更高级的方法来改进。例如,使用所谓的 Jaccard index(雅卡尔指数)而不是简单地计数,普通听众可以帮助避免被拥有许多听众的艺术家歪曲的结果。

每当您打开搜索引擎的结果页面,或在社交媒体网站上看到您的新闻提要时,您都会看到这种分析形式的结果,或者在购物时获得有关“您可能想要购买的物品”的建议,专业社交网络网站上的“您可能想联系的人”的网站或建议。线上的报纸也这样做,通过根据文章所涉及的主题对文章进行建模,然后考虑该文章与其他文章的相似程度。视频流媒体服务的全部竞争优势,可能依赖于预测订阅者喜欢什么并推荐与之相似的内容。在最近的一篇博文中,Netflix 充实了他们在推荐电影和电视节目时考虑的信号,其中不仅包括内容类型——“你正在看一部科幻节目,你可能会喜欢这个其他科幻节目” ——还有一个人所在的地区——“你在看烹饪节目,但你在印度,所以你可能会喜欢这些宝莱坞电影。”据估计,Netflix 80% 的内容浏览量来自其推荐引擎。正如我们在第 4 章中看到的,这种联系加上正确的分析可以提供洞察力。

方法二应该是无需多言的,因为它本质上是一个不知情的选择。如果我们在唱片店,我们可能会走到一个盒子前挑选几张唱片。与所有不知情的选秀一样,我们无法知道每个艺术家离我们想要的目标有多近。即使我们遇到碰巧有影响力的音乐,我们也无法知道这一点。

方法二应该是不言而喻的,因为它本质上是一个不知情的选择。如果我们在唱片店,我们可能会走到一个盒子前挑选几张唱片。与所有不知情的选秀一样,我们无法知道每个选秀离我们期望的目标有多近。即使我们遇到碰巧有影响力的音乐,我们也无法知道这一点。

通过使用关联分析的结果,我们不再需要随机猜测从我们感兴趣的事物世界的哪个位置开始。如果小F要利用这一技术进步,我们可能会将他可用的两种方法描述为如下图所示,方法二在最差的情况下花费线性时间,方法一与方法二一起使用 在最差的情况下花费线性时间,而方法一花费恒定时间。

这一切对小F来说意味着什么?他现在是否像他希望的那样有了流行元素的加持?我们无法知道,但我们的目标是帮助他完成旅程而不是找到目的地。

学习新事物的陷阱之一是从错误的地方开始,这可能会导致诸如对主题幻灭或放弃等挫折。关联分析的结果是一项由 Web 推动的创新,也许很快会由家庭和办公室中发展到交互式的设备,这是像小F这样好奇的人可以获得新品质的一种方式,而不会变得不知所措或走弯路。

在小F的案例中,他选择放弃旧的随机方式,并采用为他分析数百万首歌曲的推荐技术,这将帮助他比其他方式更快地加入潮流行列。最近,他已经鼓起勇气报名参加了一些当地的音乐爱好者聚会,所以情况看起来还不错。

今天学习结束了,下面一起来通过实验体会一下学到的方法吧!

学习计算思维书籍 | 本章延申练习(请家长+孩子共同完成)

关联推荐是我们经常会在看电视剧或者电商相关的网络环境中遇到的,你是否曾经有体验过呢?说出一个最有印象的案例,或者打开一个动画片网站,比如爱、优、腾其中的一家,在播放完小猪佩奇后还有什么其他的推荐影片吗?他们是同样类别的还是不同类别的呢?

Disclaimer: This english book is written by Ali ALMOSSAWI and souce from https://bookofbadchoices.com/

Written By

li, Mickey