沉迷短视频APP的时间越来越长,逛电商网站逛到停不下来,刚在某一平台上搜过的内容转眼又出现在另一平台上……关于智能推荐算法带来的情绪焦虑和不安全感,越来越多的人正在感受压力。
12月7日,中共中央印发《法治社会建设实施纲要(2020—2025年)》,其中明确提出要制定完善对算法推荐、深度伪造等新技术应用的规范管理办法。政策的制定必然能在某种程度上对行业规范做出引导,但距离真正戳破推荐算法的“过滤气泡”,我们还需要什么?我们还有多远的路要走?
1
推荐算法是如何“读懂”你的
“啤酒与尿布” 的故事是推荐算法的开始。上世纪90年代,美国沃尔玛超市发现“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中。经过分析,他们发现原因是年轻爸爸去超市购买尿布时,经常会买点啤酒犒劳自己。因此,沃尔玛将这两种商品进行了捆绑销售,最终获得了更好的销量。
“啤酒与尿布”的故事 | 图源网络
自互联网诞生以来,信息分发形态经历了门户网站时代的广播式传播和社交媒体时代的关系链传播。近年来,随着移动互联网、大数据和人工智能的发展,信息过载问题日益严重。而智能推荐算法解决了用户痛点,帮助用户在海量的信息中找到自己感兴趣的内容。人类正迈向一个智能媒体时代。
总的来说,推荐算法主要有协同过滤、基于内容的推荐和混合推荐等类型。
协同过滤可以分为基于用户的协同过滤、基于物品的协同过滤和基于模型的协同过滤。
基于用户的协同过滤的基本原理是,根据所有用户对物品或者信息的偏好,发现与当前用户口味和偏好相似的用户群,然后基于这些用户的历史偏好,为当前用户进行推荐。
基于物品的协同过滤的基本原理也是类似的,只是它使用所有用户对物品或者信息的偏好,发现物品和物品之间的相似度,然后根据用户的历史偏好信息,将类似的物品推荐给当前用户。
基于模型的协同过滤利用用户的历史偏好信息,构建用户和物品的交互矩阵,用机器学习的思想来建模解决推荐问题,方法包括关联算法、聚类算法、分类算法、回归算法、矩阵分解以及隐语义模型等。
1994年,美国明尼苏达大学GroupLens研究组推出第一个自动化推荐系统GroupLens,提出了将协同过滤作为推荐系统的重要技术,也是最早的自动化协同过滤推荐系统之一。
基于内容的推荐侧重于通过对象的属性信息来进行匹配建模,进而寻找相似的用户或者物品。需要利用物品信息和用户信息生成特征向量,为物品和用户生成画像。这也是个人数据被利用的典型途径。构建用户画像的方式很多,最常见的数据来源依然是用户的个人资料和浏览数据,包括性别、年龄、地区、点击、搜索记录、页面停留时间等,从而为用户建立起一套极为复杂的标签体系。
典型的用户画像 | 图源网络
混合推荐是指将各种推荐方法组合到一起,这样能避免或弥补各自推荐方法的弱点。混合推荐的思路有:
(1)整合多种推荐算法到同一个算法体系中,由这个整合的推荐算法统一提供推荐服务;(2)将多个推荐算法的结果混合起来,推荐最终结果给用户;(3)根据某个判别规则来决定在某种情况发生时,利用某个推荐算法的推荐结果;(4)一个推荐算法生成的推荐结果给到另外一个推荐算法作为输入。
当然,现阶段有更多深度学习技术被应用在了推荐算法领域。以多层感知机(MLP)为核心,研究人员通过改变神经网络的结构,构建特点各异的深度学习推荐模型,主要方法有改变神经网络的复杂度、改变特征交叉方式、注意力机制、序列模型、强化学习、嵌入技术等。除了利用用户历史偏好信息,最近更多的研究开始利用用户社交关系和商品知识图谱等附加信息,希冀获得更高效率的推荐模型。
与传统机器学习模型相比,深度学习模型的表达能力更强,能够挖掘出更多数据中潜藏的模式;且深度学习模型结构灵活,能对不同应用场景做出灵活改变。
智能推荐算法已经应用在了各大互联网C端内容产品中,包括人民日报等主流媒体也在其移动端应用了推荐算法。推荐算法的更新迭代在商业上取得了良好的效果,也改变了信息分发形态,但越来越多的人对手机“上瘾”,沉溺于方寸之间的形形色色之中。
形形色色的互联网产品 | 图源网络
2
你我之辈,困在算法里
“现在谁还看电视啊,抖音多有意思。”家住北京朝阳区的方阿姨告诉作者,“老头儿也只是在电视上看看新闻,其他时间都是拿着手机看今日头条、抖音什么的。”
方阿姨老两口是当代很多老年人生活的写照。就连老人都不看电视了,年轻人更是如此。
“现在基本就是手机和电脑,家里的电视几乎不怎么开,开的话也只是用来手机投屏。当时买房子都没想着买电视,但父母非说一个家哪能没有电视。”刚工作两年的小谭在江苏徐州贷款买了自己的第一套房,“下班之后很舒服的事情就是躺在床上刷短视频,停不下来,但又很开心。”
随着智能手机的普及,中国网民数量达到前所未有的高度。《中国互联网络发展状况统计报告》显示,截至2020年6月,我国网民规模达到9.40亿,其中手机网民规模达9.32亿,占比99.2%。我国短视频用户规模达8.88亿,这说明近九成的网民都在看短视频,且短视频人均单日使用时长为110分钟。
除了推荐算法造成的夸张的使用时长,更有“过滤气泡”效应影响着社会和人的关系。
“过滤气泡 (Filter Bubble) ”一词最早由社会活动家Eli Pariser在其2011年出版书籍《过滤气泡:互联网向你隐藏了什么》中提出。过滤气泡是指以大数据与算法推荐为底层架构,根据用户的使用时间、地区以及浏览习惯生成用户画像,并通过算法技术为其呈现独一无二的界面体验。这种网络针对个人化搜索而提供筛选后结果的推荐算法,被称为“过滤气泡”。
信息的“回音室”效应 | 图源网络
哈佛大学法学院教授桑斯坦在其著作《信息乌托邦》中,则研究了“信息茧房”(Information Cocoons)和“回音室”效应(Echo Chambers)。桑斯坦认为,信息的协同过滤会造成信息窄化,使群体成员倾向于加强与本群体的联系,忽略同外部世界或者其他群体进行信息交流,导致群内同质、群际异质现象,促使“信息茧房”的产生。处于“信息茧房”之中的公众有如把自己封闭在自我设计的回音室里,每个人听到的只是自己的回音,相同的意见会不断被重复,异质的观点会被过滤掉,这无异是一个作茧自缚的过程。
3
人性和社会面前,算法有更多可能
人们常常讨论,技术到底是不是中立的。作者认为,任何一种新技术的诞生和发展都是社会变革以及社会阶层的驱动,技术在社会里摸索创新,又反过来作用于社会。技术是为了满足某些人的某些需求而存在的,包括人性本质和商业价值等。那又怎么能说技术是绝对中立的呢?
事实上,我们每个人都困在系统里,困在算法里,差别只在于程度的不同。
但从另一个角度审视智能推荐算法,它是智能媒体时代下的一种信息分发形态,但不是全部。人的需求在不同的场景下是不同的,信息分发方式也不一而足,不同类型的分发方式互补配合,才构成一个和谐共生的媒介传播环境。例如,当你想学习摄影技术时,你会主动在短视频平台的搜索框搜索摄影相关的短视频;而当你无聊时,会点击到推荐页面,漫无目的地看看各种类型的短视频。在这样的意义下,“推荐”与“搜索”实际上构成了互补的分发形态。
但推荐算法还能再更智能一点吗?能让它自己戳破自己的“过滤气泡”,带用户发现更大的世界吗?
对于“过滤气泡”或“信息茧房”的消除,注定是一场技术与人性的较量。
一方面,需要技术人员对算法在更高层面进行优化,将人性心理与社会结构考虑进来,在保证用户体验的前提下触摸用户边界。另一方面,推荐的本质是一种信息传播模式,这就需要媒体层面的积极探索,发挥媒体的社会功能性。目前,今日头条和腾讯新闻等新闻资讯类平台已将智能推荐和人工推荐结合起来,在实现信息“千人千面”的同时,进一步实现“一人千面”。
最后,推荐算法的终点是你我这一个个普通人,而人总会有主观能动性。人类创造技术,但不应该让技术束缚了人类。多尝试不同内容,寻找符合自己调性的平台,看到不喜欢的东西点一下“不感兴趣”,拓宽线下的生活边界……无处遁形的算法也会成为高效率的利器。
这个世界很大,没有东西能够困住一个人。
参考文献:
[5]童淑婷. 推荐算法的“前世今生”[EB/OL].https://mp.weixin.qq.com/s/frUZJE6VVAhpfDWpjZumKQ.2019-08-23/2020-12-15
本文为原创文章,请勿抄袭、粘贴式转载!