首页资讯科技 算法“统治”世界

算法“统治”世界

你是否有过这样的体验,在同一个视频平台看久了,推送给你的都是某些类型的视频,而恰巧这些视频都是你爱看的,一个接一个,根本停不下来。当你在某一个游戏里玩的时间越久,就越难抽中好的道具,可一旦你删掉账户重新来过,好的道具就会迅速来到你身边。按照…

你有过这样的经历吗?在同一个视频平台看久了,推给你的视频都是某几个类型的,而恰好这些视频都是你喜欢的,一个接一个,根本停不下来。在某个游戏里玩的时间越长,越难抽到好的道具,但是一旦你删除账号重新开始,好的道具就会很快来到你身边。按照现在的技术,你每启动一个APP,就变成了AI算法里的一个虚拟ID。你看到的任何东西,任何商品,都是由算法决定的。对于很多不喜欢被自然控制的人来说,这种被操纵的感觉是相当不好的。所谓知己知彼,只有知道算法是什么,才有对抗的可能。

要理解什么是算法,我们先想象一个场景。几千年前,一个古代人试图用他对已故祖母如何制作面包的记忆来制作自己的面包。问题是他真的不知道该怎么办。他犹豫着要不要把麦粒放进开水里……折腾了几个小时,他终于对自己说,这可能是个馊主意。这种古人的困境正是我们都面临的——我们遇到某个问题,却不知道如何解决。我们思考解决方案,反复尝试探索实验,顺便有了一点意外的发现,直到成功……或者失败。

然而,真正的面包师不会这么做。他们不会为每一批面包都做一份烘焙食谱,因为他们已经掌握并记住了面包的烘焙方法。多亏了面包食谱,面包师可以每天为我们提供面包。事实上,人类文明的发展不仅仅是因为一些人的发明,更是因为其他人“抄袭”了这些发明,使得一些东西得以不断改进。

所以,我们不能忽视面包食谱的珍贵。首先,食谱减少了不确定性:多亏了它,面包师知道,除非有突发的灾难,否则面包就可以做晚饭了。有了这个食谱,任何人都可以不用任何想象力或天赋就能做出面包。即使我们没有烤面包的天赋,我们仍然可以从网页上找到合适的食谱,并在更具想象力和天赋的面包师编写的方法的帮助下,使用劳动力制作面包。最终,这个食谱成为了人类遗产的一部分,在几千年的历史中代代相传。

在这里,菜谱就是算法,我们对“算法”这个概念有了一个初步的定义:算法就是解决问题的过程。从这个定义中不难看出,从人类历史早期开始,我们就一直在发明、使用和传播各种各样的“算法”,用于烹饪、雕刻石器、捕鱼、种植扁豆和小麦等等。

一般来说,一个算法就是一套核心的计算规则,要么是人工先验,要么是机器学习。从某种意义上说,人类本质上是一种由自然界进化而来的算法,基因是算法的最小单位。第四次工业革命之后,算法对生活的影响已经到了难以想象的程度。

一件有趣的事情,1882年初,尼采收到了一台德国制造的球形打字机。当时,他曾因视力下降而彻底放弃写作,但这台原本为聋人发明的奇怪机器,却将这位伟大的哲学家从功能退化中拯救了出来。在球形打字机的帮助下,你每分钟可以打800个字符,即使你闭上眼睛盲目打字。第二年,尼采写了《查拉图斯特拉如是说》,其中第一部分的完成只用了10天。

这台打字机不仅带来了写作的便利,也影响了尼采的思维和写作风格。不同于用笔写的《悲剧的诞生》,查拉图斯特拉如是说,长篇大论的思辨深度急剧减少,短小精悍的谚语和论断比比皆是。一个熟悉尼采写作风格的朋友注意到了这种变化,写信问:这种变化和打字机有关吗?尼采的回答毫不含糊:“你是对的。我们使用的书写工具参与了我们思想的形成。”

这个例子表明,媒体技术从来就不是一个中立的工具。当我们使用它的时候,它又会反过来感染我们,小到个人的思维,大到整个社会的逻辑。在智能手机、短视频、推荐算法等技术遍布我们生活,几乎成为知识和想法唯一来源的今天,它们会带来哪些改变?

以手机为例。现在智能手机的底层硬件加速,以及你使用的几乎每一个大型软件应用,大多都是由算法驱动的。我们在这里做一个实验。你可以在手机里找三个常用的软件,看看它们是否符合后面提到的一些特性。

当然,有人看到这个,肯定会想,把手机关了,别上网了,就完了。先不说不用手机的可行性,现在的公交系统基本都是调度AI在操作。你经过的每一个路口,天网里的视觉AI都会记录识别。即使呆在室内,水电能源系统也是通过算法分配的。换句话说,只要你不回到刀耕火种的原始生活,你以后就摆脱不了算法。

我们认识世界的基石是理论,比如牛顿力学,相对论,进化论。当一个理论被观察预测和证实时,它就是“科学的”。例如,牛顿力学预测了地球上某一点的日出和日落时间。人们可以将预测的时间与实际观察到的时间进行比较。如果这两个时间不一致,说明理论有问题。

有些理论可以用算法来表达,比如计算太阳系行星轨迹的算法。这个算法理论叫做“模型”。鉴于其本身的算法性质,该模型是通过计算机“模拟”相关现象。人们开发了许多现象的模型,如大气和海洋的演变、大脑功能的运行模式、板块运动、城市发展、股票价格变化、人口流动等等。

牛顿力学等经典理论往往是以几个方程为基础的。模型比较复杂,涉及面比较广。例如,城市发展的模式必须考虑人口的发展过程,以及经济、政治、地理等影响因素。

鉴于这种复杂性,有些现象即使不能完全理解,也可以进行建模和模拟。牛顿的经典物理学家一步一步掌握方程、推理和解释结果。气象模型极其复杂,因此我们无法遵循所有的计算并简明地解释结果。这种模型可以很准确的预测天气,告诉我们明天会不会下雨,但是不能解释为什么会下雨。

原则上,模型应该受到与理论相同的约束:模型的预测结果应该与观测结果一致,否则模型就是不正确的。然而,由于模型的复杂性,我们不得不重新审视“不正确”一词的含义。当理论的预测结果与观测结果不一致时,该理论应该被放弃,或者至少需要重新检验。然而,复杂模型的预测取决于许多参数。如果只是与一些观测结果稍有出入,该模型在实际应用中不会被抛弃。

当预测结果与观测结果相差太大时,我们会尝试引入新的参数,这会使模型更加复杂。因此,有缺陷的模型很少被抛弃——当预测结果与观测结果不同时,我们试图改进模型。算法模型让人们陷入一种自相矛盾的境地:算法模型可以研究比经典理论复杂得多的现象,因此代表了科学领域的延伸;但是算法模型的结果很难解释,所以预测结果和观测结果很难比较,模型的科学性会减弱。

不同类型的算法通常在同一系统中使用。举个例子,在无人驾驶的火车上,有些算法控制火车的速度,有些算法控制车门的开关,有些算法控制交通管理。概述全面展示了传统算法的多样性,同时人们也在不断地通过改进现有算法和设计新算法来丰富算法世界。

在这里,是时候进行一次灵魂拷问了——我们为什么要对抗算法?其实每一个AI或者算法都是以人为核心设计的,都是为人服务的。AI本身不好也不坏。归根结底,当前的人工智能只是一种工具,其影响取决于使用它的人的意图。

如果是好意,比如降低犯罪率,提高地铁效率或者减少交通拥堵,大家都会喜欢。但如果算法的意图变成了让用户不断地花费时间和金钱,一切为了流量和利润,那么AI就成了资本的帮凶。

我们可以简单的把算法分为两类:一类是消费算法,一类是生产算法。对于消费算法,AI只有一个意图,就是让用户消费尽可能多的东西,比如内容、商品或者信息。典型的有知乎、Tik Tok和淘宝。而生产算法则是将用户作为生产要素进行更合理的分配和调度,从而提高生产效率,比如服务体系中的外卖小哥和网约车司机。

无论是哪种算法,其运行方式本质上都是由系统中最高权力机构的意图决定的。我们可以把这种现象称为算法异化。这里以送货员问题为例——配送系统中的调度算法是典型的产生式算法,其核心是路径规划和实体匹配。简单来说,就是如何更高效的让生产者从A点到B点。

与传统的人工规则调度相比,该算法节省的时间旨在让生产者有更充裕的时间安全驾驶,让消费者减少等待时间。但后来,无一例外,都成了压榨劳动时间的绝佳工具。在掌握系统的资本看来,节省下来的时间就是金钱。我与道路安全和司机安全有什么关系?

结果外卖时间从一个小时变成了30分钟,但事故率不减反增,用户体验越来越差。连饿了么这样的平台都想出了“你愿意再给我5分钟吗?”这个神奇的操作。本质上是把算法系统的意图矛盾转嫁给了生产者和消费者,导致了一个现象——整个系统的必要劳动时间减少了,但生产者却越来越累。究其原因,是资本的工具,从工厂、机械设计升级到系统、算法,本质上是剥削剩余价值,从人民群众身上获利。

与直观地将工人困在工厂里长时间操作机器相比,通过AI技术的剥削更加隐蔽,难以察觉。可惜生产算法没法比,因为外卖小哥和网约车司机都只是系统的生产要素,就像车间里的零件一样。对于分配的任务,他们只有两个选择——接不接,而在生活的压力下,大多数人都没有选择不接的自由。对抗是无从谈起的。虽然很残酷,但这就是现实。

看到这里,如果你有一些选择的自由,也许你应该庆幸。得益于这些自由,你可以根据以下内容,尝试对抗消费算法。消费算法的核心有两个:推荐机制和成瘾机制。推荐机制的初衷是让用户多消费,从而产生流量收入,但会造成内容同质化,也就是大家都听过的茧房信息。

信息茧房,顾名思义,就是在与同质信息不断接触的过程中,被锁在一个由算法编制的信息茧中,形成一个孤立的茧房,进一步造成回音室效应,过滤气泡。前者是指相似信息的重复,形成只有相似观点的回音室。人们的态度在类似信息的重复播放中增强,进而形成群体偏见。比如农村女权,饭圈文化。

气泡过滤就是算法把不符合用户兴趣的信息过滤掉,只把获得相似群体积极反应的信息筛选掉,导致你越来越能接受符合你三观的信息,逐渐深入人心。同时,远离和忽略你所在群体之外的信息和观点,导致认知撕裂和各种网络与现实的冲突。这就是为什么魔幻现实主义在今天如此受欢迎。

有意思的是,虽然“信息茧房”这个名词由来已久,但并没有任何信息可以从根源上解释它的存在。似乎人人都在点上,江湖人往往都是自己找自己的。我们今天就试着无武德来谈谈信息茧房存在的根本原因。

首先要了解算法理论中一个著名的EE均衡问题——第一个E代表Exploit,就是基于已知的利益剥削用户的时间和金钱。第二个E代表Explore,即探索用户的新兴趣,扩大用户的认知。这两个E在变,算法在权衡。第一个E越大,系统的短期利润越高,茧房效应越强。第二个E越大,短期回报越低,长期体验越好。

所以,似乎每个有追求的公司都会选择第二种。但现实是,所有尝试过第二个E的公司,最后都放弃了这个选择,想尽办法增加第一个E的权重,显然,短期可开发的收益对资本来说至关重要,而探索只能被市场和投资人视为融资时的技术噱头。这是信息茧房存在的根本原因。

我在这里提一下AI会做什么让这个信息茧变得更强。让我们以一个新闻发布的应用为例。首先,AI需要了解你。“你”代表的是一个用户画像——它通常由几个维度组成:自然属性、行为轨迹、阅读习惯。

属性自然包括你的性别、籍贯、年龄、身份、学历、职业等。有的是终身不变,有的是阶段性变化。这些信息的收集主要是通过你在APP上的注册信息和开屏问卷来完成的。你的手机型号也是一个参考指标。比如用苹果的人和用红米的人一定是两个群体。行为就是你去的时间和地点。这是对场景的判断,引申到对人的行为习惯的判断。收集这些信息,主要是通过手机定位(只要你用智能手机,基本相当于裸奔)。阅读习惯就是你的点击、评论、转发、搜索、订阅、停留时间、打开频率等。包括你是喜欢看短视频还是对文字情有独钟。

用户画像最难的是人性的刻画。“知人知面不知心”就是这个道理。你所关注的和你的出身密切相关,但会随着时间和环境而改变。兴趣分长短,爱好分强弱。更何况在很多情况下,用户的真实想法并没有在阅读行为中表现出来,而是需要“猜测”,这对算法提出了难以逾越的挑战。

那么,如何画出更准确的你呢?“路遥知道马力早就吃香了。”翻译成算法语言就是以更长更全面的方式获取用户信息,积累更多更全面更深入的数据。比如关于地理位置,是否可以位于商圈和居民区或者用户站可以实时定位的地方。定位越精准,用户画像越精准。我们也经常用“阅人无数”来形容人的辨别能力。如果一个人已经和很多人在一起了,就很难再欺骗他了。

算法也是。用户数量越大,后台记录的规律性的东西越多,越有助于判断某个用户的行为习惯。所以超级平台(DAU过亿)的用户画像准确率肯定比一般平台高。马云的大数被称为“新时代的生产资料”,数据本身就是用户行为的数字化反应。

分析完“你”,就该分析内容了。是的,对于AI算法来说,仅仅分析用户是不够的,还要分析自己的内容。对于一篇文章或者一个视频,AI也可以拆解成几个维度。比如域:也就是内容是关于什么的。如时事、财经、科技或体育;体育可以进一步细分为足球-中超-国安-国安的球员。拆卸越精细,越有利于精准分发。

此外还有体裁:内容形式有文字、图片、视频、音频、直播或140字以内的短内容。作者:即相关内容是谁创作的?质量:它有两个维度,第一是编辑判断,第二是数据判断。编辑的判断是选题、采访、写作、包装;数据通过点击、分享、收藏,以及用户停留的时长来判断,相关内容是否受到用户喜爱。

画像的内容是由“标签”定义的。例如,我们可以给《战狼2》贴上电影的标签,动作片,战争片,由吴京主演,票房很高。标签可能来自于内容的作者,平台的审核者,更多的来自于对算法的理解。那么,算法是如何给内容贴标签的呢?通过对关键词、关键句子甚至全文的识别。

识别的过程就是机器学习——我们不断地把文章输入其中,引导它做出判断,就像教孩子阅读,分析段落大意,写出大意一样。该算法对文章进行标记,最初依赖于关键词。比如带有“老虎+梅花鹿”的文章,会被定义为“动物世界”;文章将“老虎+贪官”定义为反腐。当大量的文章被算法学习后,算法的标签就越来越准确。

如果是视频的话,算法的标签难度会比文章大很多,因为要找到的关键词很少。所以算法对视频的理解依赖于更海量的数据,比如Aauto Quicker,每天有几千万条内容上传。通过人脸识别等系统,算法会逐渐识别出视频中出现的人、事、场景;第二,很多平台鼓励作者贴标签,这样在算法判断之前有一个初步的分类。

但内容画像的真正难点在于理解文章所表达的价值观。这就好比用户画像中最难刻画的是人性。很多内容只能用文字来表达。王国维在《人间花刺》中提到的境界,金庸在武侠小说中描述的“无招胜有招”,都是目前算法无法理解的。所以算法再精准也比不上高手。那么,某些文章或视频能从浩如烟海的内容中脱颖而出,登上头条,背后的逻辑是什么?这就涉及到另一个关键词——护理。

大家都很熟悉“关心”这个词。我们希望更多的人关心自己。当然,如果有人能关心,也是一种幸福。但对于内容分发AI算法来说,“关心”还有另一层含义——它是指某个用户对某个内容的行为,比如点击、点赞、评论、收藏、搜索、订阅、转发,以及在一篇文章或视频中的停留时间,看到一个位置就退出,甚至直接点击“报告”等。

这些行为会被算法模型如实记录下来,以一天为周期形成一个用户日志。时间越长,日志积累越多,你“关心”的东西就越清晰,你的用户画像就越完整。我们可以再分析一下这些具体的行为。从点击到订阅,逐渐深入。翻译过来,就是越来越“关注”。如果把点击看成搭讪,订阅基本上就相当于确认恋爱关系。而转发,则是用你的关心去影响别人。“你看,我女朋友多好啊!”而停留时间的长短就是你一天要和TA待多久。

那么问题又来了。如果一个人点击文章A 5次,搜索文章B一次,这个用户更关心谁?因为这个用户更关心谁,决定谁是头条,谁是第二。这个问题其实没有标准答案。因为涉及到算法模型的使用,或者具体怎么算,就类似于用加法还是乘法。在这个思考问题中,我们没有设定一个前提——我们追求的是什么?

如果你追求的是点击率,当然应该是按照什么东西推什么东西的逻辑;但如果追求的是用户粘性,就要推用户搜索的内容。其实算法的背景是模糊的,不可能有类似“点击率占50%,搜索占50%”的计算方法。所以,我们说它是一个“黑匣子”。在80年代,模糊计算正是这样一个概念——它是“模糊的”。根本不是比例的问题,而是要设定一个明确的目标——哪些数据要提高?是用户的停留时间长短,还是用户的留存率?然后,根据这个目标,修改算法。

它叫做“不要忘记你的创新精神,这样才能实现你的最终目标”。在内容编辑和算法工程师的交流中,这几乎相当于一道“天然护城河”。编辑的思路是:经验判断+价值检验——数据不好再改;而算法工程师的思路是:要达到什么数据指标——根据什么制定策略——要引入能激发相关数据的内容。这相当于解决数学证明问题的两种逻辑:编辑从已知条件出发,奔向待证明的结果;而算法工程师是从什么要证明,什么样的已知条件反推出来的。

问题又来了。这两种方式哪个更好?从效率的角度来说,当然是算法流程。因为喜欢什么就推什么,喜欢什么就投什么,点击率肯定高。从传统的编辑流程来看,标题和两篇文章是由编辑的选择决定的。编辑它,你作为用户没有选择。

现在,算法流完成了“从人找信息到信息找人的飞跃”——以前,我们要卖报纸、调频率、搜关键词才能看到自己喜欢的东西,而今天,你喜欢的东西会毫不费力地“跃上屏幕”。

从编辑到算法的流程,才是真正的从传统媒体到新媒体的转变。相当于计划经济向市场经济的转变。要在市场经济中生存,首先要有用户的概念,也就是“你”的概念。只有这样,现在的新闻分发应用才不同于以前的新闻分发软件。你觉得现在的新闻APP比以前的好吗?本质上不是新闻很精彩,而是新闻合你口味。

消费算法的第二个核心是成瘾机制,常见于游戏和短视频应用。与信息茧房不同,成瘾机制巧妙地利用了人的生理弱点。我们对消费品的愉悦本质上是大脑反馈机制的一种回报,由我们脑垂体中的前体物质多巴胺决定。人们往往认为多巴胺等同于快感,其实并不是快感本身,而是对快感的期待。

我们在用手机玩游戏时感受到的快感、兴奋感和满足感,其实是肾上腺素、生长素和内啡肽分泌造成的,但这些感受只是大脑神经暂时的电信号。我们享受的不是刷手机这个动作本身,而是刷手机带来的反馈预期。例如,你不会觉得我喜欢看Tik Tok,但这个视频会说什么?下一个视频可能更好?我不会再看了!或者在游戏里,让你觉得我这手牌能赢SSR,我一定会赢一局然后睡觉。

如此循环往复,你的时间和金钱已经在不知不觉中被算法安排得清清楚楚。看到这里惊出一身冷汗?有没有办法对抗算法?有趣的是,当你意识到自己身处信息茧房,这个茧房其实已经不存在了。所以,当你看到这里,消费算法中的一系列机制对你的影响不再是黑箱。一旦你了解了这些机制,你的想法就会逐渐改变。

如果单纯的意识到转化还是太慢,根本原因是AI算法获取了太多关于我们的数据。目前市面上常见的软件采集的信息远远超出你的想象,尤其是一些app在实名注册系统注册或安装时,系统授权要求越界。算法需要数据授权,至少表面上是这样。没有数据支撑算法技术,无米之炊是不可能的。

相信大家都听说过一些创始人的说法,中国人愿意用隐私换取便利。这是相当无耻的。人们接受,是因为不知道,也因为不知道,所以打不起来。安装软件时是否阅读用户协议功能授权?相信大部分人都没有阅读授权的习惯,但请记住以下两条规则——一是看到可疑的权限请求时,先发现再安装;第二,如果没有必要拒绝安装。

当然,在现在的环境下,保护你的信息真的很难。有条件的话,可以尝试用备用手机完成非必要app的注册和使用。切记不要在备用机上保存任何信息,如身份证照片、聊天记录等。将主手机的系统授权设置为最高级别,尽量拒绝信息阅读、照片阅读、录音阅读授权。同时注册一组不可见的临时邮箱或号码。有些不是长期应用,需要邮箱或者手机注册。使用临时身份可以避免短信骚扰、隐私泄露或被算法利用。

漫无目的的浏览会引发人类最本能的欲望、好奇和探索,进而陷入多巴胺成瘾模式。这就是为什么像Tik Tok这样的应用会让人上瘾。你永远不知道下一个视频会是什么。所以在进入内容平台的时候,更多的采用目的性搜索,减少对算法推送的依赖。

当然,给自己一个不上瘾的环境才是最重要的。因此,不要安装成瘾性很强的APP。若必须下载,则不要长期保留在手机中,用完即删。因为即便你不启动它,可架不住它在一直“观察”你。这个方法可以帮助你对抗算法投喂,同时提高反馈成本,因为重新下载所花费的流量、时间会慢慢弱化你的多巴胺回路激活态。

本文来自网络,不代表管理窝立场。转载请注明出处: https://www.guanliwo.com/a/zx/25805.html
上一篇开“坦克”出门
下一篇 夏日宅家做最好玩的小实验
管理窝

作者: 管理窝

这里可以再内容模板定义一些文字和说明,也可以调用对应作者的简介!或者做一些网站的描述之类的文字或者HTML!

为您推荐

评论列表()

    联系我们

    联系我们

    0898-88888888

    在线咨询: QQ交谈

    邮箱: email@wangzhan.com

    工作时间:周一至周五,9:00-17:30,节假日休息

    关注微信
    微信扫一扫关注我们

    微信扫一扫关注我们

    关注微博
    返回顶部