分享

算法到底有多强大?安排你的生活,操纵你的工作,甚至决定你的财富······

 德培论道 2020-09-18

   点击上方“蓝字”

   带你“透过表象看真相”


科学愈不精密,它们就愈没有变动,而在精密科学中,变化是巨大无比的,而且持续不断地进行着。


导读:算法的背后是人,当人类尚且存在局限性,又如何要求算法保持完美无缺呢?

在如今的数字经济时代,计算机算法早已像空气般浸染人们的生活。

比如早上出门前,很多人会打开APP查看今天的天气,决定穿什么衣服,出门要不要带伞,或者打开地图,查看今天路上有没有堵车,是否限行;再比如登录购物网站,弹窗会推送你搜索过的商品;打开租车软件,算法又在里面为你安排好车辆和规划路线……

衣食住行,算法无处不在。它便利了生活,提升了效率,降低了成本。

但与此同时,围绕算法也存在诸多的争议。近日,《外卖骑手,困在系统里》一文刷爆网络,将算法约束下的外卖骑手的职业困境暴露于公众面前,引发热议。

算法也再一次站上风口浪尖。

01
算法的起源和进化

算法是什么?它究竟从何而来?

“算法”这个术语源自波斯学者al-Khwarizmi名字的拉丁化,他于9世纪在巴格达撰写了著作《印度数字计算》一书,该书向西方引入了印度教的数字,以及相应的计算数字的新方法,即算法。

中世纪拉丁语“algorismus”指的就是用印度数字进行四个基本数学运算——加法、减法、乘法和除法的程序和捷径。后来,“算法”被人们用作表示任何逐步的逻辑过程,并成为计算逻辑的核心。

今天,很多人可能将算法视为抽象数学原理的最新技术创新。但其实,算法是最古老和最重要的实践之一,早于许多人类工具和所有现代机器。

巴比伦人用算法来决定法律观点,拉丁语教师利用算法来矫正语法,且在预测未来、决定医疗或准备食物等所有文化中也用到了算法……

算法本就是代表一组按部就班的指令,通过非常机械化地执行操作,就能达到预期的结果。也就是说,只要我们有待解决的问题,又存在行之有效的方案,这个方案就是算法。

所以,算法并不局限于数学。我们在讨论食谱、规则、技术、过程、程序和方法时,也通过相同的词语来描述不同的场景。例如,中国人的数学(算术)和武术中都使用了“术”,这个词代表规则、过程或策略。

法国数学家Jean-Luc Chabert指出:“算法本身自然存在,甚至在人们创造出这个特殊的词语来形容它们之前就存在了。”就人类的发展过程而言,可以认为社会实践和仪式过程中体现出的算法才是数字和数字技术出现的原因,而不是相反的方向。

一般来说,我们可以将算法的历史分为三个阶段:在古代,算法可以认为是程序化、规则化仪式的过程,通过该过程实现特定的目标和传递规则;在中世纪,算法是辅助数学运算的过程;在现代,算法是逻辑过程,由机器和数字计算机来实现完全机械化和自动化。

在这过程中,以数学演算为形式的算法进化了2000多年,直到18世纪二进制的出现才有所飞跃,发明者是德国数学家莱布尼茨,他不仅和牛顿在同一时代分别在自己的国度里独自研究和完成了微积分的创立工作,而且他很早就萌生了制造智能机器的想法,还设计出第一台能做加减乘除的机械计算器。

此后200多年,随着高斯函数、概率论、图论、布尔逻辑及更多数学分支的发展,1930年代,现代算法呼之欲出——二进制电子电路问世了。一个叫克劳德·香农的麻省理工研究生试着把二进制和布尔逻辑结合写进电子电路,发现能解决数学难题、存储数据、编辑图像和文字。

1946年,世界上第一台计算机“埃尼阿克”在美国问世,它重达30吨,却一点也不笨,能用20秒计算出炮弹的轨道。从此,算法走出古典数学家的演算纸,进入计算机时代。

彼时,科学家们发现,算法与计算机太匹配了。“计算机有难以置信的运算速度,对执行重复性任务非常合适。”英国格拉斯哥大学计算机科学家帕特里克·普罗瑟说,“这些任务被明确定义,并可用有限的时间来完成。”

如今,算法一词的含义已局限到仅代表系统计算的任何过程,与其他场景中的过程、方法或技术之类的概念有所区别。

02
算法的强大

算法是如何运作的呢?

举个简单的例子,比如我们想要出门去到附近的一家星巴克,打开智能手机的出行软件发出指令,搜索离我最近的咖啡厅,这时候就会有两类基础算法在忠诚地为你服务:排序算法和路径选择算法。

排序算法先把城市所有咖啡厅找出来,按距离排序,给出推荐结果;在选中一个方案后,路径选择算法就会计算出最优交通方案,然后跟着箭头走就是了。

如果这件事发生在上海这样的特大城市,因为数据量太大,计算过程就会变得异常漫长,怎么办?科学家们又创造“预处理”来优化算法,即把城市分成若干“格子”,根据用户的位置落在哪个格子内,只对其范围内的咖啡厅按距离排序即可。

算法夜以继日,像矿工从砂岩中淘洗黄金一样接收和处理着数据,也造就了它今天的强大。

在每分钟就有400小时视频上传的YouTube ,如何在指数级膨胀的视频海洋中,精准把握海量用户的需求?强大的算法无疑是最有力的答案。

20多年前,斯坦福计算机研究生拉里·佩奇和谢尔盖·布林住进加州一个车库。他们打算设计一个搜索引擎,帮助人们更有效地搜寻万维网信息。他们一无所有,只有在宿舍发明的PageRank(网页排名算法)。

当时市面上已有的搜索引擎仅以网页点击数排名,两位创始人则把他们对搜索的理解写进PageRank,主要基于两个假设:一是数量假设,一个页面接收到其他网页指向的入链数量越多,这个页面就越重要;二是质量假设,指向页面的其他网页的入链质量越高,页面越重要。

PageRank开创性地提出“链接价值”概念,让搜索引擎从单纯的“计数”飞跃到对网页重要性的评价。PageRank成为Google创业期最核心的算法,不断优化沿用至今。

如今,Google帝国的技术已无比强大。GFS、MapReduce、BigTable、Caffeine、Pregel、Dremel等技术,已成为全球云计算及大数据技术的基石。其中的MapReduce算法是使得Google每天能经受住55亿次搜索冲击的大功臣。

MapReduce算法原理既精妙又质朴,通过把计算量分配给不同的计算机群,并行分布式自动执行。简单地说,就是将复杂任务分解“外包”给全球大大小小的计算机,各自运算,最后汇总解决,“借助该算法,Google几乎能无限地增加计算量”。

如今,算法已抵达机器学习和人工智能的前沿,Google的人工智能程序“AlphaGo”横扫中韩围棋高手,就连中国的柯洁也承认对方是“围棋上帝”。

而在资讯、短视频、电商等领域,则是“基于内容的推荐算法”和“协同过滤算法”在发挥作用。前者形象地说就是“你多看什么就给你推荐什么”,后者则是基于人际关系和兴趣关联的推荐方案,例如“我很多朋友爱看NBA,我也极有可能喜欢篮球”,“读王小波的人很有可能也喜欢乔治·奥威尔(对王影响最大的作家之一)”。

近几年,美团、字节跳动、拼多多等互联网新星不断冲击传统互联网巨头微信、淘宝、百度等产品的地位,成为新的“流量收割机”,就是基于各自算法的强大功能。

基于内容分发算法,用户在使用抖音或者TikTok时,只需要不断往下刷新,系统会根据用户停留观看的时间、内容,计算出偏好纬度,不断推送用户喜欢的内容,进而增加用户黏性。

截至今年5月,TikTok全球总下载量已突破20亿次,如果按照全球40亿网民来算,那就意味着有一半网民下载了TikTok,超过Facebook所有社交产品的总下载量,位居全球第一。

同样的,在拼多多发展壮大的过程中,很多人都没能躲过它的“砍一刀”。借助微信的社交关系与算法推动下的精准裂变,很多人发现拼多多开始在自己周围的亲戚朋友中流行,最终自己也成为它“社交+算法”加持下的新俘虏。

据拼多多最新财报显示,截至2020年6月30日的12个月内,其活跃买家数量6.832亿,正在向淘宝逼近。

03
算法的两面性

毋庸置疑,算法的强大带来了很多正面效用。

疫情全球流行期间,远程医疗、在线教育、跨境电商、共享平台、协同办公等数字服务广泛应用,对促进各国经济稳定、推动国际抗疫合作发挥了重要作用。再看国内,经济平稳复苏,新型“宅经济”持续发力、消费方式迅速转变、到家服务升级势头不减。

这背后显然离不开算法的支撑。作为数字经济的基础与核心,算法支撑着生产运转与服务效率。尽管不同领域、企业算法不同,但究其根本,都是用智能平衡供需关系,最大化提高效率。

以外卖为例,每增加一个订单,系统要在毫秒内计算出最优路径;每缩短一分钟,无不通过技术与算力实现……看似体力活的外卖,囊括了智能“大脑”和前沿算法。

这次疫情之后,算法还将向更多领域渗透,教育就是其中之一,比如建立精准题库,推断知识薄弱点,智能生成个性化学习方案。医疗、文化、农业等领域,也因算法注入不断演化新业态。

就连一贯执着于“社交分发”的微信,近一两年也开始拥抱“算法分发”。

而且,算法技术的初衷是为了解决问题、提高效率,比如“个性化推荐”其实就是一个倒逼的产物,目的是解决信息过载。

然而,就像任何新技术都有它的两面性,在唯效率至上的一路狂奔中,算法的局限性及带来的隐患也正面临诸多争议。

首先,一浪接一浪的有关个人隐私数据安全问题愈发难以回避。

我们每个人都曾用“隐私换便利”,在这过程中平台获取用户信息之所以不违法,是因为用户知情,并且允许。

但平台也可以在用户不知情的情况下获取用户信息,比如,Facebook利用“性格测试”的幌子,让27万用户在不知情的前提下提交了自己身份信息和社交信息,并通过这27万用户获取了他们超过5000万的社交好友资料,最后转交给剑桥分析。

随着用户对隐私数据的合理使用意识逐渐觉醒,如何平衡大数据发展与个人隐私之间的关系,将变得越发重要。

其次,机械的算法推荐机制给用户带来“信息茧房”问题。

今日头条创始人张一鸣曾坚信“算法没有价值观”,言外之意是算法是根据用户的点击、浏览、分享等行为进行的个性化推荐,今日头条APP上呈现的内容,代表的是用户自己的选择。

这个看法后来遭遇了激烈的舆论抨击,其中的一个质疑是个性化算法的“信息茧房”效应,“在算法的帮助下,我们可以轻易过滤掉自己不熟悉、不认同的信息,只看我们想看的,只听我们想听的,最终在不断重复和自我认证中强化了固有偏见和喜好。”

Pariser在2011年提出了过滤气泡假说,认为算法的目标不是确保多样性,而是通过增加媒体消费来最大化经济收益。

这样的“过滤气泡”一方面使得对信息的支配权从专业人士转移到机器,“算法成了新的权威”。

更重要的是,在一些社会重大突发消息面前,新闻的多样性和均衡性是人们采取有利行动的保证,但在这次新冠疫情信息传播中,算法显得“不堪一击”,反而人工推荐的价值凸显:

百度APP、一点资讯、今日头条和腾讯看点等曾经以算法推荐为主的平台,陆续上线“抗击疫情”专题、开设辟谣专区(机器很难识别消息真假,人可以),并且进行了体系化的内容建设,以及人工强运营。

这背后的原因在于,算法满足的是用户个性化的信息需求,而在这样一场全民抗击疫情的社会化大协作中,疫情是所有人高度关注的话题,大家对资讯的需求更多是千人一面。

再次,“算法崩盘说”认为ETF在全球的泛滥是造成全球股市剧烈波动的原因之一。

在金融领域,算法交易表现为使用计算机程序来发出交易指令的方法,它无须人工干预,即可自动决定交易时间、价格和成交数量等。它避免了人类因效率、情绪和失误造成的影响,仿佛一台永不疲倦的“财富收割机”。

然而,当市场一旦出现调整,沽空盘蜂拥而出,就会触发其他算法程序抛售,进而出现“闪电崩盘”的一幕。

尤其当ETF这种被动型的指数型基金所占市场份额越来越大时。数据显示,截至2019年底,全球公募基金规模为54.9万亿美元,其中,主动基金占比为61%,指数基金占比19%,ETF占比19%,被动产品合计占比38%;而在2009年的时候,主动基金占比82%,指数基金占比10%,ETF占比仅为8%,被动产品合计只占比18%。

为解决市场不确定性而生的算法,最终带来更巨大的不确定性,这是目前算法交易不得不面对的悖论和怪圈。

最后,算法效率发展到极致与人性化和公平之间存在悖论。

在这次的外卖骑手事件中,算法追求极致的逻辑一步步挤压外卖骑手的生存空间,一次次把外卖骑手置身于险境。算法能根据均值算出各个环节需要的时间,却不能准确感受到快递员所处的处境。

在算法决策的“黑匣子”面前,用户无法了解到算法的决策过程,而只能够了解到结果。

抽奖算法曾经也因此遭受质疑——算法根据用户的活跃程度,而非机会均等地作出抽奖决策。

04
结语

从科技发展的大趋势来看,总的来说,人工智能、产业互联网和大数据与算法将是未来十年甚至是几十年的发展大潮。

无论人们愿意与否,在日益智能化的社会,算法注定将伴你前行。

而说到底,算法的背后是人,当人类尚且存在局限性,又如何要求算法保持完美无缺呢?

算法的精髓在于不断学习,面对争议和问题,解决途径仍在于人。

越是“技术为王”时代,越不能忽视经验与人工的作用。

那么,如何实现算法与人性的互补?更多深入分析,可参阅福卡智库内部报告《算法“夺权”,人性“败退”?》 。

文章看不够 

我们还有视频

扫描二维码观看视频

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多