您当前的位置:首页 > 电脑百科 > 程序开发 > 算法

算法挂嘴边,啥是算法典范,来看看

时间:2022-07-28 16:57:15  来源:  作者:DeepTech深科技

将决策系统描述为“算法”通常是人们转移决策责任的一种方式。对许多人来说,“算法”指的是一套基于客观经验证据或数据的规则,是一个极度复杂的系统,以致人类很难理解其内部工作原理或预测算法运行时的反应。

但这种描述准确吗?也不总是。

图 | 算法在 AI 识图中的应用(来源:Pixabay)

例如,去年 12 月下旬,斯坦福医学中心把新冠疫苗的分配不当归咎于一种分配“算法”,该算法偏向高级管理人员,而非一线医生。据《麻省理工技术评论》当时的报道,这家医院声称,为了设计“非常复杂的算法”,医院已经咨询了伦理学家,其中一位代表表示“完全行不通”。尽管许多人认为算法涉及人工智能或机器学习,但该系统实际上是一个医学算法,在功能上是不同的,更像是一个非常简单的公式或者是人类委员会设计的决策树。

这种脱节突显了一个日益严重的问题。随着预测模型的激增,公众在做出关键决策时变得更加谨慎。但决策者在开始制定评估和审计算法的标准时,首先必须定义决策的类别或他们决策适用的辅助工具。给“算法”这个术语保留解释的余地,可能会让一些影响最大的模型超出了确保这类系统对人没有坏处的政策的影响范围。

如何识别算法

那么斯坦福医学中心的“算法”是一种算法吗?这取决于你如何定义这个词。虽然“算法”还没有一个公认的定义,但计算机科学家哈罗德·斯通在 1971 年编写的教科书里给出了一个普遍的定义:“算法是精确定义一系列操作的一套规则。”这个定义包罗万象,从配方到复杂的神经网络:基于算法的审计策略涉猎太广泛了。

在统计学和机器学习中,我们通常认为算法是计算机为了解数据执行的指令集。在这些领域中,产生的结构化信息通常称为模型。计算机通过算法从数据中了解到的信息可能看起来像“权重”,可以乘以每个输入因子,也可能要复杂得多。算法本身的复杂程度可能也不同。这些算法产生的影响最终取决于它们所应用的数据和最终模型运行的情况。同样的算法在一种情况下可能会产生积极的影响,而在另一种情况下又会产生截然不同的影响。

在其他领域,上述模型本身被称为算法。尽管这令人感到困惑,但从最广泛的定义来看,这也是准确的:模型是定义一系列操作的规则(通过计算机的训练算法来了解规则,而不是由人类直接表述)。例如,去年在英国,媒体报道一种“算法”不能给由于疫情无法参加考试的学生公平打分。这些报道确实讨论的是模型——把输入(学生过去的表现或老师的评价)转化为输出(分数)的指令集。

斯坦福医学中心发生的事情就好像是人类(包括伦理学家)坐下来,决定该系统应该采用怎样的操作,从而根据员工的年龄和部门等输入信息决定这个人是否应该首先接种疫苗。据我们所知,这一系列操作并没有基于优化某个定量目标的估计程序。这是一套如何让疫苗优先化,以算法的语言固定下来的规范性决策。这种方法在医学术语和广义定义中被视为一种算法,尽管其中唯一涉及的智能是人类。

关注影响,而不是投入

立法者也在争论什么是算法。美国国会在 2019 年引入的 HR2291 或算法责任法案使用了“自动决策系统”一词,将之定义为“机器学习、统计数据或其他数据处理、人工智能技术等得出的计算过程,以此作出决策或帮助人类决策,影响消费者。”

人工智能审计可能会忽略某些类型的偏见,而且也不一定能证明招聘工具是否给岗位挑选了最好的候选人。

纽约市也在考虑引进 Int 1894 法,这项法律将对“自动化就业决策工具”采取强制性审计,该工具定义为“功能由统计理论决定的系统或由这类系统定义参数的系统”。值得注意的是,这两个法案都要求审计,但只提供了有关什么是审计的高级指导方针。

随着政府和产业的决策者都在为算法审计制定标准,对“什么是算法”的意见可能会出现分歧。我们建议主要根据算法产生的影响来进行评估,而不是想着给“算法”下一个统一的定义或统一审计方法。关注结果而不是投入的话,我们就能避开技术复杂程度这些没必要的争论。无论我们讨论的是代数公式还是深层神经网络,重要的一点是会不会造成危害。

在其他领域的影响是一个关键的评估因素,它被嵌入到网络安全领域的经典 DREAD 框架中,21 世纪初微软首次了推广这一框架,目前还有一些企业在使用。DREAD 框架中的“A”要求威胁评估人员询问有多少人会受到一个确定的计算机安全隐患的影响,从而量化“受影响的用户”。影响评估在人权和可持续发展分析中也很常见,我们已经看到一些人工智能影响评估的早期开发者建立了类似的规则。例如,加拿大的《算法影响评估》基于 “该业务领域的客户是否特别容易受到影响? (是或否)”等定性问题打分。

无论我们讨论的是代数公式还是深层神经网络,重要的一点是会不会造成危害。

在评估中引入“影响”这样一个定义广泛的术语肯定比较困难。DREAD 框架后来被 STRIDE 补充或取代,部分是因为协调威胁建模所需内容的不同观点带来了挑战,微软在 2008 年停用了 DREAD。

在人工智能领域,会议和期刊已经引入了影响声明,公众对此褒贬不一。这并非万无一失:纯粹公式化的影响评估很容易露出马脚,而过度模糊的定义可能导致评估武断或冗长。

尽管如此,这仍然是向前迈出的重要一步。“算法”一词,无论如何定义,都不该成为设计和部署系统的人逃避责任的盾牌。这就是公众要求算法问责的呼声越来越高的原因,而“影响”一词的概念为不同团体满足这一需求提供了一个有用的共同基础。

-End-



Tags:算法   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
诱导付费、自动扣费……微短剧被质疑借助算法精准“围猎”老年人
诱导付费、自动扣费、重复收费……聚焦身边的消费烦心事⑦丨一些微短剧被质疑借助算法精准“围猎”老年人中工网北京3月31日电(工人日报—中工网记者刘兵)...【详细内容】
2024-04-01  Search: 算法  点击:(11)  评论:(0)  加入收藏
分析网站SEO快速排名算法对网站具体的影响效果
亲爱的朋友们,今天我想和大家分享一个我们都关心的话题——网站SEO快速排名算法对网站我们身处一个信息爆炸的时代,如何在海量的信息中脱颖而出,成为了一个我们不得...【详细内容】
2024-03-28  Search: 算法  点击:(21)  评论:(0)  加入收藏
当prompt策略遇上分治算法,南加大、微软让大模型炼成「火眼金睛」
近年来,大语言模型(LLMs)由于其通用的问题处理能力而引起了大量的关注。现有研究表明,适当的提示设计(prompt enginerring),例如思维链(Chain-of-Thoughts),可以解锁 LLM 在不同领域的...【详细内容】
2024-03-12  Search: 算法  点击:(21)  评论:(0)  加入收藏
谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
IT之家 3 月 6 日消息,谷歌于当地时间 5 日发文宣布,针对用户对搜索结果质量下降的反馈,将对算法进行调整,旨在打击 AI 生成的内容以及内容农场等垃圾信息,使用户能够看到更多“...【详细内容】
2024-03-06  Search: 算法  点击:(44)  评论:(0)  加入收藏
小红书、视频号、抖音流量算法解析,干货满满,值得一看!
咱们中国现在可不是一般的牛!网上的网友已经破了十个亿啦!到了这个互联网的新时代,谁有更多的人流量,谁就能赢得更多的掌声哦~抖音、小红书、、视频号,是很多品牌必争的流量洼地...【详细内容】
2024-02-23  Search: 算法  点击:(18)  评论:(0)  加入收藏
雪花算法详解与Java实现:分布式唯一ID生成原理
SnowFlake 算法,是 Twitter 开源的分布式 ID 生成算法。其核心思想就是:使用一个 64 bit 的 long 型的数字作为全局唯一 ID。在分布式系统中的应用十分广泛,且 ID 引入了时间戳...【详细内容】
2024-02-03  Search: 算法  点击:(54)  评论:(0)  加入收藏
简易百科之什么是搜索引擎的PageRank算法?
简易百科之什么是搜索引擎的PageRank算法?在互联网时代,搜索引擎是我们获取信息的重要工具。而PageRank算法则是搜索引擎的核心技术之一,它决定了网页在搜索结果中的排名。那么...【详细内容】
2024-01-24  Search: 算法  点击:(57)  评论:(0)  加入收藏
PageRank算法揭秘:搜索引擎背后的魔法师的工作原理
PageRank(PR)算法是由谷歌创始人之一的拉里·佩奇LarryPage命名的一种衡量网站页面重要性的方法。根据谷歌的说法,PageRank通过计算页面链接的数量和质量来粗略估计分...【详细内容】
2024-01-23  Search: 算法  点击:(46)  评论:(0)  加入收藏
程序开发中常用的十种算法,你用过几种?
当编写程序时,了解和使用不同的算法对解决问题至关重要。以下是C#中常用的10种算法,每个算法都伴随着示例代码和详细说明。1. 冒泡排序 (Bubble Sort):冒泡排序是一种简单的比...【详细内容】
2024-01-17  Search: 算法  点击:(46)  评论:(0)  加入收藏
百度最新的搜索引擎算法是什么样的?
百度搜索引擎算法是百度用来决定网页排名的算法。它是百度搜索技术的核心,也是百度作为全球最大的中文搜索引擎的基石。随着互联网的发展和用户需求的不断变化,百度搜索引擎算...【详细内容】
2024-01-10  Search: 算法  点击:(92)  评论:(0)  加入收藏
▌简易百科推荐
小红书、视频号、抖音流量算法解析,干货满满,值得一看!
咱们中国现在可不是一般的牛!网上的网友已经破了十个亿啦!到了这个互联网的新时代,谁有更多的人流量,谁就能赢得更多的掌声哦~抖音、小红书、、视频号,是很多品牌必争的流量洼地...【详细内容】
2024-02-23  二手车小胖说    Tags:流量算法   点击:(18)  评论:(0)  加入收藏
雪花算法详解与Java实现:分布式唯一ID生成原理
SnowFlake 算法,是 Twitter 开源的分布式 ID 生成算法。其核心思想就是:使用一个 64 bit 的 long 型的数字作为全局唯一 ID。在分布式系统中的应用十分广泛,且 ID 引入了时间戳...【详细内容】
2024-02-03   一安未来  微信公众号  Tags:雪花算法   点击:(54)  评论:(0)  加入收藏
程序开发中常用的十种算法,你用过几种?
当编写程序时,了解和使用不同的算法对解决问题至关重要。以下是C#中常用的10种算法,每个算法都伴随着示例代码和详细说明。1. 冒泡排序 (Bubble Sort):冒泡排序是一种简单的比...【详细内容】
2024-01-17  架构师老卢  今日头条  Tags:算法   点击:(46)  评论:(0)  加入收藏
百度推荐排序技术的思考与实践
本文将分享百度在推荐排序方面的思考与实践。在整个工业界的推广搜场景上,特征设计通常都是采用离散化的设计,需要保证两方面的效果,一方面是记忆,另一方面是泛化。特征都是通过...【详细内容】
2024-01-09  DataFunTalk  微信公众号  Tags:百度推荐   点击:(81)  评论:(0)  加入收藏
什么是布隆过滤器?如何实现布隆过滤器?
以下我们介绍了什么是布隆过滤器?它的使用场景和执行流程,以及在 Redis 中它的使用,那么问题来了,在日常开发中,也就是在 Java 开发中,我们又将如何操作布隆过滤器呢?布隆过滤器(Blo...【详细内容】
2024-01-05  Java中文社群  微信公众号  Tags:布隆过滤器   点击:(94)  评论:(0)  加入收藏
面向推荐系统的深度强化学习算法研究与应用
随着互联网的快速发展,推荐系统在各个领域中扮演着重要的角色。传统的推荐算法在面对大规模、复杂的数据时存在一定的局限性。为了解决这一问题,深度强化学习算法应运而生。本...【详细内容】
2024-01-04  数码小风向    Tags:算法   点击:(106)  评论:(0)  加入收藏
非负矩阵分解算法:从非负数据中提取主题、特征等信息
非负矩阵分解算法(Non-negativeMatrixFactorization,简称NMF)是一种常用的数据分析和特征提取方法,主要用于从非负数据中提取主题、特征等有意义的信息。本文将介绍非负矩阵分解...【详细内容】
2024-01-02  毛晓峰    Tags:算法   点击:(75)  评论:(0)  加入收藏
再谈前端算法,你这回明白了吗?
楔子 -- 青蛙跳台阶一只青蛙一次可以跳上一级台阶,也可以跳上二级台阶,求该青蛙跳上一个n级的台阶总共需要多少种跳法。分析: 当n=1的时候,①只需要跳一次即可;只有一种跳法,即f(...【详细内容】
2023-12-28  前端爱好者  微信公众号  Tags:前端算法   点击:(114)  评论:(0)  加入收藏
三分钟学习二分查找
二分查找是一种在有序数组中查找元素的算法,通过不断将搜索区域分成两半来实现。你可能在日常生活中已经不知不觉地使用了大脑里的二分查找。最常见的例子是在字典中查找一个...【详细内容】
2023-12-22  小技术君  微信公众号  Tags:二分查找   点击:(81)  评论:(0)  加入收藏
强化学习算法在资源调度与优化中的应用
随着云计算和大数据技术的快速发展,资源调度与优化成为了现代计算系统中的重要问题。传统的资源调度算法往往基于静态规则或启发式方法,无法适应动态变化的环境和复杂的任务需...【详细内容】
2023-12-14  职场小达人欢晓    Tags:算法   点击:(169)  评论:(0)  加入收藏
站内最新
站内热门
站内头条