何为数据伦理学

更新时间:2009-03-28

引言

数据科学为私人生活和公共生活以及我们环境的改善(智慧城市的发展或由碳排放所带来的问题)提供了巨大的机遇。 不幸的是,此类机遇也带来了令人深思的伦理挑战。 为了塑型选择和做出决策(包括机器学习、人工智能和机器人学),我们大量地应用日益增长的数据(常常是个人的,即使是不敏感的大数据),并越来越依赖分析数据的算法。 与此同时,人类的参与逐渐减少,或者对一些自动过程的监管也逐渐减少,所有这一切迫切需要我们对公平、责任和人权等问题展开思考。

这要求式(33)的右边必须是正定的,但是在计算过程中,等式的右边由于含有相减的项,对舍入误差十分敏感,很容易因为舍入误差的积累,使结果失去正定性。因此还需对状态估计协方差的平方根矩阵作如下修改:

例1 (武汉四调)如图3,在平面直角坐标系xOy中,抛物线经过点C(2,3),直线y=kx+b与抛物线相交于A、B两点,∠ACB=90°.

这些伦理挑战能被成功地指出。 在确保尊重人权、确保尊重开放的、多元的和容忍的信息社会价值观的同时,加强数据科学的发展和应用是一个我们能且必须利用的大好机会。 保持这样一种稳健的平衡绝非易事。 但若不能同时推进伦理学和数据科学的发展而二选一的话,则将会带来令人遗憾的后果。 一方面,忽视伦理问题可能会引发负面影响和社会排斥,如英国国家医疗服务体系 (英国NHS,National Health Service)的医疗数据库项目*参见:https://www.england.nhs.uk/ourwork/tsd/care-data/.就是这样一个案例。 任何数据科学项目甚至对人类影响微小的项目,社会可接受性,或者社会偏好度也必须是确保不错过机会的指导原则。 另一方面,过分强调错误语境中的个人权利的保护也将导致规则过于苛刻,且这将反过来削弱利用数据科学社会价值的机会。 在这点上,欧洲议会公民自由、司法与内政事务委员会(LIBE)最初提出的对《欧盟数据保护法》(The European Data Protection Regulation)的修正就是一个具体的案例。*Amendments 27, 327, 328 and 334-337 proposed in Albrecht's Draft Report, http://www.europarl.europa.eu/meetdocs/2009_2014/documents/libe/pr/922/922387/922387en.pdf.

为了达到数据科学对我们的社会、我们所有人以及我们的环境的伦理价值最大化之路,在社会排斥的锡拉和立法禁止的卡津布迪斯之间这样一种两难境地之中进行航行是数据伦理学的一个高难度任务。 为了完成此项任务,数据伦理学将建立在计算机和信息伦理学的已有研究基础之上,在过去的30年中,计算机和信息伦理学一直聚焦于数字技术所提出的伦理挑战[1-3]。 这个丰富的研究成果是非常有价值的。 它也可卓有成效地将数据伦理学移植到伦理学的大传统之中。 与此同时,当数据伦理学将伦理探究的抽象层次(the level of abstraction ,LoA)从信息中心(LoAI,information-centric)转向数据中心(LoAD,data-centric)时,它也将计算机和信息伦理学中研究中现有的被认可的路径进行了提炼。*抽象方法是计算机科学领域[4]以及信息哲学和信息伦理学领域[5]的一种常用方法。 该方法通过聚焦于被称为可被观察的不同的方面,而对一个系统中可被分析的不同的抽象层次予以详细的描述。 可观察的选择依赖于分析的目标并决定着抽象层次的选择。 任何给定的系统都可以在不同的抽象层次进行分析,譬如,一个对最大化汽车的空气动力学感兴趣的工程师可能会关注汽车部件的外形、重量和材质,对汽车美学感兴趣的客户会关注汽车的颜色和整体的外观,而忽略汽车部件的外形、重量和材质。

伦理的分析可以在不同的抽象层级展开。 在赋予计算机和信息伦理学演化特征的一系列挑战中,从信息中心到数据中心的这种转换是不久前才开始的。 在该领域的研究中,首先被认可的是以人为中心的抽象层次[6],以人为中心的抽象层次是通过设计者责任和用户责任的方式来强调由计算机传播所引发的伦理问题。 随之,在20世纪80年代中叶,抽象层次转换为以计算机为中心(LoAc,computer-centric)[7],并在第二个千禧年开始之际再次转变为信息中心[8]

河北省是典型的草食畜牧业和优质大豆的主产省,2018年,我省青贮玉米、苜蓿等饲草饲料作物种植面积达250万亩,大豆种植面积超过300万亩。随着国家玉米调减政策的出台和中美贸易摩擦的影响,未来大豆的播种面积将进一步扩大,布局进一步优化,丰富的饲草、大豆和秸秆为我省畜牧业发展提供了饲料来源。我省主要畜产品产量一直位居全国前列,近三年我省畜牧业平均产值达1902亿元,2017年我省畜牧业总产值达1899.37亿元,位居全国第四位,占全省农林牧渔总产值超过30%。

鉴于抽象层次的这种变化,数据伦理学被界定为伦理学的一个分支,其研究和评估与数据(包括数据的生产、记录、典藏、处理、传播、分享和使用)、算法(包括人工智能、智能体、机器学习和机器人)以及相应的实践(包括负责任的创新、编程、黑客行为和专业代码)相关的道德问题,其旨在系统阐述和证明道德层面上善的解决方法(譬如正确的行为或正确的价值)。 这意味着在概念空间,由数据科学所引发的伦理挑战可被描绘为数据伦理学、算法伦理学和实践伦理学三个轴。

在当下,作为信息革命之最新阶段的数据科学正在推进着抽象层次的进一步变化,在抽象层次中,伦理学得到了最富有成效的发展。 几十年来,我们已经开始意识到数据科学(如计算机、平板电脑、移动电话、在线平台、云计算等),并非是仅仅一个特定的技术,数字技术的任何操作都在展现我们伦理策略的正确靶向。 从信息伦理学向数据伦理学的转换,可能更具语义性而非概念性,但这种转换突显了某种必要性,即聚焦于将什么视为我们所应关注的真正不变量的必要性。 这就是为何“机器人伦理”“机器伦理”等诸如此类的伦理学都没有抓住重点的原因,这些伦理学错误地退回到了“计算机伦理学”似乎能提供正确视角的年代。 并非是硬件引发了伦理问题,而是硬件和软件以及数据一起所做的一切引发了伦理问题,这些问题是造成我们新困难产生的源头。 数据中心将焦点带到了数据的不同道德维度。 借助于此,在关注信息之前,数据伦理学就已经开始强调诸如隐私、匿名、透明、诚信和责任等与数据收集、典藏、分析和使用有关的伦理问题,且因此,这些伦理问题在那个层次更容易被理解。

数据伦理学聚焦于由大型数据库的收集和分析所引发的伦理问题,涵盖从生物医学研究和社会科学[9],到收集、广告[10]和数据慈善[11-12]以及开放数据[13]。 在该语境中,核心的问题有通过数据挖掘、数据链接、数据融合和大型数据集的再使用而带来的个体再识别(re-identification),以及所谓的“群体隐私”,当个体认同的类型独立于个体之间的互相去识别(de-identification)时,可能会导致严重的伦理问题,这些问题涉及从群体歧视(如对老年人的歧视、种族歧视、性别歧视)到面对特定群体的暴力[14-15]。 诚信[16-17]和透明性[18]、与公众对与数据科学相关的利益、机遇、风险和挑战的认知缺失一样都是数据伦理学的核心话题[19]。 譬如,透明性通常被视为培养诚信的一种方法。 然而,什么样的信息应该透明及谁应该透漏给谁等都是模糊的。

这些变化对快速的、普遍的和深度的技术转换予以了应对。 且其在概念层面,有着非常重要的影响。 譬如,计算机中心(LoAc),突显了计算机作为一种工具之普遍性本质和延展性本质。 这使得理解计算机对社会动力学的影响以及对我们周边环境设计的影响变得更加容易。[7] 信息中心将焦点从技术的方法转换到了通过技术方法而被创造、记录、处理和分享的内容(信息)。 通过此,信息中心强调了信息的不同道德维度(如信息作为资源、作为结果或道德行动的目标),并走向了一种宏观伦理学路径,该路径着重于信息创造、储存、保护、使用以及可能的破坏的全周期。[8]

算法伦理学讨论的是由算法不断增长的复杂性和自主性而带来的问题(包括诸如互联网僵尸之类人工智能和智能体),特别是在机器学习应用中。 在此中,有一些关键的挑战,这些挑战既包括与不可预见的和非期望的结果相关的设计者和数据科学家的道德责任和问责问题[20-22],也包括机遇的错失。 毋庸置疑,算法需求的伦理设计和审计以及潜在的、不良后果的评判(譬如歧视或反社会内容的宣传)正在越来越受关注。

最后,实践伦理学(包括职业伦理学和道义论)对包括数据科学家在内的负责数据处理、战略和政策的人和组织的责任等紧迫问题展开讨论,实践伦理学的目的是界定一个伦理学的框架,该框架可用来塑型关于负责任的创新、发展和使用的职业规范,而这些规范既可以确保伦理实践促进数据科学的发展,又能保护保个人和群体的权利[23]。 在这一分析脉络中,有三个核心问题,它们是知情同意、用户隐私和二次使用。

虽然数据伦理学、算法伦理学和实践伦理学是截然不同的研究脉络,但很明显的是,它们是彼此交织在一起的,这就是为什么以三个轴来界定一个概念空间是更为可取的,在一个概念域中,伦理问题好像是以三种值来区分的点。 它们大多数并不位于一个单独的轴上。 譬如,对数据隐私的分析也将探讨知情同意和职业责任问题。 同样地,算法的伦理审查常常也与其设计者、开发商、使用者和采纳者的责任分析有关。 数据伦理学也必须处理整个概念空间,虽然每个研究轴优先顺序和焦点不同,但三个研究轴是联系在一起的。 鉴于此,需要将数据伦理学从宏观伦理学开始发展,即,在一个始终如一的、整体性的、包罗万象的框架之内,一个涵盖一切的伦理空间“几何体”,该“几何体”能避免狭隘的、特定的路径,并能探讨数据科学的各种伦理影响。

[ ]

[1] BYNUM T. Computer and information ethics[EB/OL].https://plato.stanford.edu/archives/win2015/entries/ethics-computer/.

[2] FLORIDI L. The ethics of information[M]. Oxford, UK: Oxford University Press,2013.

[3] MILLER K, TADDEO M.The ethics of information technologies. Library of essays on the ethics of emerging technologies[M]. New York, NY: Routledge,2017.

[4] FLORIDI L. The method of levels of abstraction[J]. Minds, 2008,18(3):303-329.

[5] HOARE C A R. Notes on data structuring[M]// DAHL O J, DIJKSTRA E W, HOARE C A R.Structured programming.London, UK: Academic Press,1972:83-174.

[6] PARKER D B. Rules of ethics in information processing[J].Communation of ACM, 1968,11(3):198-201.

[7] MOOR J H. What is computer ethics?[J] Metaphilosophy,1985, 16(4):266-275.

[8] FLORIDI L. Information ethics, its nature and scope[J].ACM SIGCAS Computers and Society,2006, 36(3):21-36.

[9] MITTELSTADT B D, FLORIDI L. The ethics of big data: current and foreseeable issues in biomedical contexts[J]. Science and Engineering Ethics, 2016,22(2):303-341.

[10] HILDEBRANDT M. Profiling and the identity of the European citizen[M]// HILDEBRANDT M, GUTWIRTH S. Profiling the European citizen. Dordrecht, The Netherlands:Springer, 2008:303-343.

[11] KIRKPATRICK R. A new type of philanthropy: donating data[EB/OL].[2013-03-21] .https://hbr.org/2013/03/a-new-type-of-philanthropy-don.

[12] TADDEO M. Data philanthropy and the design of the infraethics for information societies[J/OL] . [2016-11-4]. http://rsta.royalsocietypublishing.org/content/374/2083/20160113.

[13] KITCHIN R. The data revolution: big data, open data, data infrastructures and their consequences[M]. Beverley Hills, CA: Sage,2014.

[14] FLORIDI L. Open data, data protection, and group privacy[J]. Philospphy& Technology,2014, 27(1): 1-3.

[15] TAYLOR L, FLORIDI L,van der Sloot B. In press.Group privacy: new challenges of data technologies[M]. Philosophical Studies, Book Series. Hildenberg, The Netherlands: Springer.

[16] TADDEO M. Trust in technology: a distinctive and a problematic relation[J]. Knowledge,Technology& Policy,2010,23(3-4):283-286.

[17] TADDEO M, Floridi L. The case for e-trust[J]. Ethics and Information Technology, 2011,13(1):1-3.

[18] TURILLI M, FLORIDI L. The ethics of information transparency[J]. Ethics and Information Technology,2009,11(2):105-112.

[19] DREW C. Data science ethics in government[J/OL].[2016-11-04].http://rsta.royalsocietypublishing.org/content/374/2083/20160119.

[20] FLORIDI L. Faultless responsibility: on the nature and allocation of moral responsibility for distributed moral actions[J/OL].[2016-11-04].http://rsta.royalsocietypublishing.org/content/374/2083/20160112.

[21] FLORIDI L. Distributed morality in an information society[J]. Science and Engineering Ethics,2013,19(3):727-743.

[22] GOODMAN B, FLAXMAN S. European Union regulations on algorithmic decision-making and a “right to explanation”[EB/OL].[ 2016-08-31].http://arxiv.org/abs/1606.08813.

[23] LEONELLI S. Locating ethics in data science: responsibility and accountability in global and distributed knowledge production systems[J/OL].[2016-01-22]http://rsta.royalsocietypublishing.org/content/374/2083/20160122.

(注:关键词为译者所加。 原文出处:Phil. Trans. R. Soc. A 2016 374 20160360; DOI: 10.1098/rsta.2016.0360)

 
卢西亚诺·弗洛里迪,莫瑞奥萨瑞·塔迪欧,闫宏秀,杨庆峰
《洛阳师范学院学报》2018年第04期文献
100%安全可靠
7X18小时在线支持
支付宝特邀商家
不成功全额退款