阿里巴巴集团联合中国信通院编写了《人工智能治理与可持续发展实践白皮书》,全面总结了阿里巴巴在人工智能治理与可持续发展领域的实践,重点针对当前人工智能应用中的热点问题,从数据、技术、管理及多元协同等方面,系统性介绍了我们的实践思路和方法,同时辅以若干专题进行阐释,期待为社会各界提供有益参考。白皮书全文4.5万余字,将在9月正式发布,现分章节陆续分享。近年来党和国家高度重视人工智能研发利用,将其作为新一轮科技革命和产业变革的重要驱动力量。以人工智能为代表的算法应用有效地推动了数字化转型,带来了巨大的机遇,同时也存在着一定的风险和挑战。企业作为人工智能发展和应用的排头兵,具有技术和能力等优势,深入参与治理工作责无旁贷。本白皮书尝试构建一套面向企业的体系化治理框架,探讨如何应对包括人工智能的各类算法风险,将治理原则落实到生产实践的各个环节。人工智能深度参与重塑生产力与生产关系,治理过程中坚持发展生产力、保障各方主体权益,对于促进行业产业环境公平、稳定、可持续发展至关重要,更有利于实现更大的社会价值。在确保安全的底线上坚持发展生产力。应首先认识到人工智能仍在快速的发展阶段,相关技术自身具有一定的脆弱性、以及管理体系落后于技术发展等诸多问题客观存在。其次,需要积极探索适配创新科技高速发展的合理模式,避免抑制人工智能的发展与应用潜力。保护各主体合法权益,持续释放技术红利。人工智能从设计开发到部署应用,涉及到多类主体。治理过程中需要充分保护人工智能全生命周期各类主体的合法权益,兼顾相关方合理的利益诉求,平衡短期利益与长期目标,确保人工智能技术能够让整个社会受益。
2.监管及司法方面的AI数据合规风险与防范实践
随着人工智能与人类社会融合的不断深入,赋予人工智能正确的价值观、道德感、判断力,对于促进人类未来发展至关重要。遵循人人受益、责任担当、开放共享的价值导向,既是实现可持续发展治理的内在要求,也是打造可用、可靠、可信的人工智能技术的重要指引。
1)人人受益
党的十九大报告指出,我国社会的主要矛盾是人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。人工智能企业对于相关技术和产品的研发应当以人为本,让科技进步服务于对美好生活的要求,服务于可持续发展愿景。
2)责任担当
习近平总书记指出,“行生于己,名生于人。只有富有爱心的财富才是真正有意义的财富,只有积极承担社会责任的企业才是最有竞争力和生命力的企业”。企业的发展离不开国家、社会、用户的支持,离不开对于各类资源的消耗,因而对社会、经济、环境的可持续发展责无旁贷。
3)开放共享
人工智能涉及学科复杂广泛、涉及主体众多,治理手段多样。因此解决产业或者技术存在的问题是个人、单一机构无法完成的,需搭建开放的、科学的平台,集结社会各方力量共同开展治理工作。一是基础底座的开放共享,如科技领域的科研成果;二是技术软件的开放,如技术开源;三是开放的数字生产力平台,简化个人和组织的创新程序。
人工智能治理需要重点关注并回应人工智能带来的三大问题:一是要避免人工智能大规模部署和应用带来的数据滥用;二是管控技术风险,优化完善人工智能技术,克服固有的缺陷;三是要建立有效的人工智能管理体系,识别人工智能生命周期中的问题并作出应对。
数据和人工智能是“水”和“鱼”的关系。一方面,人工智能(鱼)依靠数据(水)来生存,比如人工智能算法的训练、迭代离不开海量数据的支撑,数据作为除土地、劳动力、资本、技术外的第五种生产要素,呈现出乘数效应等特点,数据可和其他要素结合使用,催生“人工智能”等新技术,产生更大的经济价值;另一方面,人工智能(鱼)赋予数据(水)更大的价值,比如数据的开放利用离不开基于人工智能的数据挖掘、数据分析,人工智能对数据的获取和利用有根本性的影响,通过人工智能处理,数据价值得到大幅提高,能够帮助企业真正实现数据智能。在缺乏相应治理规范的情况下,部分组织为争夺更多的数据资源,可能滥用人工智能进行过度、违规收集用户数据,恶意爬取其他企业数据等行为,最终导致用户权益及隐私受损、扰乱市场公平竞争秩序,甚至危害国家安全和社会公共利益。
可持续的人工智能治理需要回应人工智能应用带来的数据滥用问题,通过平衡、包容的治理机制,一方面促进数据和人工智能同向进步,提高数据驱动能力和数据智能水平,更好地发挥数据在数字经济建设和社会文化发展中的核心作用,另一方面要防范数据安全风险,有效保护各类主体的核心权益。一是遵循合法、正当、必要的原则,在获得用户授权的条件下合理收集用户数据,尊重用户对个人信息的管理要求,保护好用户隐私,二是遵守商业伦理和经济秩序,通过合作或交易机制获取其他企业的数据,维护数据所承载的商业价值,三是保障数据安全,强化数据治理,避免数据篡改、泄露、破坏等带来的安全风险。
可持续的人工智能治理应当构建全生命周期的数据安全整体能力。数据安全不同于传统网络安全,因数据的价值是流动和使用中产生的,这就需要数据安全覆盖到各种数据处理活动,从数据采集、数据传输、数据存储、数据处理、数据交换到数据销毁整个生命周期。如数据采集活动中要对数据源进行身份鉴别,防范数据伪冒和数据伪造的风险。数据质量管理中要对数据进行治理和标识,保障有质量、已标识的数据作为人工智能的训练数据集。
人工智能相较于其他技术领域更为复杂、更不可控、更难预测。为应对人工智能自身缺陷,谨防人工智能滥用,按照可用、可靠、可信的治理原则不断完善人工智能的技术体系。将愿景、目标、价值导向转化为技术实践,来保障人工智能可持续发展。可用是人工智能技术发展的前提和基础。人工智能应用的真实场景中往往会面临样本缺少、数据分布不均、重知识、快变异以及多模态等诸多困难。在通用人工智能技术尚未成熟的当下,需要面向真实的垂直场景解决规模化应用的问题。需要企业在解决如上问题的实战中催生出更强大的技术,保障人工智能在迭代发展中,持续应对不断膨胀的业务规模及更加复杂的业务形态。可靠:面向对抗和未知场景更加鲁棒
人工智能技术应当在可用的基础上逐渐向可靠的方向发展。由于互联网场景存在巨大商业利益,不可避免催生出一批专业从事信息攻防的黑灰产,针对人工智能的新型攻击手段不断涌现。企业需要在面对对抗和未知风险时,增强技术鲁棒性,保障技术可靠。人工智能技术应当以实现全面的技术可信为最终目标。严格保护隐私数据不被滥用、透明可解释且能够让人类理解和参与决策、建立在因果推理基础而非统计相关之上、并且是对大多数群体公平公正。人工智能系统需要其设计者赋予其正当的道德伦理观念,坚持将人工智能应用在更有社会价值的场景,才能确保人工智能可持续发展。
3.面向可持续发展的人工智能治理框架
企业作为落实人工智能治理原则的重要主体,要在风险与发展之间寻求动态平衡,形成覆盖人工智能产品全生命周期的风险管理机制。既要主动调整人工智能的技术发展路线,通过科技手段帮助人工智能更好地服务社会,也需要通过组织机构变革,加强对人工智能的可靠性、可信度、伦理性的审核,确保人工智能匹配人类的伦理价值。
阿里巴巴结合业界“可信人工智能”、“负责任的人工智能”等理念与实践,提出了面向可持续发展的人工智能治理基本框架,致力于将治理要求落到实处,助力构建向上、向善的人工智能生态环境。
第二章预告:
《提升数据安全及合规能力,保障人工智能健康发展》
我们将持续更新,敬请期待😚~
更多人工智能治理新技术、新风向、新观点,请关注【阿里巴巴人工智能治理与可持续发展研究中心AAIG】公众号👇
👇AAIG课代表,获取最新动态就找她 关注公众号发现更多干货