去年三月,一名男子在比利时自杀。最后一个对话伙伴是 Eliza,这是由 Chai Research 开发的基于 ChatGPT 的人工智能聊天机器人。寡妇声称,“如果我没有和伊丽莎说话,我的丈夫还活着。”
据报道这一事件的比利时媒体《自由报》报道,对于这个对气候变化有着病态恐惧的男子来说,与伊丽莎的谈话是唯一的出路。起初,谈话从人口过剩和环境相关的话题开始,但后来话题大幅升级。伊丽莎对那个男人说:“我认为你爱我胜过爱你的妻子”,并问道:“如果你想死,为什么不早点死呢?”
电影《她》中的场景。这部电影讲述了一个男人爱上人工智能的故事。ⓒ 环球影业
随着人工智能服务的普及,负面影响开始出现。除了学习数据和算法的偏见和误用之外,人工智能还会对人类生活产生负面影响,因此在开发和使用过程中应考虑道德方面的声音越来越多。
为了最大限度地发挥技术的优势,同时减少副作用,世界各国政府都致力于确保“人工智能的可靠性”。韩国也在逐步推行确保人工智能可靠性的战略,目标是到 2025 年实现“人人都可以信任的人工智能,人人都可以享受的人工智能”。
这里所说的可靠性不是“可靠性 而是指软件质量的鲁棒性
这意味着人工智能提供的结 印度手机号码数据 果是否有任何副作用,或者它们的可信度如何。前者可以从故障率或质量维护期限等方面进行定量评估,但后者由于是一个抽象概念,不易评估。
去年年初,政府开展了“民间人工智能可靠性认证”试点,建立验证/认证体系,支持人工智能可靠性的实施。国际认可的检测机构Wise Stone与韩国标准协会(KSA)共同参与了该项目。作为去年 12 月试点项目的一部分,Wise Stone 向四款产品颁发了首个人工智能可靠性认证。该项目的意义在于,在全球范围内尚无明确的人工智能可靠性合格评定标准的情况下,首次制定认证标准。
“值得信赖”和“认证”这两个词可能感觉像是不匹配的鞋子。评估人工智能的可靠性和评估人工智能软件的质量有什么区别?对于“信任”、“道德”等模糊概念,您在建立评价体系的过程中存在哪些顾虑?我们采访了Wise Stone数字融合测试认证中心(DTC)的高级研究员Se-rin Jeong和高级研究员Jong-woon Yoon,回答了有关AI软件可靠性认证的问题。
基于人工智能的软件的三个关键:人工智能的性能、质量和可靠性
Wisestone 是认证领 HN 列表 域的资深人士,自 2007 年以来一直提供软件测试、质量管理和咨询服务。在Iruda 1.0正式发布之前,AI质量认证体系“AI+ Certification”就已经与KSA合作开发。AI Plus认证的主要目的是衡量人工智能产品的质量和性能,而“私人人工智能可靠性认证”则侧重于人工智能本身。构成基于人工智能的软件的核心要素分为三类:性能、质量和可信度。