中新网北京11月6日电 (记者 孙自法)近日,国际权威学术期刊《自然》发表了一篇关于人工智能(AI)视觉偏见评估的重要研究论文。该研究提出并构建了一个包含超过1万张人类图像的数据库——FHIBE(公平的以人类为中心的图像基准),旨在为评估AI模型在以人为本的计算机视觉领域中的偏见提供可靠资源。
FHIBE数据库由索尼AI团队精心开发,采用符合伦理标准的数据获取方式,所有图像均基于用户明确同意收集。这一创新数据库不仅可用于评估各类以人为中心的计算机视觉任务,还能有效识别并纠正AI模型中潜在的偏见和刻板印象,为推动AI技术的公平性和可信度提供了有力支持。
本项研究的相关图像数据(图片来自论文)。施普林格·自然 供图
论文指出,计算机视觉技术已广泛应用于自动驾驶车辆、面部识别系统等多个领域。然而,许多计算机视觉所依赖的AI模型,其训练数据存在严重缺陷,如未经同意收集、来源不明等。这些问题导致AI模型可能反映出性别歧视、种族歧视或其他刻板印象的偏见,对技术应用的公平性和可信度构成威胁。
为解决这一问题,索尼AI团队在构建FHIBE数据库时,在同意机制、多样性和隐私保护等多方面采取了最佳实践。该数据库包含来自81个国家或地区的1981名个体的10318张图像,每张图像均经过全面标注,涵盖年龄、代词类别、祖先血统、发色与肤色等人口统计和生理特征。此外,所有参与者均获得了关于项目和潜在风险的详细信息,确保他们在充分知情的情况下做出同意决定,整个过程严格遵守数据保护法规。
研究团队将FHIBE与27个现有以人类为中心的计算机视觉应用数据集进行了比较。结果显示,FHIBE在多样性和AI评估的可靠同意方面均达到了更高标准,同时有效减少了偏见。该数据库不仅包含的参与者自我申报标注信息远超其他数据集,还涵盖了相当比例通常代表性不足的人群,为评估AI偏见提供了更为全面和可靠的资源。
论文作者总结表示,FHIBE数据库可用于评估现有AI模型在计算机视觉任务中的表现,揭示更多此前无法了解的偏见。尽管创建数据集的过程充满挑战且成本高昂,但FHIBE无疑代表了迈向更可信AI的重要一步。未来,随着FHIBE数据库的广泛应用,有望推动AI技术在公平性和可信度方面取得更大进展。(完)