Facebook 开源数据集,旨在消除 AI 偏见

开源
Facebook 宣布开源了一个名为 Casual Conversations 的视频数据集,旨在帮助研究人员评估其计算机视觉和音频模型在各种年龄、性别、明显的肤色和周围光线条件下的准确性,以消除 AI 偏见。

Facebook 宣布开源了一个名为 Casual Conversations 的视频数据集,旨在帮助研究人员评估其计算机视觉和音频模型在各种年龄、性别、明显的肤色和周围光线条件下的准确性,以消除 AI 偏见。

Casual Conversations 中包含了 3011 名参与者的 45000 多个视频,均匀分布了不同的性别、年龄段和肤色。Facebook 要求其中的付费参与者提交视频并自己提供了年龄和性别标签,以尽可能地消除误差。

此外,Facebook 还为 Casual Conversations 招募了一些训练有素的注释员。这些注释员在每个视频中标注了光照水平,以帮助衡量 AI 模型在低光环境条件下如何对待不同肤色的人。并根据 Fitzpatrick 量表对参与者的肤色进行了标记。Fitzpatrick 量表是美国皮肤科医生 Thomas B. Fitzpatrick 在 1975 年开发的一种肤色分类模式,根据皮肤类型对紫外线的反应进行了概括分类,包括了 I 型(总是灼伤而从不晒黑的苍白皮肤)到 VI 型(从不灼伤的深色素皮肤)。

Facebook 的 AI 团队指出,其新的 Casual Conversations 数据集除了准确性测试外,还应该作为一种辅助工具,用于衡量数据集所代表的社区的计算机视觉和音频模型的公平性。

目前,虽然该数据集已经提供给开源社区使用,但 Facebook 也指出,Casual Conversations 仍有其局限性。例如,其只提供了”男性“、”女性“和”其他“的性别标签选项,而没有包含那些认定为非二元的之类的性别。

该公司表示,在接下里的一年左右的时间里,其将继续探索扩大这一数据集的途径,使其更具包容性,代表的内容包括更广泛的性别认同、年龄、地理位置、活动和其他特征。

详情可查看

本文转自OSCHINA

本文标题:Facebook 开源数据集,旨在消除 AI 偏见

本文地址:https://www.oschina.net/news/136989/facebook-casual-conversations-dataset

责任编辑:未丽燕 来源: 开源中国
相关推荐

2022-07-18 10:40:29

人工智能AI

2022-12-08 13:00:10

AI性别偏见

2010-09-29 09:07:54

2020-03-13 09:48:04

大数据人工智能安全

2023-12-25 07:50:22

2010-09-28 14:24:15

AMD12核处理器

2018-10-22 09:23:00

FacebookAI框架人工智能

2012-06-04 13:25:34

Facebook开源

2018-04-16 08:56:40

2022-10-26 09:20:03

AI招聘

2021-06-04 15:50:49

AI 数据人工智能

2023-02-07 10:01:37

人工智能

2018-10-19 12:16:06

开源技术 数据

2014-02-14 13:10:29

数据加密FacebookConceal

2016-09-04 16:43:01

2020-11-27 14:34:09

人工智能机器学习工具

2022-06-17 11:37:43

人工智能监督金融机构

2019-01-30 10:40:46

Google Brai人工智能机器学习

2019-03-15 14:27:36

Facebook 开发开源

2013-08-21 12:29:12

Facebook开源
点赞
收藏

51CTO技术栈公众号