查看原文
其他

数据不够用了!谷歌正在花大价钱购买“美版贴吧”的数据

曼谈AI 曼谈AI
2024-09-06
据路透社周三报道,谷歌已与美国社交媒体Reddit平台(类似贴吧)签订了内容许可协议,这家搜索巨头将每年向Reddit支付6000万美元以获取其内容数据。
目前还不清楚谷歌将在训练其人工智能模型时使用Reddit的哪部分内容。然而,一些Reddit用户抨击了谷歌与Reddit的协议,并指责这个社交网站未经他们的同意从用户数据中获利。
还有一些人对训练过Reddit数据的AI模型可能会表现出怎样的行为感到恐惧。考虑到自2005年成立以来该网站上发布的一些离经叛道的帖子,这种担忧并非毫无根据。
首先,人们写了一些非常奇怪内容。就拿下面这个家伙来说,他声称在2014年遭遇了一个特别卡夫卡式的情境,“我向我女朋友承认,当我们嘿咻的时候,我假装她是一只大蟑螂”(这篇帖子获得了超过5200次的点赞。):
更不用说Reddit上的一个叫r/AmItheAsshole的子论坛。在这个论坛上,用户会分享各种各样的情景和故事,并询问其他人。通常涉及各种社交和道德问题,有时候会是比较棘手的情况。比如这个人问,如何不继续与同事的包办婚姻:
还有一些Reddit帖子是黑暗但有趣的,有个家伙在2015年写的一个长帖子被疯狂传播,他讲述了他如何去他女朋友父母家,假装不知道什么是土豆,然后被她愤怒的父亲赶出了家门。
当然,Reddit也有积极的一面。一些平台用户写了有价值、鼓舞人心的帖子,并提供了有用的生活和职业建议。
总的来说,社交媒体对于渴望训练其模型的数据饥渴的人工智能公司来说是丰富的素材。埃隆·马斯克就一直在利用 X(前身为Twitter)的数据来训练他的人工智能公司的聊天机器人 Grok。
不知道经过这些数据训练过的模型,是更有人味儿了呢,还是更离谱。
谷歌和Reddit的代表暂时还没有做出回应。
小伙伴们关注起来谨防走丢啦:
继续滑动看下一个
曼谈AI
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存