AI公司"偷窃"超10万个视频:只为训练模型

zy520b

时间 2024年7月26日 预览 5

转载:https://ai.zol.com.cn/887/8870629.html

2024-07-26 17:31:00·[??中关村在线 原创??]·作者:清风与鹿

据404 Media的报道,人工智能驱动的工具和应用程序所生成的内容给人留下了深刻印象。然而,这些人工智能公司是如何获得数据来训练他们的模型呢?

据报道,一家名为Runway的人工智能视频生成公司,在未得到创作者或YouTube许可的情况下,使用了大量的视频进行训练,同时还利用盗版内容来训练他们的AI模型。他们收到一份电子表格,列出了视频的来源以及数量,这些视频来自各大新闻媒体以及频道,总数超过10万个。

一位不愿透露姓名的前员工向404 Media透露:“该电子表格中的频道是全公司范围为寻找高质量视频用于训练模型而做出的努力。之后,这些视频会被爬虫下载下来,并且我们还使用了代理以避免被谷歌阻止。”

根据最新调查结果显示,由AI驱动的工具和应用程序所生成的内容无疑给人留下了深刻的印象。但人们不禁要问:这些人工智能公司从何处获得数据来训练它们的模型呢

据了解,有一家名为Runway的人工智能视频生成公司在未经创作者或YouTube许可的情况下,利用大量视频进行了训练,并且还利用盗版内容来培训其AI模型。据悉,他们收到了一个包含视频来源和数量等详细信息的电子表格,这些视频来自于不同新闻机构和频道共计超过十万个。

一位不愿透露姓名的前员工向我们揭示了更多细节:“这个电子表格包含了所有我们公司寻找高质量视频以便进行模型训练所做出的努力。之后,这些视频被通过爬虫技术下载到服务器中,并且我们还采取了各种措施以确保不会被谷歌或其他平台屏蔽。”

本文属于原创文章,如若转载,请注明来源:AI公司"偷窃"超10万个视频:只为训练模型https://ai.zol.com.cn/887/8870629.html

Copyright2023未知边界网络科技
拨打电话拨打电话
Copyright2023未知边界网络科技