Da Redação Avance News
Tudo sobre Inteligência Artificial
Tudo sobre OpenAI
A empresa controladora do Tumblr e do WordPress.com, a Automattic, pode estar negociando com as desenvolvedoras OpenAI e Midjourney para vender dados de publicações de usuários para treinamento de IA.
Por enquanto, a notícia é um rumor divulgado em relatório pela 404 Media a partir de fontes internas da companhia, mas, segundo o site, o compartilhamento dos dados já começou.
Leia mais:
Tumblr e WordPress vs. IA
O relatório divulgado pelo site se baseia em fonte anônima dentro da Automattic. De acordo com ela, a parceria entre a controladora e as desenvolvedoras de IA é “iminente”.
O 404 também diz que a Automattic planeja lançar configuração ainda nesta semana, na quarta-feira (28), permitindo que usuários do Tumblr cancelem o “compartilhamento de dados com terceiros, incluindo empresas de IA”.
No entanto, segundo a fonte, documentos internos indicam que a rede social já fez “despejo de dados inicial” para as desenvolvedoras, incluindo conteúdo anterior à configuração, de 2014 a 2023. Alguns deles não estariam sequer visíveis publicamente no Tumblr, mas não está claro exatamente quais dados foram compartilhados.
Uma publicação feita nesta terça-feira (27) da empresa controladora, intitulada “Protegendo a escolha do usuário” (em tradução livre) já dá a entender parcerias com companhias de IA não nomeadas. O documento diz:
Compartilharemos apenas conteúdo público hospedado no WordPress.com e no Tumblr de sites que não cancelaram. Também estamos trabalhando diretamente com empresas selecionadas de IA, desde que seus planos estejam alinhados com o que interessa à nossa comunidade: atribuição, opt-outs e controle.
Automattic, em postagem em blog
Midjourney e OpenAI não responderam a pedidos de comentários do The Verge.
Automattic não é a única
Se a decisão da Automattic se concretizar, o Tumblr e o WordPress.com não serão as primeiras plataformas a fecharem acordos com desenvolvedoras de IA para vender dados para treinamento.
O Reddit vendeu dados para o Google e a Shutterstock permitiu que a OpenAI treinasse seu modelo de linguagem a partir de sua biblioteca de fotos.
Como lembra o The Verge, a situação se complica no caso do Tumblr porque a plataforma é conhecida por seu público criativo, como escritores e ilustradores. Esse mesmo público já vem se manifestando publicamente há algum tempo contra o uso de seus trabalhos para treinar IAs sem as devidas remunerações.