Uma das formas mais recentes de as empresas de redes sociais rentabilizarem os dados dos utilizadores é através de acordos com empresas de IA. Mas há alguma coisa que possa fazer para proteger os seus dados e conteúdos?
A IA vai deitar a mão aos seus dados das redes sociais!
A utilização de dados das redes sociais para treinar modelos de IA generativa tem sido um passo controverso. No entanto isso não parece estar a impedir as empresas de redes sociais de distribuir os dados dos utilizadores.
Como Mike Clark, Responsável de Produto da Meta, afirmou numa publicação “publicações partilhadas publicamente no Instagram e no Facebook – incluindo fotos e texto – faziam parte dos dados usados para treinar os modelos de IA generativos subjacentes às funções anunciadas no Connect.”
Esta tendência não parece estar a abrandar em 2024. O Reddit fechou um acordo coma Google para disponibilizar o conteúdo da plataforma de modo a treinar os modelos de IA.
E embora a Meta e o Reddit sejam alguns dos maiores nomes das redes sociais, não são as únicas plataformas envolvidas na utilização de dados das redes sociais para treinar IA. De acordo com um relatório da 404 Media, o Tumblr e o WordPress.com estão a preparar-se para vender dados de utilizadores à Midjourney e à OpenAI.
É provável que, se utiliza o Facebook, Instagram, Reddit, Tumblr ou WordPress.com, o seu conteúdo publicamente disponível já tenha sido utilizado na formação de LLMs.
Com os acordos em curso entre as empresas de IA e as empresas de redes sociais, os acordos de licenciamento significarão que estes dados serão vendidos ativamente e não apenas retirados da Web.
Mas quando se trata de processamento futuro, o que é que se pode fazer?
A Meta introduziu um formulário para os direitos do titular dos dados de IA generativa. Assim permite opor-se ou restringir o processamento dos seus dados pessoais de terceiros para treinar os modelos de IA generativa da Meta.
O Tumblr também introduziu uma opção para não partilhar o conteúdo dos seus blogues públicos com terceiros, utilizando as definições do seu blogue. Pode encontrá-la nas suas definições e deslocando-se para baixo até às definições de Visibilidade. Em seguida, opte por Impedir a partilha por terceiros no seu blogue.
Quando se trata de uma plataforma como o Instagram, pode tentar mudar a sua conta do Instagram para privada. Isto para impedir a utilização dos seus dados. Isto não garante que os seus dados não sejam utilizados, mas como a recolha de dados para os LLM parece centrar-se em dados públicos, pode ser uma salvaguarda potencial.
Também pode tornar a sua conta X (Twitter) privada. No entanto, mais uma vez, isto é apenas uma potencial salvaguarda e não garante que os seus dados permaneçam privados.
Receba as notícias Leak no seu e-mail. Carregue aqui para se registar. É grátis!