A6af38b69673eb960e02fea100d74e23714a1b2b 1280x853.jpg

Propriedade de dados na era da IA

Você está nadando em dados. Você está criando novos dados todos os dias. Se o seu aplicativo de saúde tiver suas etapas? São novos dados. O anel de Oala que está rastreando sua bio-metrics? Dados valiosos. Suas postagens nas redes sociais, até as piadas estúpidas que receberam zero gostos? Mais dados.

São todos os dados que as empresas de IA adorariam colher. Você não pode construir uma boa IA sem bons dados, e é por isso que muitos visualizam os dados como o “novo petróleo ‘na corrida para a IA. O problema, no entanto, é que, embora seus dados sejam valiosos em teoriaa realidade é que é difícil monetizar seus próprios dados pessoais, pois você não tem alavancagem como indivíduo. (A IA aberta não está batendo à sua porta para comprar seus tweets antigos.)

Digitar Vana. “Acho que os dados são esse recurso fundamental que alimenta a próxima geração de IA e realmente a próxima geração de nossa economia digital”, diz Anna Kazlauskas, co-fundadora da VANA e CEO da Open Data Data Labs. “Muitas pessoas francamente simplesmente não percebem que realmente possuem seus dados”.

Mas você possui seus dados. E é valioso … se você puder unir forças com milhões de outras pessoas que também possuem seus dados. Isso lhe daria poder de barganha. E essa é a missão do Vana: criar um ecossistema para dados de propriedade do usuário, que por sua vez alimentam a IA de propriedade do usuário.

Esse ecossistema envolve uma mistura de DAOS de dados (um “sindicato” para dados), mercados de dados descentralizados, o lançado recentemente Token VRC-20e um novo colaboração Com laboratórios de flores para construir o primeiro modelo fundamental de propriedade do mundo. (Anexo A que a IA descentralizada está rastejando no mainstream: a colaboração Vana/Flor foi coberta por Conectado.)

Kazlauskas dará uma palestra no Cúpula da IA ​​no Consenso 2025 descrevendo essa visão, e ela dá um vislumbre aqui. E ela vê o momento mudando. “Já estamos começando a ver essa mudança onde mais pessoas percebem que ‘meus dados são realmente importantes para a IA’ e ‘Na verdade, sou o proprietário disso’.” Ela prevê que em alguns anos, mais de 100 milhões de usuários estarão a bordo. Em 10 anos? “População mundial. Acima de 10 bilhões.”

A entrevista foi condensada e levemente editada para clareza.

Por que os dados de propriedade do usuário são tão importantes para você?

Anna Kazlauskas: A maioria das pessoas assume que os dados pertencem às plataformas em que estão sentados, mas esse não é o caso. Da mesma maneira que quando você coloca seu carro em um estacionamento, o estacionamento não possui seu carro. Você sempre pode levar de volta. Você tem total propriedade sobre isso.

E há uma enorme quantia de dinheiro que está sendo ganha hoje, principalmente por grandes empresas de tecnologia, fora desses dados, mas os usuários são os proprietários legais. Então eu acho importante restaurar essa propriedade, tanto da perspectiva do usuário quanto da perspectiva de um desenvolvedor.

Você pode conectar os pontos de como isso ajuda os desenvolvedores?

Como desenvolvedor, especialmente em um mundo da IA, ter acesso aos dados corretos é realmente importante. E é super difícil de fazer agora, porque a maioria dos dados está bloqueada nos jardins murados da Big Tech. Muitos dos meus amigos realmente inteligentes que fazem coisas em Ai vão trabalhar no Big Labs, porque é aí que está os dados e é aí que está a computação. Mas esse não precisa ser o caso.

Como os dados dos dados se encaixam exatamente nessa visão?

Portanto, um Datadao é como um sindicato para dados. Onde basicamente você tem um grande grupo de pessoas que reúnem seus dados e depois podem tomar decisões coletivas sobre o que acontece com esses dados.

A razão pela qual isso é importante é que seus dados, por si só, não sejam tão úteis, certo? É muito mais útil quando há um grande pool. Quando há o suficiente para treinar um modelo de IA.

Quais são alguns dos dados do DAOS que você está mais animado?

Existem alguns no espaço de saúde que são realmente interessantes. Há um dos primeiros que está realmente fazendo exportações completas de registros médicos de pacientes, que eu acho que podem realmente ajudar a avançar muitas pesquisas no espaço. Há alguns relacionados à biometria, sono e saúde. Há um com o DLP [Driver Loyalty Program] Laboratórios; Eles estão construindo dados de carros. E dentro de seu conjunto de dados, os dados da Tesla são realmente interessantes porque a maioria das pessoas pensa em Tesla como valiosa porque tem um lead de dados, certo? Na verdade, os usuários podem obter muito desses dados.

Você está girando da teoria para a prática com a nova colaboração com os laboratórios de flores para construir o Collective-1. Qual é o objetivo lá?

O Collective-1 é o primeiro modelo de fundação pertencente ao usuário. Geralmente, quando as pessoas pensam em um modelo de fundação, elas normalmente pensam em uma empresa que executa um trabalho de treinamento muito grande em um único data center, certo? Como o OpenAI. E a razão pela qual normalmente é feita de maneira centralizada é porque exige, um, muita potência de computação e dois dados.

Flor Ai é uma espécie de líder em federado [decentralized] treinamento. Eles fizeram um ótimo trabalho ao construir essas ótimas bibliotecas de código aberto. Eles vieram do lado do treinamento e do lado do algoritmo. E com o Vana, nós realmente nos concentramos nessa peça de dados, certo? Então, basicamente, temos todos esses dados em que as pessoas podem treinar. Em seguida, você dá aos usuários que a propriedade final do modelo e os usuários podem decidir sobre o que o modelo pode fazer? Portanto, este é o primeiro modelo de fundação do gênero.

E a teoria é que, eventualmente, com melhores dados, você pode construir ai que não é apenas competitivo com os jogadores centrais, mas melhorarisso está certo? Portanto, não se trata apenas de ideologia, mas também de desempenho.

Exatamente, sim, isso é 100% certo. De um contexto descentralizado, acho que muitas vezes as pessoas concordam em princípio que: “Sim, devemos ter IA de propriedade do povo. Deveríamos ter uma IA descentralizada”. Mas o que podemos realmente fazer melhor em um contexto descentralizado? Dados são a resposta. Para cada empresa, eles só têm sua única fatia de um conjunto de dados. A Apple tem seus dados. O Google tem seus dados. Mas se você estiver passando pelo usuário, poderá cortar as plataformas e criar melhores conjuntos de dados do que qualquer empresa. Os dados são o molho secreto que faz tudo funcionar.

Adoro. Obrigado Anna, vejo você na cúpula da IA ​​em Toronto.

Jeff Wilser sediará a cúpula da IA ​​em consenso 2025 e é anfitrião de A IA do povo: o podcast AI descentralizado.

Fonte

Compartilhe:

Facebook
Twitter
LinkedIn
Pinterest
Pocket
WhatsApp

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *