La bataille de l'annotation des données AI : de la compétition de puissance de calcul à la compétition de qualité

robot
Création du résumé en cours

Guerre de l'annotation des données dans l'industrie de l'IA : de la compétition de puissance de calcul à la compétition de qualité des données

Récemment, un événement marquant s'est produit dans le domaine de l'intelligence artificielle : une célèbre entreprise de médias sociaux a dépensé 14,8 milliards de dollars pour acquérir près de la moitié des actions de la société de marquage de données Scale AI. Ce mouvement a suscité une énorme réaction dans la Silicon Valley, amenant à se demander : pourquoi le marquage de données est-il devenu si précieux soudainement ?

En attendant, un autre projet blockchain de jetons à venir, SaharaLabsAI, fait face à des critiques concernant "le concept de spéculation et le manque de substance". Derrière ce contraste frappant, quel facteur clé le marché a-t-il donc négligé ?

Tout d'abord, nous devons reconnaître que l'annotation des données a plus de valeur et de potentiel que l'agrégation de la puissance de calcul distribuée. Bien que l'idée d'utiliser des ressources GPU inutilisées pour défier les grands fournisseurs de services cloud semble attrayante, en réalité, la puissance de calcul est essentiellement une marchandise standardisée, dont la principale différence réside dans le prix et la disponibilité. L'avantage de prix semble permettre de trouver un espace de survie dans le monopole des géants, mais la disponibilité est limitée par des facteurs tels que la localisation géographique, la latence réseau et le niveau d'engagement des utilisateurs. Une fois que les grandes entreprises baissent leurs prix ou augmentent leur offre, cet avantage disparaît rapidement.

En comparaison, l'annotation des données est un domaine différencié qui nécessite l'intelligence humaine et le jugement professionnel. Chaque annotation de haute qualité incarne des connaissances spécialisées uniques, un contexte culturel et une expérience cognitive, qui ne peuvent pas être standardisées et reproduites aussi facilement que la Puissance de calcul d'un GPU. Par exemple, une annotation précise du diagnostic d'imagerie du cancer nécessite l'intuition professionnelle d'un oncologue expérimenté ; une analyse approfondie du sentiment du marché financier dépend de l'expérience pratique d'un trader chevronné. Cette rareté et cette irremplaçabilité naturelles confèrent à l'annotation des données un avantage concurrentiel inégalé par la Puissance de calcul.

Récemment, une grande entreprise technologique a officiellement annoncé l'acquisition de 49 % des actions de l'entreprise de marquage de données Scale AI pour 14,8 milliards de dollars, ce qui constitue le plus grand investissement unique dans le domaine de l'IA cette année. Il est encore plus intéressant de noter que le jeune fondateur et PDG de Scale AI sera également responsable du nouveau laboratoire de recherche "Super Intelligence" créé par ce géant technologique.

Cet entrepreneur de seulement 25 ans a fondé Scale AI en 2016 alors qu'il était étudiant en décrochage à l'Université de Stanford. Aujourd'hui, l'entreprise qu'il dirige est évaluée à 30 milliards de dollars. La liste des clients de Scale AI peut être considérée comme un "all-star lineup" dans le domaine de l'IA : elle comprend plusieurs organismes de recherche en IA de renom, des constructeurs automobiles, des géants de la technologie et des départements gouvernementaux. L'entreprise se spécialise dans la fourniture de services d'annotation de données de haute qualité pour l'entraînement des modèles d'IA, avec plus de 300 000 annotateurs formés professionnellement.

Alors que la plupart des gens débattent encore des performances des modèles d'IA des différentes entreprises, de véritables leaders du secteur ont discrètement déplacé le champ de bataille vers la source des données. Une "guerre froide" pour le contrôle futur de l'IA a déjà commencé.

Le succès de Scale AI révèle un fait négligé : à ce stade, la puissance de calcul n'est plus une ressource rare, l'architecture des modèles tend également à se standardiser, et ce qui détermine réellement le plafond d'intelligence de l'IA, ce sont les données de haute qualité soigneusement traitées. Les grandes entreprises technologiques n'achètent pas seulement une entreprise de sous-traitance, mais plutôt le "droit d'extraction de pétrole" à l'ère de l'IA.

Cependant, le monopole suscite toujours la résistance. Tout comme les plateformes de puissance de calcul distribuée tentent de renverser les services de cloud computing centralisés, Sahara AI tente de redéfinir complètement les règles de répartition de la valeur de l'annotation des données grâce à la technologie blockchain. Le problème central du modèle traditionnel d'annotation des données ne réside pas dans la technologie, mais dans les défauts de conception du mécanisme d'incitation.

Prenons l'exemple du domaine médical, un médecin peut passer des heures à annoter des images médicales, mais ne recevoir qu'une maigre rémunération, tandis que les modèles d'IA entraînés avec ces données peuvent valoir des milliards de dollars, sans que le médecin ne puisse partager les bénéfices. Ce modèle de répartition des valeurs extrêmement injuste dissuade fortement la volonté de fournir des données de haute qualité.

Et avec le soutien de la technologie blockchain et de l'économie des tokens, les annotateurs de données ne sont plus de simples "travailleurs des données" à bas prix, mais de véritables "actionnaires" du réseau des modèles de langage AI. Il est évident que les avantages de la technologie Web3 en matière de transformation des relations de production sont plus adaptés aux scénarios d'annotation de données qu'à ceux de la Puissance de calcul.

Il est intéressant de noter que Sahara AI se prépare à émettre des tokens au moment où cette grande entreprise technologique annonce une acquisition à prix exorbitant. Est-ce une coïncidence ou un plan bien orchestré ? À mon avis, cela reflète en réalité un tournant important sur le marché : que ce soit pour les entreprises technologiques traditionnelles ou les projets blockchain, nous sommes déjà passés de la "compétition en puissance de calcul" à une nouvelle phase de "compétition en qualité des données".

Lorsque les géants traditionnels tentent de construire des barrières de données avec un avantage capital, le domaine du Web3 explore une expérience de "démocratisation des données" plus inclusive à travers l'économie des tokens. Le résultat de cette bataille pour l'annotation des données pourrait bien déterminer l'orientation future du développement de la technologie IA.

SAHARA3.45%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 6
  • Reposter
  • Partager
Commentaire
0/400
SellTheBouncevip
· Il y a 3h
Encore un projet de prise des gens pour des idiots... attendons que ça chute.
Voir l'originalRépondre0
rug_connoisseurvip
· Il y a 19h
14,8 milliards, c'est tout ?
Voir l'originalRépondre0
MetamaskMechanicvip
· Il y a 19h
Friture jusqu'à 14,8 milliards de dollars américains, peut-on vraiment marquer des données ?
Voir l'originalRépondre0
SellLowExpertvip
· Il y a 19h
Ah, avec 14,8 milliards, pourquoi acheter ça, c'est pas une bonne idée.
Voir l'originalRépondre0
GreenCandleCollectorvip
· Il y a 19h
14,8 milliards ? Tu es devenu fou ?
Voir l'originalRépondre0
MagicBeanvip
· Il y a 19h
Trading des cryptomonnaies a trop été fait, maintenant on se met à trader l'IA, sigh.
Voir l'originalRépondre0
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)