Битва за аннотацию данных ИИ: от конкуренции вычислительной мощности до соревнования за качество

robot
Генерация тезисов в процессе

Битва за аннотирование данных в AI-индустрии: от конкуренции вычислительной мощности до соревнования за качество данных

В последнее время в области искусственного интеллекта произошло значительное событие: одна из известных социальных медиа-компаний потратила 14,8 миллиарда долларов на приобретение почти половины акций компании по разметке данных Scale AI. Этот шаг вызвал огромный резонанс в Силиконовой долине и заставил задуматься: почему разметка данных внезапно стала такой ценной?

В то же время другой блокчейн-проект SaharaLabsAI, который собирается выпустить токены, все еще сталкивается с сомнениями в связи с "раздуванием концепции и отсутствием сути". Каковы ключевые факторы, которые рынок, похоже, игнорирует за этим ярким контрастом?

Прежде всего, мы должны осознать, что аннотирование данных имеет большую ценность и потенциал, чем агрегирование распределительной вычислительной мощности. Хотя история о том, как использовать неиспользуемые ресурсы GPU для конкуренции с крупными облачными провайдерами, звучит очень привлекательно, на самом деле вычислительная мощность является стандартным товаром, основное отличие которого заключается в цене и доступности. Ценовое преимущество может показаться возможностью выжить в условиях монополии гигантов, но доступность ограничивается такими факторами, как географическое положение, задержка сети и участие пользователей. Как только большие компании снижают цены или увеличивают предложение, это преимущество быстро исчезает.

В отличие от этого, аннотирование данных является областью, которая требует человеческой мудрости и профессионального суждения. Каждая высококачественная аннотация заключает в себе уникальные профессиональные знания, культурный контекст и когнитивный опыт, которые невозможно просто стандартизировать и воспроизвести, как вычислительную мощность GPU. Например, точная аннотация для диагностики рака на основе изображений требует профессиональной интуиции опытного онколога; глубокий анализ рыночных настроений в финансовом секторе невозможен без практического опыта опытного трейдера. Эта естественная редкость и незаменимость придают аннотированию данных конкурентные преимущества, которые не могут быть сравнены с вычислительной мощностью.

Недавно крупная технологическая компания официально объявила о приобретении 49% акций компании по маркировке данных Scale AI за 14,8 миллиарда долларов. Это крупнейшая единовременная инвестиция в области ИИ в этом году. Более того, молодой основатель и CEO Scale AI одновременно возглавит новый созданный "Суперумный" исследовательский лабораторный центр этого технологического гиганта.

Этот 25-летний предприниматель основал Scale AI в 2016 году, будучи отчисленным из Стэнфордского университета, и сейчас его компания оценивается в 30 миллиардов долларов. Список клиентов Scale AI можно назвать "звездным составом" в мире ИИ: в него входят несколько известных исследовательских учреждений в области ИИ, автопроизводители, технологические гиганты и государственные органы. Компания специализируется на предоставлении высококачественных услуг по аннотированию данных для обучения ИИ-моделей и имеет более 300 000 профессионально обученных аннотаторов.

Пока большинство людей все еще спорят о том, чья AI модель работает лучше, настоящие лидеры отрасли уже тихо перенесли поле боя к источникам данных. Началась "темная война" за будущее господство в области AI.

Успех Scale AI раскрывает игнорируемый факт: на текущем этапе вычислительная мощность больше не является дефицитом, архитектура моделей также становится однородной, и действительно определяющим пределом интеллекта ИИ являются тщательно обработанные качественные данные. Крупные технологические компании тратят огромные суммы не только на покупку аутсорсинговой компании, но и на "права на добычу нефти" в эпоху ИИ.

Однако монополия всегда вызывает сопротивление. Так же как распределенные вычислительные мощности пытаются подорвать централизованные облачные сервисы, Sahara AI пытается с помощью технологий блокчейн полностью переосмыслить правила распределения ценности в аннотации данных. Основная проблема традиционной модели аннотации данных заключается не в технологии, а в недостатках проектирования механизма стимулов.

Например, в медицинской сфере врач может потратить часы на разметку медицинских изображений, но получить лишь мизерное вознаграждение, в то время как AI модели, обученные на этих данных, могут стоить миллиарды долларов, и врач не может разделить прибыль. Эта серьезная несправедливость в распределении ценности сильно подавляет желание поставлять качественные данные.

А при поддержке технологии блокчейн и токеномики, данные аннотаторы больше не являются дешевыми "данными рабочими", а настоящими "акционерами" сети AI языковых моделей. Очевидно, что преимущества технологий Web3 в трансформации производственных отношений более подходят для сценариев аннотирования данных, чем в области вычислительной мощности.

Интересно, что Sahara AI как раз в момент объявления о дорогом приобретении этой крупной технологической компанией готовится выпустить токены. Это совпадение или тщательно продуманный план? На мой взгляд, это на самом деле отражает важный поворотный момент на рынке: как традиционные технологические компании, так и блокчейн-проекты уже перешли от "сравнения вычислительной мощности" к новой стадии "конкуренции за качество данных".

Когда традиционные гиганты пытаются создать барьеры данных с помощью капитальных преимуществ, область Web3 исследует более инклюзивный эксперимент по "демократизации данных" через токеномическую модель. Результат этой битвы за разметку данных, вероятно, определит будущее развития технологий ИИ.

SAHARA2.31%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 5
  • Репост
  • Поделиться
комментарий
0/400
rug_connoisseurvip
· 11ч назад
14.8 миллиардов, и это всё?
Посмотреть ОригиналОтветить0
MetamaskMechanicvip
· 11ч назад
Разогнаться до 14,8 миллиардов долларов США действительно может ли это повлиять на данные?
Посмотреть ОригиналОтветить0
SellLowExpertvip
· 11ч назад
Ах, за 14,8 миллиарда что угодно можно купить, только не это.
Посмотреть ОригиналОтветить0
GreenCandleCollectorvip
· 11ч назад
14.8 миллиардов? С ума сошли?
Посмотреть ОригиналОтветить0
MagicBeanvip
· 11ч назад
Торговля криптовалютой торговля многими токенами, а теперь снова торговля AI, ах.
Посмотреть ОригиналОтветить0
  • Закрепить