Битва за аннотирование данных в AI-индустрии: от конкуренции вычислительной мощности до соревнования за качество данных
В последнее время в области искусственного интеллекта произошло значительное событие: одна из известных социальных медиа-компаний потратила 14,8 миллиарда долларов на приобретение почти половины акций компании по разметке данных Scale AI. Этот шаг вызвал огромный резонанс в Силиконовой долине и заставил задуматься: почему разметка данных внезапно стала такой ценной?
В то же время другой блокчейн-проект SaharaLabsAI, который собирается выпустить токены, все еще сталкивается с сомнениями в связи с "раздуванием концепции и отсутствием сути". Каковы ключевые факторы, которые рынок, похоже, игнорирует за этим ярким контрастом?
Прежде всего, мы должны осознать, что аннотирование данных имеет большую ценность и потенциал, чем агрегирование распределительной вычислительной мощности. Хотя история о том, как использовать неиспользуемые ресурсы GPU для конкуренции с крупными облачными провайдерами, звучит очень привлекательно, на самом деле вычислительная мощность является стандартным товаром, основное отличие которого заключается в цене и доступности. Ценовое преимущество может показаться возможностью выжить в условиях монополии гигантов, но доступность ограничивается такими факторами, как географическое положение, задержка сети и участие пользователей. Как только большие компании снижают цены или увеличивают предложение, это преимущество быстро исчезает.
В отличие от этого, аннотирование данных является областью, которая требует человеческой мудрости и профессионального суждения. Каждая высококачественная аннотация заключает в себе уникальные профессиональные знания, культурный контекст и когнитивный опыт, которые невозможно просто стандартизировать и воспроизвести, как вычислительную мощность GPU. Например, точная аннотация для диагностики рака на основе изображений требует профессиональной интуиции опытного онколога; глубокий анализ рыночных настроений в финансовом секторе невозможен без практического опыта опытного трейдера. Эта естественная редкость и незаменимость придают аннотированию данных конкурентные преимущества, которые не могут быть сравнены с вычислительной мощностью.
Недавно крупная технологическая компания официально объявила о приобретении 49% акций компании по маркировке данных Scale AI за 14,8 миллиарда долларов. Это крупнейшая единовременная инвестиция в области ИИ в этом году. Более того, молодой основатель и CEO Scale AI одновременно возглавит новый созданный "Суперумный" исследовательский лабораторный центр этого технологического гиганта.
Этот 25-летний предприниматель основал Scale AI в 2016 году, будучи отчисленным из Стэнфордского университета, и сейчас его компания оценивается в 30 миллиардов долларов. Список клиентов Scale AI можно назвать "звездным составом" в мире ИИ: в него входят несколько известных исследовательских учреждений в области ИИ, автопроизводители, технологические гиганты и государственные органы. Компания специализируется на предоставлении высококачественных услуг по аннотированию данных для обучения ИИ-моделей и имеет более 300 000 профессионально обученных аннотаторов.
Пока большинство людей все еще спорят о том, чья AI модель работает лучше, настоящие лидеры отрасли уже тихо перенесли поле боя к источникам данных. Началась "темная война" за будущее господство в области AI.
Успех Scale AI раскрывает игнорируемый факт: на текущем этапе вычислительная мощность больше не является дефицитом, архитектура моделей также становится однородной, и действительно определяющим пределом интеллекта ИИ являются тщательно обработанные качественные данные. Крупные технологические компании тратят огромные суммы не только на покупку аутсорсинговой компании, но и на "права на добычу нефти" в эпоху ИИ.
Однако монополия всегда вызывает сопротивление. Так же как распределенные вычислительные мощности пытаются подорвать централизованные облачные сервисы, Sahara AI пытается с помощью технологий блокчейн полностью переосмыслить правила распределения ценности в аннотации данных. Основная проблема традиционной модели аннотации данных заключается не в технологии, а в недостатках проектирования механизма стимулов.
Например, в медицинской сфере врач может потратить часы на разметку медицинских изображений, но получить лишь мизерное вознаграждение, в то время как AI модели, обученные на этих данных, могут стоить миллиарды долларов, и врач не может разделить прибыль. Эта серьезная несправедливость в распределении ценности сильно подавляет желание поставлять качественные данные.
А при поддержке технологии блокчейн и токеномики, данные аннотаторы больше не являются дешевыми "данными рабочими", а настоящими "акционерами" сети AI языковых моделей. Очевидно, что преимущества технологий Web3 в трансформации производственных отношений более подходят для сценариев аннотирования данных, чем в области вычислительной мощности.
Интересно, что Sahara AI как раз в момент объявления о дорогом приобретении этой крупной технологической компанией готовится выпустить токены. Это совпадение или тщательно продуманный план? На мой взгляд, это на самом деле отражает важный поворотный момент на рынке: как традиционные технологические компании, так и блокчейн-проекты уже перешли от "сравнения вычислительной мощности" к новой стадии "конкуренции за качество данных".
Когда традиционные гиганты пытаются создать барьеры данных с помощью капитальных преимуществ, область Web3 исследует более инклюзивный эксперимент по "демократизации данных" через токеномическую модель. Результат этой битвы за разметку данных, вероятно, определит будущее развития технологий ИИ.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
7 Лайков
Награда
7
5
Репост
Поделиться
комментарий
0/400
rug_connoisseur
· 11ч назад
14.8 миллиардов, и это всё?
Посмотреть ОригиналОтветить0
MetamaskMechanic
· 11ч назад
Разогнаться до 14,8 миллиардов долларов США действительно может ли это повлиять на данные?
Посмотреть ОригиналОтветить0
SellLowExpert
· 11ч назад
Ах, за 14,8 миллиарда что угодно можно купить, только не это.
Посмотреть ОригиналОтветить0
GreenCandleCollector
· 11ч назад
14.8 миллиардов? С ума сошли?
Посмотреть ОригиналОтветить0
MagicBean
· 11ч назад
Торговля криптовалютой торговля многими токенами, а теперь снова торговля AI, ах.
Битва за аннотацию данных ИИ: от конкуренции вычислительной мощности до соревнования за качество
Битва за аннотирование данных в AI-индустрии: от конкуренции вычислительной мощности до соревнования за качество данных
В последнее время в области искусственного интеллекта произошло значительное событие: одна из известных социальных медиа-компаний потратила 14,8 миллиарда долларов на приобретение почти половины акций компании по разметке данных Scale AI. Этот шаг вызвал огромный резонанс в Силиконовой долине и заставил задуматься: почему разметка данных внезапно стала такой ценной?
В то же время другой блокчейн-проект SaharaLabsAI, который собирается выпустить токены, все еще сталкивается с сомнениями в связи с "раздуванием концепции и отсутствием сути". Каковы ключевые факторы, которые рынок, похоже, игнорирует за этим ярким контрастом?
Прежде всего, мы должны осознать, что аннотирование данных имеет большую ценность и потенциал, чем агрегирование распределительной вычислительной мощности. Хотя история о том, как использовать неиспользуемые ресурсы GPU для конкуренции с крупными облачными провайдерами, звучит очень привлекательно, на самом деле вычислительная мощность является стандартным товаром, основное отличие которого заключается в цене и доступности. Ценовое преимущество может показаться возможностью выжить в условиях монополии гигантов, но доступность ограничивается такими факторами, как географическое положение, задержка сети и участие пользователей. Как только большие компании снижают цены или увеличивают предложение, это преимущество быстро исчезает.
В отличие от этого, аннотирование данных является областью, которая требует человеческой мудрости и профессионального суждения. Каждая высококачественная аннотация заключает в себе уникальные профессиональные знания, культурный контекст и когнитивный опыт, которые невозможно просто стандартизировать и воспроизвести, как вычислительную мощность GPU. Например, точная аннотация для диагностики рака на основе изображений требует профессиональной интуиции опытного онколога; глубокий анализ рыночных настроений в финансовом секторе невозможен без практического опыта опытного трейдера. Эта естественная редкость и незаменимость придают аннотированию данных конкурентные преимущества, которые не могут быть сравнены с вычислительной мощностью.
Недавно крупная технологическая компания официально объявила о приобретении 49% акций компании по маркировке данных Scale AI за 14,8 миллиарда долларов. Это крупнейшая единовременная инвестиция в области ИИ в этом году. Более того, молодой основатель и CEO Scale AI одновременно возглавит новый созданный "Суперумный" исследовательский лабораторный центр этого технологического гиганта.
Этот 25-летний предприниматель основал Scale AI в 2016 году, будучи отчисленным из Стэнфордского университета, и сейчас его компания оценивается в 30 миллиардов долларов. Список клиентов Scale AI можно назвать "звездным составом" в мире ИИ: в него входят несколько известных исследовательских учреждений в области ИИ, автопроизводители, технологические гиганты и государственные органы. Компания специализируется на предоставлении высококачественных услуг по аннотированию данных для обучения ИИ-моделей и имеет более 300 000 профессионально обученных аннотаторов.
Пока большинство людей все еще спорят о том, чья AI модель работает лучше, настоящие лидеры отрасли уже тихо перенесли поле боя к источникам данных. Началась "темная война" за будущее господство в области AI.
Успех Scale AI раскрывает игнорируемый факт: на текущем этапе вычислительная мощность больше не является дефицитом, архитектура моделей также становится однородной, и действительно определяющим пределом интеллекта ИИ являются тщательно обработанные качественные данные. Крупные технологические компании тратят огромные суммы не только на покупку аутсорсинговой компании, но и на "права на добычу нефти" в эпоху ИИ.
Однако монополия всегда вызывает сопротивление. Так же как распределенные вычислительные мощности пытаются подорвать централизованные облачные сервисы, Sahara AI пытается с помощью технологий блокчейн полностью переосмыслить правила распределения ценности в аннотации данных. Основная проблема традиционной модели аннотации данных заключается не в технологии, а в недостатках проектирования механизма стимулов.
Например, в медицинской сфере врач может потратить часы на разметку медицинских изображений, но получить лишь мизерное вознаграждение, в то время как AI модели, обученные на этих данных, могут стоить миллиарды долларов, и врач не может разделить прибыль. Эта серьезная несправедливость в распределении ценности сильно подавляет желание поставлять качественные данные.
А при поддержке технологии блокчейн и токеномики, данные аннотаторы больше не являются дешевыми "данными рабочими", а настоящими "акционерами" сети AI языковых моделей. Очевидно, что преимущества технологий Web3 в трансформации производственных отношений более подходят для сценариев аннотирования данных, чем в области вычислительной мощности.
Интересно, что Sahara AI как раз в момент объявления о дорогом приобретении этой крупной технологической компанией готовится выпустить токены. Это совпадение или тщательно продуманный план? На мой взгляд, это на самом деле отражает важный поворотный момент на рынке: как традиционные технологические компании, так и блокчейн-проекты уже перешли от "сравнения вычислительной мощности" к новой стадии "конкуренции за качество данных".
Когда традиционные гиганты пытаются создать барьеры данных с помощью капитальных преимуществ, область Web3 исследует более инклюзивный эксперимент по "демократизации данных" через токеномическую модель. Результат этой битвы за разметку данных, вероятно, определит будущее развития технологий ИИ.