Водещите доставчици на облачни услуги в Китай повишават цените на услугите, свързани с AI, присъединявайки се към глобалната вълна от увеличения, тъй като нарастващото търсене на изкуствен интелект повишава разходите за инфраструктура и натоварва веригите за доставки.
Alibaba Cloud заяви в сряда, че ще увеличи цените на AI изчислителните продукти и продуктите за съхранение с цели 34 процента, цитирайки „експлозия“ в глобалното търсене на AI и нарастващите разходи по веригата за доставки.
Корекциите включват нейните изчислителни карти T-Head Zhenwu 810E, с повишения на цените, вариращи от 5 процента до 34 процента, и неговия продукт за интелигентно изчислително съхранение CPFS, който ще се повиши с 30 процента.
В същия ден Baidu Cloud обяви „структурна оптимизация“ на ценообразуването в предложенията за AI изчисления и съхранение, като посочи бързо нарастващото търсене на AI приложения и рязко нарастващите разходи за основен хардуер и инфраструктура.
Почти едновременните ходове подчертаха по-широка промяна в индустрията: облачните доставчици по целия свят прехвърлят по-високите разходи за честотна лента, мрежа и изчислителен капацитет на клиентите, тъй като работните натоварвания на AI се мащабират бързо по размер и сложност.
Преносът на данни и мрежовите услуги се очертаха като ключова точка на натиск в последния кръг от увеличения на цените, като повишенията обикновено варират от 10 процента до 40 процента.
Основните доставчици, включително Amazon Web Services, Google Cloud, Microsoft Azure и Tencent Cloud, са коригирали цените за услуги, свързани с мрежата, отразявайки нарастващите разходи за честотна лента и основна инфраструктура.
Увеличенията следват подобни ходове по-рано тази година.
Amazon Web Services и Google Cloud повишиха цените на избрани предложения, като Google Cloud значително увеличи таксите за услуги за пренос на данни.
В Китай Tencent Cloud също повиши цените миналата сряда за своите големи модели услуги. Компанията каза, че е коригирала таксуването за части от своята платформа за разработка на AI агенти, за да осигури стабилна, висококачествена услуга.
Зад скоковете на цените се крие по-малко видим, но бързо засилващ се двигател: експлозия в използването на „токени“, единицата, чрез която AI моделите обработват и генерират данни.
Хора, запознати с операциите на Alibaba Cloud, казаха, че платформата модел като услуга е регистрирала най-бързия си растеж в историята между януари и март, тъй като компанията пренасочва оскъдните изчислителни ресурси към работни натоварвания, базирани на токени.
Въпреки че цената на токен е намаляла с течение на времето, общото потребление на токени нараства, тъй като по-новите модели на AI изпълняват по-сложни задачи за разсъждение. Приложения като задълбочени изследвания, AI агенти и генериране на код изискват значително повече токени за задача, компенсирайки печалбите в ефективността.
Възходът на автономните AI агенти ускорява тази тенденция. Продукти като OpenClaw бързо набраха популярност сред разработчиците, отбелязвайки преход от прости чатботове към системи, способни да изпълняват дългосрочни, многоетапни задачи.
Данните от OpenRouter, основна платформа за агрегиране на API модел на AI, показват потреблението на токени, свързани с OpenClaw, скочи от 80,6 милиарда на 3 февруари до 358 милиарда до началото на март – повече от три пъти за месец.
Седмичното използване на токени на платформата достигна 14,8 трилиона в началото на март, което е увеличение с около 160 процента за два месеца, като OpenClaw представлява основната част от увеличението.
Говорейки на неотдавнашна конференция, главният изпълнителен директор на Nvidia Дженсън Хуанг каза, че AI агентите често изискват повтарящи се обаждания в множество модели и инструменти, за да изпълнят една задача, което води до „увеличения от порядък на големина“ в използването на токени.
Анализатори от Huatai Securities казаха, че бързото внедряване на приложения в стил агент ще ускори допълнително търсенето на изчислителна мощност за изводи, потреблението на токени и инвестициите в инфраструктура.
Нарастващата популярност на такива приложения затяга наличността на облачни ресурси. Тъй като използването на токени нараства експоненциално, търсенето на основни изчисления и честотна лента се очаква да нарасне едновременно, което потенциално ще доведе до допълнителни увеличения на цените или ще доведе до допълнителни скокове.
Sun Zhenya, старши изследователски мениджър в IDC China, каза: „Сблъскването с експоненциален растеж на потреблението на токени, разходите и използването на енергия ще се превърнат в ключови ограничения. Предприятията трябва да планират предварително по отношение на изчислителните ресурси и стратегиите за модели.“
Нашия източник е Българо-Китайска Търговско-промишлена палaта


