

Мултимодалните базови модели поддържат приложения в цифрово съдържание и нововъзникващи случаи на употреба във физическия свят
5 февруари 2026 г. — ShengShu Technology завърши кръг на финансиране от серия A+ на обща стойност над 80 милиона щатски долара. Кръгът беше ръководен съвместно от Zhongguancun Science City и LINK-X CAPITAL, със стратегическо участие от Wondershare, Visual China Group Co., Ltd. и TRS. Съществуващите инвеститори, включително Qiming Venture Partners, Beijing Artificial Intelligence Industry Investment Fund, G&O, C&D Emerging Industry Equity Investment и Guowen Hechuang също увеличиха своите инвестиции.
Разработка на модели и технически прогрес
ShengShu Technology провежда изследвания в мултимодални генеративни модели от ранното си формиране. През септември 2022 г. компанията представи U-ViT архитектурата. През юли 2024 г. стартира своя модел за видео генериране Vidu в международен план, въвеждайки функция Reference-to-Video, предназначена да подобри визуалната последователност в множество обекти в генерираното съдържание.
След първоначалното издание ShengShu пусна последователни версии на модела, включително Vidu Q1, Q2 и Q3, с актуализации, фокусирани върху области като семантично разбиране, представяне на движение, изходна стабилност и ефективност на извода.
Vidu Q3 поддържа до 16 секунди синхронизирано аудио-видео генериране, естествена 1080p резолюция, структурирани преходи на кадри и многоезично изобразяване и извеждане на текст. Според класацията, публикувана от организацията за бенчмаркинг на изкуствен интелект Artificial Analysis, Vidu Q3 е на първо място сред базираните в Китай модели и на второ място в световен мащаб в своята категория. Данните от същия източник показват, че Vidu Q2 се нарежда сред най-бързите модели за генериране на комерсиално видео по отношение на скоростта на генериране.

През декември 2025 г. ShengShu отвори своята рамка TurboDiffusion, която намалява забавянето при генериране на видео. При специфични хардуерни конфигурации рамката позволява генерирането на кратко видео за по-малко от две секунди на един GPU от висок клас.
Търговско внедряване и приложения
ShengShu разработи продуктово портфолио около модела Vidu, включително MaaS и SaaS предложения, самостоятелно приложение и инструменти, базирани на агенти. Тези продукти обслужват отделни творци и корпоративни клиенти в множество региони. Компанията отчете значителен годишен ръст на потребителите и приходите през 2025 г.
Във филмовия и развлекателния сектор, включително анимация, късометражни сериали и игрална продукция, Vidu се използва от платформи за съдържание, продуцентски студия и доставчици на инструменти. Клиенти и партньори включват Tencent Animation & Comics, China Literature, CCTV Animation, iQIYI, Jiangxi Film Group, Mango TV, Soy Sauce Animation и JuriLu.
Vidu се използва и от компании в секторите на интернет и потребителската електроника като ByteDance, Samsung, Wondershare, TAL Education Group, Alipay и Honor, предимно за производство на маркетингово съдържание и интерактивни приложения.
В рекламата платформата се прилага в търговски видео работни процеси от марки, агенции и медийни оператори, включително JD.com, Alibaba 1688, Amazon, Meituan, Focus Media, BlueFocus, L’Oréal и Anta.
В игрите Vidu се използва в области като създаване на промоционално съдържание и генериране на сцени, като клиенти включват Lilith Games, 37 Interactive Entertainment, SeaArt и Tanwan Games.
В международен план Vidu се използва от творци и корпоративни клиенти като Pollo AI, PhotoGrid, OpenArt, Hubx, Fal.ai, Everylabs, Freepik и GensPark. Случаите на използване обхващат творчески инструменти, комерсиална продукция и услуги на ниво платформа, с допълнително приемане в образованието, излъчването и културния туризъм.
Outlook
Yihang Luo, главен изпълнителен директор на ShengShu Technology, каза, че компанията планира да продължи да инвестира в изследване на основополагащи модели, като същевременно разширява продуктовите възможности и търговското им внедряване. Той отбеляза, че се очаква мултимодалните модели да играят нарастваща роля в бъдещите работни процеси за производство на съдържание.
Jun Zhu, основател и главен учен на ShengShu Technology, каза, че мултимодалните видео модели могат да се разширят отвъд създаването на цифрово съдържание с течение на времето, с потенциални приложения, които свързват цифровите системи по-тясно със средите на физическия свят.
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта


