Inspur представя нов AI сървър с по-ниски разходи

Byadmin

Dec 27, 2025

Inspur Information представи своя хипермащабен AI сървър YuanNao HC1000, като твърди, че е намалил разходите за изводи на големи модели до 1 йена (около 0,14 USD) на милион токени – крайъгълен камък, според компанията, който премахва ключова бариера пред широкомащабното внедряване на AI агент.

Според главния стратегически директор на Inspur Liu Jun, използването на GPU по време на извод обикновено достига само 5–10%, далеч под 50%+ използване, наблюдавано при тренировъчни натоварвания. HC1000 се справя с тази неефективност чрез напълно симетрична DirectCom свръхвисокоскоростна архитектура и хипермащабен дизайн, който разлага изчислителните работни потоци и оптимизира разпределението на ресурсите.

Лиу каза, че новата архитектура може да повиши MFU (използване на модел FLOPs) с една карта с до 5,7 пъти, което значително намалява разходите за изводи. Той подчерта, че тъй като потреблението на токени нараства експоненциално, постепенните оптимизации на разходите вече няма да са достатъчни. Необходими са фундаментални промени в изчислителните архитектури и ефективността на разходите ще се превърне в „лиценз за оцеляване“ за компаниите с изкуствен интелект в идващата ера.

Източник: liangziwei

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта

Inspur представя нов AI сървър с по-ниски разходи

Byadmin

Like this:

By admin

Related Post

Харвард ще ограничи броя на A-класите, въпреки силната съпротива на студентите

Светлината свързва света, мъдростта води бъдещето

PLA обещава да осуети провокациите за „независимост на Тайван“.

You missed

Харвард ще ограничи броя на A-класите, въпреки силната съпротива на студентите

Светлината свързва света, мъдростта води бъдещето

PLA обещава да осуети провокациите за „независимост на Тайван“.

Британската радиостанция погрешно съобщава за смъртта на крал Чарлз