Vytvoriť Wiki

Vytvoriť Wiki

Referenčná séria o zostavovaní, vytváraní sietí, napájaní a prevádzke výpočtových systémov s umelou inteligenciou – pre kupujúcich a integrátorov, ktorí si vyberajú veľkosť svojho ďalšieho 4-GPU servera, 8-GPU servera alebo robotického laboratória.

Každý článok je napísaný na základe skutočných Kentino konštrukcií. Žiadne zbytočné zbytočnosti. S názorom tam, kde to inžinierstvo vyžaduje. Úprimný, čo sa týka limitov.

20články zverejnené 9tematické skladby 2nové za týždeň · Ut + Št

Základný server umelej inteligencie Séria W

Ak špecifikujete systém s viacerými grafickými kartami, prečítajte si najskôr tieto informácie. Pamäť, PCIe, napájanie a zoznam grafických kariet.

W01RAM a VRAM: Ako sa vzťahujú na serveri s umelou inteligenciou4-GPU box so 192 GB VRAM a 32 GB RAM je nefunkčný. Správny pomer závisí od toho, čo v skutočnosti používate.
W02PCIe linky a topológia v multi-GPU AI serveriVýrok „PCIe x8 vs x16 nie je pre inferenciu dôležitý“ je väčšinou správny – a ľudia, ktorí ho opakujú, zvyčajne nevedia prečo.
W03Rozširujúce karty GPU: Kedy ich potrebujete a čo sa pokazíTam, kde integrita signálu potichu zomrie, sa linky potichu preškolia na Gen3 a skúšobné testovacie lavice, ktoré prejdú úspešne, začnú strácať jeden GPU denne.
W04Dimenzovanie zdroja PSU a konfigurácie s dvoma zdrojmi PSUMatematika, realita tvarového faktora a úprimné vysvetlenie napájania 4 a 8 GPU.
W07Výber GPU: 5090, 4090, RTX Pro 6000, L40, L4Úprimné porovnanie so skutočnými číslami o výkonnosti, kompromismi a rozhodovacím postupom, ktorý skutočne používame pri hovoroch so zákazníkmi.

networking Séria N

Realita NVLink, topológie klastrov (list-chrbtica, fat-tree, vážka, bezspínačová), analýza latencie, smerovanie a nastavenie RDMA v praxi.

N03NVLink a NVSwitch: Keď na tom záležíMarketing DGX sa chváli terabajtmi za sekundu šírky pásma NVLink. Pre väčšinu úloh Kentino to nepotrebujete.
N04Prepínané topológie: Tučný strom, Listová chrbtica, Vážka, TesseractKaždý klastrový diagram začína rovnako. Skutočnou voľbou je, aká topológia, aký vysoký bude nadmerný počet predplatených portov a aká bude rýchlosť na port.
N05Bezprepínacie topológie: Mesh, Ring, Direct-Connect32-portový 400 GbE prepínač dosiahne v polovici roka 2026 cenu 40 000 až 80 000 eur. Pre 2 až 4 uzly ho nepotrebujete.
N06Disekcia latencie: Kam ide každá mikrosekundaĽudia dimenzujú siete pomocou grafov šírky pásma. Potom ich benchmark allreduce vypíše číslo, ktoré sa ani zďaleka nepribližuje rýchlosti linky.
N07Smerovanie: ECMP, adaptívne smerovanie, DCQCNČo sa deje nad káblami, sieťovými kartami a prepínačmi: ako pakety nachádzajú cestu a čo zabraňuje kolapsu štruktúry pri all-reduce.
N08Nastavenie RDMA v praxi + návrh klastrového uplinkuPraktické cvičenie: inštalácia ovládačov, overenie cesty, zapnutie GPUDirect, overenie NCCL a následný krok a návrh uplinku pre celý klaster.

zhlukovaniu Séria K

Keď jeden uzol nestačí. Rozhodovanie o jednom verzus viacerých uzloch, distribuované trénovanie, inferenčné klastre a zdieľané úložisko.

K01Jednouzlový multi-GPU verzus viacuzlový: Kedy je potrebné škálovaťNajdrahšou chybou je rozdelenie rozpočtu GPU medzi dva uzly, keď by prácu vykonal jeden väčší uzol.
K02Distribuované školenia v roku 2026: DDP, FSDP2, DeepSpeed, MegatronŠtyri open-source stacky, päť osí paralelizmu a ktorú z nich si vlastne vybrať pre ktorú úlohu.
K03Inferenčné klastre: vLLM Tensor Parallel, Pipeline ParallelModel 70B sa nezmestí na jednu GPU s užitočnou vyrovnávacou pamäťou KV. Model 405B sa nezmestí na jeden uzol. Spôsob, akým model rozrežete, určuje, koľko bude stáť.
K04Klastrové úložisko: NFS, BeeGFS, Lustre, objektové úložiskáZdieľané úložisko je súčasťou distribuovaného klastra, na ktorú nikto nemyslí, kým grafické procesory nedosiahnu 40 % využitie.

Integrácia Séria I.

Spojenie všetkých prvkov – architektúra robot-plus-server, ktorá spája celú sériu so skutočným hardvérom.

I01Architektúra okrajovej umelej inteligencie: Robot ↔ Lokálny inferenčný serverČlánok zlatého štandardu. Humanoid, ktorého ste si kúpili, je len polovica systému; toto je druhá polovica a to, ako sú tieto dve polovice prepojené.

Robotika Séria R · blog

Moderný humanoid je tvorený šiestimi alebo siedmimi inžinierskymi disciplínami, ktoré sú navzájom prepojené. Proces nákupu, prečo roboty potrebujú špecializované výpočtové systémy na okraji systému a najmodernejší model sveta riadený VLM.

R07Kúpa robota: Dodacie lehoty, colné vybavovanie, podporaNákup robotického hardvéru v EÚ nie je ako kúpa pracovnej stanice. Ako v skutočnosti vyzerajú dodacie lehoty, colné odbavenie a popredajná podpora.
R08Prečo roboty potrebujú špecializované Edge ComputeArgument latencie. Prečo umiestnenie vášho modelu za cloudové API narúša prípad použitia, ktorý zákazník skutočne chce.
R09Automatické označovanie pomocou svetových modelov riadených VLMNajmodernejší systém vnímania – Qwen2.5-VL, Grounded-SAM 2, Florence-2, NVIDIA Cosmos – aplikovaný na skutočné poznatky z robotiky.

Prípadové štúdie Séria C · blog

Skutočné Kentino stavia s reálnymi meraniami. Fotografie, kusovníky, porovnávacie kritériá a poctivé pitvy.

C01Prípadová štúdia: 4× pracovná stanica s umelou inteligenciou RTX 4090EPYC 7542, 512 GB DDR4 ECC, 4× RTX 4090. Nameraných 651.6 TFLOPS. 179.3 tok/s trvalo na vLLM. Vrchol 73 °C. Reálne čísla z dodanej zostavy.

Nové články každý utorok a štvrtok

Táto wiki je rastúca knižnica – nové články o zostavovaní, sieťovaní, klastrovaní, energii a robotike budú publikované do roku 2026, pričom každý z nich bude čerpaný zo skutočnej zostavy Kentina. Ak chcete, aby bola konkrétna téma uprednostnená, napíšte na info@kentino.com.