Inference modelu s API je proces, kdy se natrénovaný model strojového učení nasadí na server a zpřístupní se pro vytváření predikcí na nových datech prostřednictvím API (aplikačního programového rozhraní).
Ceny jsou uvedeny bez DPH. Není-li uvedeno jinak, jedná se o cenu za 1 měsíc provozu služby.
Jedná se o klíčovou fázi v životním cyklu modelu, která následuje po jeho tréninku. Zatímco trénink je výpočetně náročná operace, která se provádí jednou, inference je opakovaný proces, ke kterému dochází pokaždé, když je třeba získat novou predikci.
Proces inference je tedy konzumace modelu, kde model aplikuje své naučené znalosti k vytváření nových výstupů. Je to jako, když se robot naučí rozpoznávat jablka a následně je používá k třídění nového ovoce.
Mnoho API služeb (např. Hugging Face Inference API, Azure AI Foundry) automaticky škáluje počet instancí serverů, aby zvládly vysokou zátěž.
Modely jsou centrálně spravovány, což usnadňuje jejich aktualizaci a monitoring.
Vývojáři mohou integrovat model do svých aplikací (webových, mobilních, desktopových) pomocí jednoduchých HTTP požadavků, aniž by se museli starat o složitou infrastrukturu.
API může být chráněno pomocí autentizace a autorizace, což zajišťuje, že k modelu mají přístup pouze oprávněné aplikace.