ScalewayAller à la connexionAller au contenu principalAller au pied de page

Model-as-a-service

Servez des modèles d'IA générative et payez pour une infrastructure dédiée ou pour des millions de tokens.

Generative APIs

Déployez les derniers modèles d'IA, payez au million de token

Generative API
qwen3-235b-a22b-instruct-2507QwenChat0,75 € /million tokens2,25 € /million tokensCommander
gpt-oss-120bOpenAIChat0,15 € /million tokens0,60 € /million tokensCommander
gemma-3-27b-itGoogleChat et Vision0,25 € /million tokens0,50 € /million tokensCommander
whisper-large-v3OpenAIAudio transcriptionFree /million tokensFree /million tokensCommander
voxtral-small-24b-2507MistralAudio transcription et Chat0,15 € /million tokens0,35 € /million tokensCommander
mistral-small-3.2-24b-instruct-2506MistralChat et Vision0,15 € /million tokens0,35 € /million tokensCommander
llama-3.3-70b-instructMetaChat0,90 € /million tokens0,90 € /million tokensCommander
deepseek-r1-distill-llama-70bDeepseekChat0,90 € /million tokens0,90 € /million tokensCommander
bge-multilingual-gemma2BAAIEmbeddings0,10 € /million tokensFree /million tokensCommander
qwen3-coder-30b-a3b-instructQwenChat0,20 € /million tokens0,80 € /million tokensCommander
pixtral-12b-2409MistralChat et Vision0,20 € /million tokens0,20 € /million tokensCommander
mistral-nemo-instruct-2407MistralChat0,20 € /million tokens0,20 € /million tokensCommander
llama-3.1-8b-instructMetaChat0,20 € /million tokens0,20 € /million tokensCommander
mistral-small-3.1-24b-instruct-2503MistralChat et Vision0,15 € /million tokens0,35 € /million tokensCommander
qwen2.5-coder-32b-instructQwenChat0,90 € /million tokens0,90 € /million tokensCommander
llama-3.1-70b-instructMetaChat0,90 € /million tokens0,90 € /million tokensCommander
devstral-small-2505MistralChat0,15 € /million tokens0,35 € /million tokensCommander
Mentions légales

Prix HT.
Vous bénéficiez d'un essai gratuit de 1 000 000 tokens. Vous ne paierez qu'à partir de 1 000 001 token.

Managed Inference

Choisissez un modèle prêt à l'emploi et obtenez immédiatement un point d'accès dédié pour son inférence. Vous êtes facturé en fonction de l'utilisation du GPU que vous choisissez.

ModèleGPUPrixEstimation mensuelle
llama-3.1-8b-instructL4-1-24G0,93€/heure~679€/mois
L40S-1-48G1,72€/heure~1256€/mois
H100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
llama-3.3-70b-instructH100-2-80G6,68€/heure~4876€/mois
llama-3.1-70b-instructH100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
llama-3.1-nemotron-70b-instructH100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
mistral-7b-instruct-v0.3L4-1-24G0,93€/heure~679€/mois
L40S-1-48G1,72€/heure~1256€/mois
H100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
mixtral-8x7b-instruct-v0.1H100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
mistral-nemo-instruct-2407L40S-1-48G1,72€/heure~1256€/mois
H100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
pixtral-12b-2409L40S-1-48G1,72€/heure~1256€/mois
H100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
molmo-72b-0924H100-2-80G6,68€/heure~4876€/mois
qwen2.5-coder-32b-instructH100-1-80G3,40€/heure~2482€/mois
H100-2-80G6,68€/heure~4876€/mois
bge-multilingual-gemma2L4-1-24G0,93€/heure~679€/mois
L40S-1-48G1,72€/heure~1256€/mois
sentence-t5-xxlL4-1-24G0,93€/heure~679€/mois
Mentions légales

Prix hors taxes
La facturation commence lorsque au moins un point de terminaison dédié est prêt à être utilisé.