Model Profiles

Detailed profiles for each Swiss-hosted model. Specifications and pricing are drawn directly from the live model catalog.

Apertus Swiss LLM - Large

Description

Ideal for multilingual services, government agencies and R&D teams looking for a reliable, adaptable model ● Data and methods documented for unprecedented transparency ● Compliant with the AI Act and respectful of privacy and intellectual property ● A 70B version with performance on a par with current market leaders

Specifications

Context window: 65,536 tokens
Max output tokens: Not specified
Vision support: No
Reasoning mode: No
Function calling: No
Streaming: Yes
Availability: Chat UI & API

Ideal Use Cases

Chat
Multi-lingual
Swiss LLM

Pricing

Input: ... per million tokens
Output: ... per million tokens

Chat & Document Analysis & Reasoning - Large

Description

large-scale model, rivalling leading models or leading models Opus across a broad range of complex tasks ● Advanced multilingual capabilities ● Reasoning mode can be enabled to dynamically tailor responses to the context and complexity of queries

Specifications

Context window: Not specified
Max output tokens: Not specified
Vision support: Yes
Reasoning mode: Yes
Function calling: Yes
Streaming: Yes
Availability: API only

Ideal Use Cases

Document Analysis
Chat
Vision
Reasoning
Function Calling

Pricing

Input: ... per million tokens
Output: ... per million tokens

Document Analysis - Small

Description

Optimized for multilingual dialogue use cases

Specifications

Context window: 32,768 tokens
Max output tokens: Not specified
Vision support: Yes
Reasoning mode: No
Function calling: Yes
Streaming: Yes
Availability: API only

Ideal Use Cases

Document Analysis
Chat
Vision
Function Calling

Pricing

Input: ... per million tokens
Output: ... per million tokens

Document Analysis - Xtra Small

Description

Optimized for compact and efficient vision-language model

Specifications

Context window: 16,384 tokens
Max output tokens: Not specified
Vision support: Yes
Reasoning mode: No
Function calling: No
Streaming: Yes
Availability: API only

Ideal Use Cases

Document Analysis
Chat
Vision

Pricing

Input: ... per million tokens
Output: ... per million tokens

Fast Reasoning & Instruction Following - Small

Description

Optimized for Reasoning and instruction-following capabilities

Specifications

Context window: 32,768 tokens
Max output tokens: Not specified
Vision support: No
Reasoning mode: No
Function calling: Yes
Streaming: Yes
Availability: API only

Ideal Use Cases

Thinking
Chat
Data Analysis
Function Calling

Pricing

Input: ... per million tokens
Output: ... per million tokens

Reasoning & Problem Solving - Small

Description

Optimized for thinking and reasoning

Specifications

Context window: 32,768 tokens
Max output tokens: Not specified
Vision support: No
Reasoning mode: Yes
Function calling: Yes
Streaming: Yes
Availability: API only

Ideal Use Cases

Thinking
Chat
Reasoning
Function Calling

Pricing

Input: ... per million tokens
Output: ... per million tokens

Description

Optimized for text and multimodal experiences

Specifications

Context window: 32,768 tokens
Max output tokens: Not specified
Vision support: Yes
Reasoning mode: No
Function calling: Yes
Streaming: Yes
Availability: API only

Ideal Use Cases

Document Analysis
Chat
Vision
Function Calling

Pricing

Input: ... per million tokens
Output: ... per million tokens

Reasoning & Agent tasks - Large

Description

Optimized for powerful reasoning, agentic tasks, and versatile developer use cases

Specifications

Context window: 65,536 tokens
Max output tokens: Not specified
Vision support: No
Reasoning mode: Yes
Function calling: Yes
Streaming: Yes
Availability: API only

Ideal Use Cases

Data Analysis
Chat
Thinking
Agent
Reasoning
Function Calling

Pricing

Input: ... per million tokens
Output: ... per million tokens

Reasoning & Problem Solving - Medium

Description

Optimized for thinking and reasoning

Specifications

Context window: 32,768 tokens
Max output tokens: Not specified
Vision support: No
Reasoning mode: Yes
Function calling: Yes
Streaming: Yes
Availability: API only

Ideal Use Cases

Thinking
Chat
Reasoning
Function Calling

Pricing

Input: ... per million tokens
Output: ... per million tokens

Reasoning & Problem Solving - Xtra Large

Description

Optimized for Reasoning chat completions. Reasoning model

Specifications

Context window: Not specified
Max output tokens: Not specified
Vision support: No
Reasoning mode: No
Function calling: No
Streaming: Yes
Availability: API only

Ideal Use Cases

Thinking
Chat

Pricing

Input: ... per million tokens
Output: ... per million tokens

Reasoning & Tool Use - Large (GLM-4.5 Air)

Description

ZhipuAI GLM-4.5-Air. Mixture-of-Experts model with 106B total / 12B active parameters. Hybrid reasoning with configurable thinking mode, strong tool/function calling and code generation capabilities. 128K context window.

Specifications

Context window: 131,072 tokens
Max output tokens: Not specified
Vision support: No
Reasoning mode: Yes
Function calling: Yes
Streaming: Yes
Availability: API only

Ideal Use Cases

Thinking
Chat
Function Calling
Reasoning

Pricing

Input: ... per million tokens
Output: ... per million tokens

Search, Chat & Analysis - Small

Description

Optimized for web search and chat. Suitable for artists and content creation, including storytelling

Specifications

Context window: Not specified
Max output tokens: Not specified
Vision support: Yes
Reasoning mode: No
Function calling: No
Streaming: Yes
Availability: API only

Ideal Use Cases

Web Search
Chat
Vision

Pricing

Input: ... per million tokens
Output: ... per million tokens

Chat, Document Analysis & Agent tasks - Xtra Large

Description

Very large-scale model, rivalling leading models or leading models Opus across a broad range of complex tasks ● Advanced multilingual capabilities ● Reasoning mode can be enabled to dynamically tailor responses to the context and complexity of queries ● Optimized for powerful reasoning, agentic tasks, and versatile developer use cases

Specifications

Context window: 250,000 tokens
Max output tokens: Not specified
Vision support: Yes
Reasoning mode: Yes
Function calling: Yes
Streaming: Yes
Availability: Chat UI & API

Ideal Use Cases

Chat
Document Analysis
Agent
Coding
Thinking
Web Search
Vision
Reasoning
Function Calling

Pricing

Input: ... per million tokens
Output: ... per million tokens

Document Analysis & OCR - Small (DeepSeek OCR)

Description

DeepSeek OCR. 3B parameter vision-language model specialized for optical character recognition and document understanding. Excels at converting documents to structured text/markdown, table extraction, and mathematical content recognition.

Specifications

Context window: 8,192 tokens
Max output tokens: Not specified
Vision support: Yes
Reasoning mode: No
Function calling: No
Streaming: Yes
Availability: API only

Ideal Use Cases

Document Analysis
Vision

Pricing

Input: ... per million tokens
Output: ... per million tokens

Chat, Multi-lingual, Coding & function calling - Small

Description

Mistral

Specifications

Context window: 128,000 tokens
Max output tokens: Not specified
Vision support: No
Reasoning mode: No
Function calling: Yes
Streaming: Yes
Availability: Chat UI & API

Ideal Use Cases

Chat
Multi-lingual
Coding
Function Calling

Pricing

Input: ... per million tokens
Output: ... per million tokens

Chat, Document Analysis, Coding & Reasoning - Xtra Large

Description

Multi modal model, optimized for chat, document analysis, coding and reasoning.

Specifications

Context window: 1,000,000 tokens
Max output tokens: Not specified
Vision support: Yes
Reasoning mode: Yes
Function calling: Yes
Streaming: Yes
Availability: Chat UI & API

Ideal Use Cases

Chat
Document Analysis
Coding
Thinking
Data Analysis
Vision
Reasoning
Function Calling

Pricing

Input: ... per million tokens
Output: ... per million tokens

Chat, Vision, Document Analysis & Reasoning - Medium

Description

Best in class multi-modal model, optimized for chat, vision, document analysis, coding and reasoning.

Specifications

Context window: 256,000 tokens
Max output tokens: Not specified
Vision support: Yes
Reasoning mode: Yes
Function calling: Yes
Streaming: Yes
Availability: Chat UI & API

Ideal Use Cases

Chat
Vision
Document Analysis
Coding
Thinking
Reasoning
Function Calling

Pricing

Input: ... per million tokens
Output: ... per million tokens

inference-miner-u25

Description

Vision-language model optimized for document analysis and parsing.

Specifications

Context window: Not specified
Max output tokens: Not specified
Vision support: No
Reasoning mode: No
Function calling: No
Streaming: Yes
Availability: API only

Ideal Use Cases

Vision
Document Analysis

Pricing

Input: ... per million tokens
Output: ... per million tokens

Reasoning & Tool Use - Xtra Large (GLM-5.2)

Description

ZhipuAI GLM-5.2 Hybrid reasoning with configurable thinking mode, strong tool/function calling and code generation capabilities. Same pricing tier as GLM-5.1 on this provider; exact parameter count not published by the provider.

Specifications

Context window: Not specified
Max output tokens: Not specified
Vision support: No
Reasoning mode: Yes
Function calling: Yes
Streaming: Yes
Availability: Chat UI & API

Ideal Use Cases

Thinking
Chat
Function Calling
Reasoning

Pricing

Input: ... per million tokens
Output: ... per million tokens

Apertus Swiss LLM - Large (v1.5)

Description

Apertus v1.5. Ideal for multilingual services, government agencies and R&D teams looking for a reliable, adaptable model ● Data and methods documented for unprecedented transparency ● Compliant with the AI Act and respectful of privacy and intellectual property ● A 70B version with performance on a par with current market leaders

Specifications

Context window: 65,536 tokens
Max output tokens: Not specified
Vision support: No
Reasoning mode: No
Function calling: No
Streaming: Yes
Availability: API only

Ideal Use Cases

Chat
Multi-lingual
Swiss LLM

Pricing

Input: ... per million tokens
Output: ... per million tokens

Model Updates

This lineup is kept in sync with the live model catalog. Capabilities and pricing reflect the current platform state.

Apertus Swiss LLM - Large​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Chat & Document Analysis & Reasoning - Large​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Document Analysis - Small​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Document Analysis - Xtra Small​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Fast Reasoning & Instruction Following - Small​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Reasoning & Problem Solving - Small​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Llama 4 Maverick multi modal - Small​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Reasoning & Agent tasks - Large​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Reasoning & Problem Solving - Medium​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Reasoning & Problem Solving - Xtra Large​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Reasoning & Tool Use - Large (GLM-4.5 Air)​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Search, Chat & Analysis - Small​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Chat, Document Analysis & Agent tasks - Xtra Large​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Document Analysis & OCR - Small (DeepSeek OCR)​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Chat, Multi-lingual, Coding & function calling - Small​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Chat, Document Analysis, Coding & Reasoning - Xtra Large​

Description​

Specifications​

Ideal Use Cases​

Pricing​

Apertus Swiss LLM - Large

Description

Specifications

Ideal Use Cases

Pricing

Chat & Document Analysis & Reasoning - Large

Description

Specifications

Ideal Use Cases

Pricing

Document Analysis - Small

Description

Specifications

Ideal Use Cases

Pricing

Document Analysis - Xtra Small

Description

Specifications

Ideal Use Cases

Pricing

Fast Reasoning & Instruction Following - Small

Description

Specifications

Ideal Use Cases

Pricing

Reasoning & Problem Solving - Small

Description

Specifications

Ideal Use Cases

Pricing

Llama 4 Maverick multi modal - Small

Description

Specifications

Ideal Use Cases

Pricing

Reasoning & Agent tasks - Large

Description

Specifications

Ideal Use Cases

Pricing

Reasoning & Problem Solving - Medium

Description

Specifications

Ideal Use Cases

Pricing

Reasoning & Problem Solving - Xtra Large

Description

Specifications

Ideal Use Cases

Pricing

Reasoning & Tool Use - Large (GLM-4.5 Air)

Description

Specifications

Ideal Use Cases

Pricing

Search, Chat & Analysis - Small

Description

Specifications

Ideal Use Cases

Pricing

Chat, Document Analysis & Agent tasks - Xtra Large

Description

Specifications

Ideal Use Cases

Pricing

Document Analysis & OCR - Small (DeepSeek OCR)

Description

Specifications

Ideal Use Cases

Pricing

Chat, Multi-lingual, Coding & function calling - Small

Description

Specifications

Ideal Use Cases

Pricing

Chat, Document Analysis, Coding & Reasoning - Xtra Large

Description

Specifications

Ideal Use Cases

Pricing