AI 模型库 · 大模型对比与可用性

Qwen3-235B-A22B

文本对话 · 国内

可直连

通义千问开源旗舰 MoE 大模型，多语言、推理与代码能力强。

免费开源可商用 235B(MoE, 22B active) · 128K

DeepSeek-V3

文本对话 · 国内

可直连

DeepSeek 开源 MoE 大模型，性价比极高，推理与代码强。

免费开源可商用 671B(MoE, 37B active) · 128K

GLM-4-9B-Chat

文本对话 · 国内

可直连

智谱 GLM-4 开源对话模型，中文综合能力优秀。

免费开源限制商用 9B · 128K

Llama 3.3 70B

文本对话 · 国外

需代理

Meta 开源指令模型，70B 规模逼近更大模型表现。

免费开源限制商用 70B · 128K

FLUX.1 [dev]

图像生成 · 国外

需代理

Black Forest Labs 出品文生图模型，画质与文字渲染领先。

免费开源限制商用 12B

Stable Diffusion XL

图像生成 · 国外

需代理

Stability AI 开源文生图基座，生态与插件最丰富。

免费开源可商用 3.5B

Kolors 可图

图像生成 · 国内

可直连

快手开源文生图模型，中文提示词理解与中文海报渲染强。

免费开源可商用 2.6B

Wan2.1 通义万相

图像生成 · 国内

可直连

阿里通义万相开源视觉生成模型，文生图/视频统一架构。

免费开源可商用 14B

CogVideoX-5B

视频生成 · 国内

可直连

智谱开源文生视频模型，消费级显卡可推理。

免费开源可商用 5B

HunyuanVideo

视频生成 · 国内

可直连

腾讯混元开源文生视频大模型，画质与动态表现优秀。

免费开源限制商用 13B

Mochi 1

视频生成 · 国外

需代理

Genmo 开源文生视频模型，运动连贯性表现出色。

免费开源可商用 10B

LTX-Video

视频生成 · 国外

需代理

Lightricks 开源实时文生视频模型，速度极快。

免费开源可商用 2B

Whisper large-v3

音频语音 · 国外

需代理

OpenAI 开源语音识别模型，多语言转写业界标杆。

免费开源可商用 1.55B

CosyVoice 2

音频语音 · 国内

可直连

阿里开源语音合成模型，少样本音色复刻与流式 TTS。

免费开源可商用 0.5B

ChatTTS

音频语音 · 国内

可直连

面向对话场景的开源中英文 TTS，韵律自然口语化。

免费开源不可商用 —

F5-TTS

音频语音 · 国内

可直连

开源流匹配 TTS，零样本音色克隆速度快效果好。

免费开源可商用 0.3B

Qwen2.5-VL-72B

多模态 · 国内

可直连

通义千问视觉语言旗舰，文档/图表/视频理解能力领先。

免费开源可商用 72B · 128K

GLM-4V-9B

多模态 · 国内

可直连

智谱开源多模态模型，中英文图文理解能力强。

免费开源限制商用 9B · 8K

MiniCPM-V 2.6

多模态 · 国内

可直连

面壁智能端侧多模态模型，8B 比肩更大模型，可手机运行。

免费开源限制商用 8B

InternVL2.5-78B

多模态 · 国内

可直连

上海 AI Lab 开源多模态旗舰，综合视觉理解逼近闭源。

免费开源可商用 78B

Qwen2.5-Coder-32B

代码 · 国内

可直连

通义千问代码大模型，开源代码能力比肩顶级闭源模型。

免费开源可商用 32B · 128K

DeepSeek-Coder-V2

代码 · 国内

可直连

DeepSeek 开源代码 MoE 模型，支持 338 种编程语言。

免费开源可商用 236B(MoE, 21B active) · 128K

Code Llama 70B

代码 · 国外

需代理

Meta 开源代码模型，覆盖主流语言的生成与补全。

免费开源限制商用 70B · 16K

StarCoder2-15B

代码 · 国外

需代理

BigCode 开源代码模型，600+ 语言训练，许可宽松。

免费开源可商用 15B · 16K

DeepSeek-R1

文本对话 · 国内

可直连

深度求索开源推理大模型，数学与代码推理对标顶级闭源。

免费开源可商用 671B(MoE, 37B active) · 128K

Qwen2.5-72B

文本对话 · 国内

可直连

通义千问 2.5 旗舰稠密模型，中文与通用能力强。

免费开源可商用 72B · 128K

ERNIE 4.5

文本对话 · 国内

可直连

百度文心 4.5 开源系列，多模态与中文理解强。

免费开源可商用 0.3B–424B(系列) · 128K

MiniMax-Text-01

文本对话 · 国内

可直连

MiniMax 开源大模型，线性注意力支持百万级上下文。

免费开源可商用 456B(MoE, 45.9B active) · 1000K

Mistral Large

文本对话 · 国外

需代理

Mistral 旗舰开源模型，多语言与代码能力强。

免费开源限制商用 123B · 128K

Gemma 2 27B

文本对话 · 国外

需代理

Google 开源 Gemma 2，轻量高效、部署友好。

免费开源可商用 27B · 8K

FLUX.1 [schnell]

图像生成 · 国外

需代理

Black Forest Labs 极速文生图模型，1-4 步出图可商用。

免费开源可商用 12B

Stable Diffusion 3.5 Large

图像生成 · 国外

需代理

Stability AI 文生图旗舰，画质与提示遵循提升。

免费开源限制商用 8B

HiDream-I1

图像生成 · 国内

可直连

智象未来开源文生图模型，17B 参数、MIT 可商用。

免费开源可商用 17B

CogView-4

图像生成 · 国内

可直连

智谱开源文生图模型，原生支持中文输入与中文渲染。

免费开源可商用 6B

Wan2.1-I2V-14B

视频生成 · 国内

可直连

阿里通义万相图生视频开源模型，720P 高质量。

免费开源可商用 14B

CogVideoX1.5-5B

视频生成 · 国内

可直连

智谱升级版开源文生视频，更长时长更高分辨率。

免费开源可商用 5B

Step-Video-T2V

视频生成 · 国内

可直连

阶跃星辰开源文生视频大模型，30B 参数 MIT 可商用。

免费开源可商用 30B

SenseVoice

音频语音 · 国内

可直连

阿里开源多语言语音理解，识别+情感+事件检测。

免费开源可商用 0.2B

Kokoro-82M

音频语音 · 国外

需代理

超轻量开源 TTS，82M 参数音质媲美大模型。

免费开源可商用 82M

Spark-TTS

音频语音 · 国内

可直连

基于 LLM 的开源高效 TTS，中英文零样本克隆。

免费开源可商用 0.5B

Qwen2.5-Omni-7B

多模态 · 国内

可直连

通义千问全模态模型，文本/图像/音频/视频输入+语音输出。

免费开源可商用 7B · 32K

DeepSeek-VL2

多模态 · 国内

可直连

深度求索 MoE 多模态模型，视觉理解高效。

免费开源可商用 27B(MoE, 4.5B active)

GLM-4.1V-Thinking

多模态 · 国内

可直连

智谱开源视觉推理模型，带思维链的多模态理解。

免费开源可商用 9B · 64K

DeepSeek-Coder-33B

代码 · 国内

可直连

深度求索代码模型，项目级代码补全与生成。

免费开源可商用 33B · 16K

CodeGeeX4-9B

代码 · 国内

可直连

智谱开源多语言代码模型，补全、解释、仓库问答。

免费开源限制商用 9B · 128K

StarCoder2-3B

代码 · 国外

需代理

BigCode 轻量代码模型，端侧补全友好、许可宽松。

免费开源可商用 3B · 16K

Qwen3-32B

文本对话 · 国内

可直连

通义千问3 稠密 32B，思考/非思考双模式，可商用。

免费开源可商用 32B · 128K

Qwen3-8B

文本对话 · 国内

可直连

通义千问3 轻量 8B，消费级显卡可跑，可商用。

免费开源可商用 8B · 128K

GLM-4.5

文本对话 · 国内

可直连

智谱 GLM-4.5 开源旗舰 MoE，主打 Agent 与推理。

免费开源可商用 355B(MoE, 32B active) · 128K

Kimi K2

文本对话 · 国内

可直连

月之暗面开源万亿参数 MoE 模型，Agent 与代码能力强。

免费开源可商用 1T(MoE, 32B active) · 128K

MiniMax-M1

文本对话 · 国内

可直连

MiniMax 开源推理模型，百万上下文 + 高效推理。

免费开源可商用 456B(MoE) · 1000K

dots.llm1

文本对话 · 国内

可直连

小红书 hi lab 开源 MoE 大模型，中文表现优秀。

免费开源可商用 142B(MoE, 14B active) · 32K

InternLM3-8B

文本对话 · 国内

可直连

上海 AI Lab 书生·浦语3 开源 8B，推理与对话均衡。

免费开源可商用 8B · 32K

Yi-1.5-34B

文本对话 · 国内

可直连

零一万物 Yi-1.5 开源 34B，中英双语能力强。

免费开源可商用 34B · 32K

Phi-4

文本对话 · 国外

需代理

微软开源小模型 Phi-4，推理与数学超越同尺寸。

免费开源可商用 14B · 16K

QwQ-32B

文本对话 · 国内

可直连

通义千问推理模型 QwQ-32B，32B 对标大推理模型。

免费开源可商用 32B · 128K

Qwen-Image

图像生成 · 国内

可直连

通义千问开源文生图模型，复杂中文文字渲染强。

免费开源可商用 20B

FLUX.1 Krea [dev]

图像生成 · 国外

需代理

BFL 与 Krea 联合开源文生图，真实感与美学强。

免费开源限制商用 12B

SANA

图像生成 · 国外

需代理

NVIDIA 高效文生图模型，笔记本可跑的 4K 生成。

免费开源可商用 1.6B

OmniGen2

图像生成 · 国内

可直连

智源开源统一图像生成模型，文生图+编辑+组合。

免费开源可商用 7B

Wan2.2

视频生成 · 国内

可直连

阿里通义万相2.2 开源视频生成，MoE 架构高画质。

免费开源可商用 27B(MoE, 14B active)

HunyuanVideo-I2V

视频生成 · 国内

可直连

腾讯混元开源图生视频模型，高保真动态。

免费开源限制商用 13B

SkyReels-V2

视频生成 · 国内

可直连

昆仑万维开源无限时长电影级视频生成模型。

免费开源可商用 14B

Step-Audio

音频语音 · 国内

可直连

阶跃星辰开源语音交互大模型，语音理解+生成一体。

免费开源可商用 130B

FireRedTTS

音频语音 · 国内

可直连

小红书开源 TTS，自然中文语音合成与克隆。

免费开源限制商用 0.4B

IndexTTS

音频语音 · 国内

可直连

B站开源工业级 TTS，中文发音可控、音色克隆。

免费开源可商用 —

MiniCPM-o 2.6

多模态 · 国内

可直连

面壁智能端侧全模态模型，视觉+语音+实时对话。

免费开源限制商用 8B

Ovis2-8B

多模态 · 国内

可直连

阿里国际开源多模态模型，结构化视觉理解强。

免费开源可商用 8B

Kimi-VL-A3B

多模态 · 国内

可直连

月之暗面开源 MoE 视觉模型，仅激活 3B 高效推理。

免费开源可商用 16B(MoE, 3B active) · 128K

Qwen3-Coder-480B

代码 · 国内

可直连

通义千问3 代码旗舰 MoE，Agentic 编码能力强。

免费开源可商用 480B(MoE, 35B active) · 256K

GLM-4.5-Air

代码 · 国内

可直连

智谱 GLM-4.5-Air 轻量 MoE，代码与 Agent 高性价比。

免费开源可商用 106B(MoE, 12B active) · 128K

Seed-Coder-8B

代码 · 国内

可直连

字节 Seed 开源代码模型，8B 代码能力对标更大模型。

免费开源可商用 8B · 32K

OpenCoder-8B

代码 · 国内

可直连

完全开源（含数据与流程）的代码大模型，可复现。

免费开源可商用 8B · 8K

Qwen3-30B-A3B

文本对话 · 国内

可直连

通义千问3 MoE 模型，仅激活 3B 即获强性能，可商用。

免费开源可商用 30B(MoE, 3B active) · 128K

Qwen2.5-7B

文本对话 · 国内

可直连

通义千问2.5 轻量 7B，应用最广的开源中文基座之一。

免费开源可商用 7B · 128K

DeepSeek-V3.1

文本对话 · 国内

可直连

深度求索 V3.1 混合推理模型，思考/非思考一体。

免费开源可商用 671B(MoE, 37B active) · 128K

GLM-Z1-32B

文本对话 · 国内

可直连

智谱 GLM-Z1 推理模型，数学与逻辑推理强，MIT。

免费开源可商用 32B · 128K

ERNIE-4.5-300B-A47B

文本对话 · 国内

可直连

百度文心4.5 旗舰 MoE，中文与多模态能力强，可商用。

免费开源可商用 300B(MoE, 47B active) · 128K

Hunyuan-A13B

文本对话 · 国内

可直连

腾讯混元开源 MoE 大模型，激活 13B、256K 上下文。

免费开源限制商用 80B(MoE, 13B active) · 256K

Skywork-13B

文本对话 · 国内

可直连

昆仑万维天工开源 13B 基座，中文语料充分。

免费开源可商用 13B · 8K

Mixtral 8x7B

文本对话 · 国外

需代理

Mistral 经典开源 MoE，性价比与多语言均衡。

免费开源可商用 47B(MoE, 13B active) · 32K

Gemma 3 27B

文本对话 · 国外

需代理

Google Gemma 3 开源多模态模型，支持图像与 140 语言。

免费开源可商用 27B · 128K

Llama 4 Scout

文本对话 · 国外

需代理

Meta Llama 4 原生多模态 MoE，千万级超长上下文。

免费开源限制商用 109B(MoE, 17B active) · 10000K

Seedream 3.0

图像生成 · 国内

可直连

字节豆包文生图模型，2K 高清与中英文字渲染强。

免费可商用 —

Lumina-Image 2.0

图像生成 · 国内

可直连

上海 AI Lab 开源高效文生图模型，2.6B 高质量。

免费开源可商用 2.6B

LTX-Video 13B

视频生成 · 国外

需代理

Lightricks LTX-Video 升级版，实时高质量视频生成。

免费开源可商用 13B

MAGI-1

视频生成 · 国内

可直连

Sand AI 开源自回归视频生成模型，流式长视频。

免费开源可商用 24B

FramePack

视频生成 · 国外

需代理

lllyasviel 开源图生视频，6GB 显存即可生成长视频。

免费开源可商用 13B

Qwen2.5-Omni-3B

音频语音 · 国内

可直连

通义千问全模态轻量版，语音输入输出端到端。

免费开源限制商用 3B

Dia

音频语音 · 国外

需代理

Nari Labs 开源对话 TTS，生成带情感的多人对话音频。

免费开源可商用 1.6B

Higgs Audio V2

音频语音 · 国外

需代理

Boson AI 开源语音基座，多说话人与表现力强。

免费开源可商用 3B

InternVL3-78B

多模态 · 国内

可直连

上海 AI Lab 书生·万象3 开源多模态旗舰，MIT 可商用。

免费开源可商用 78B · 32K

Step3

多模态 · 国内

可直连

阶跃星辰开源多模态推理大模型，视觉推理强。

免费开源可商用 321B(MoE) · 64K

GLM-4.5V

多模态 · 国内

可直连

智谱开源多模态 MoE 旗舰，视觉推理 SOTA、MIT 可商用。

免费开源可商用 106B(MoE, 12B active) · 64K

Kimi-VL-Thinking

多模态 · 国内

可直连

月之暗面开源视觉推理 MoE，带思维链、MIT 可商用。

免费开源可商用 16B(MoE, 3B active) · 128K

Yi-Coder-9B

代码 · 国内

可直连

零一万物 Yi-Coder，9B 代码模型支持 52 种语言。

免费开源可商用 9B · 128K

Codestral

代码 · 国外

需代理

Mistral 代码专用模型，80+ 语言与填充补全。

免费开源限制商用 22B · 32K

Granite Code 34B

代码 · 国外

需代理

IBM 开源企业级代码模型，Apache-2.0 可商用。

免费开源可商用 34B · 8K

DeepSeek-Coder-V2-Lite

代码 · 国内

可直连

深度求索代码 MoE 轻量版，激活 2.4B 易本地部署。

免费开源可商用 16B(MoE, 2.4B active) · 128K

Qwen3-Next-80B

文本对话 · 国内

可直连

通义千问3-Next 高稀疏 MoE，激活 3B、超长上下文高效。

免费开源可商用 80B(MoE, 3B active) · 256K

Ling-mini

文本对话 · 国内

可直连

蚂蚁百灵开源 MoE 模型，激活 1.4B 高效推理。

免费开源可商用 16B(MoE, 1.4B active) · 128K

Baichuan-M1

文本对话 · 国内

可直连

百川智能开源医疗增强大模型，临床问答强。

免费开源可商用 14B · 128K

Wan2.2-Animate

视频生成 · 国内

可直连

阿里通义万相开源角色动画模型，照片驱动表演。

免费开源可商用 14B

gpt2

文本对话 · 国外

需代理

AI 会议记录工具，自动录制转写与摘要。

付费