AI 模型库

按模态/能力浏览 AI 模型。额外标注是否开源、是否可商用、参数规模与上下文长度。

地区
价格
Qwen3-235B-A22B
文本对话 · 国内
可直连

通义千问开源旗舰 MoE 大模型,多语言、推理与代码能力强。

免费 开源 可商用 235B(MoE, 22B active) · 128K
DeepSeek-V3
文本对话 · 国内
可直连

DeepSeek 开源 MoE 大模型,性价比极高,推理与代码强。

免费 开源 可商用 671B(MoE, 37B active) · 128K
GLM-4-9B-Chat
文本对话 · 国内
可直连

智谱 GLM-4 开源对话模型,中文综合能力优秀。

免费 开源 限制商用 9B · 128K
Llama 3.3 70B
文本对话 · 国外
需代理

Meta 开源指令模型,70B 规模逼近更大模型表现。

免费 开源 限制商用 70B · 128K
FLUX.1 [dev]
图像生成 · 国外
需代理

Black Forest Labs 出品文生图模型,画质与文字渲染领先。

免费 开源 限制商用 12B
Stable Diffusion XL
图像生成 · 国外
需代理

Stability AI 开源文生图基座,生态与插件最丰富。

免费 开源 可商用 3.5B
Kolors 可图
图像生成 · 国内
可直连

快手开源文生图模型,中文提示词理解与中文海报渲染强。

免费 开源 可商用 2.6B
Wan2.1 通义万相
图像生成 · 国内
可直连

阿里通义万相开源视觉生成模型,文生图/视频统一架构。

免费 开源 可商用 14B
CogVideoX-5B
视频生成 · 国内
可直连

智谱开源文生视频模型,消费级显卡可推理。

免费 开源 可商用 5B
HunyuanVideo
视频生成 · 国内
可直连

腾讯混元开源文生视频大模型,画质与动态表现优秀。

免费 开源 限制商用 13B
Mochi 1
视频生成 · 国外
需代理

Genmo 开源文生视频模型,运动连贯性表现出色。

免费 开源 可商用 10B
LTX-Video
视频生成 · 国外
需代理

Lightricks 开源实时文生视频模型,速度极快。

免费 开源 可商用 2B
Whisper large-v3
音频语音 · 国外
需代理

OpenAI 开源语音识别模型,多语言转写业界标杆。

免费 开源 可商用 1.55B
CosyVoice 2
音频语音 · 国内
可直连

阿里开源语音合成模型,少样本音色复刻与流式 TTS。

免费 开源 可商用 0.5B
ChatTTS
音频语音 · 国内
可直连

面向对话场景的开源中英文 TTS,韵律自然口语化。

免费 开源 不可商用
F5-TTS
音频语音 · 国内
可直连

开源流匹配 TTS,零样本音色克隆速度快效果好。

免费 开源 可商用 0.3B
Qwen2.5-VL-72B
多模态 · 国内
可直连

通义千问视觉语言旗舰,文档/图表/视频理解能力领先。

免费 开源 可商用 72B · 128K
GLM-4V-9B
多模态 · 国内
可直连

智谱开源多模态模型,中英文图文理解能力强。

免费 开源 限制商用 9B · 8K
MiniCPM-V 2.6
多模态 · 国内
可直连

面壁智能端侧多模态模型,8B 比肩更大模型,可手机运行。

免费 开源 限制商用 8B
InternVL2.5-78B
多模态 · 国内
可直连

上海 AI Lab 开源多模态旗舰,综合视觉理解逼近闭源。

免费 开源 可商用 78B
Qwen2.5-Coder-32B
代码 · 国内
可直连

通义千问代码大模型,开源代码能力比肩顶级闭源模型。

免费 开源 可商用 32B · 128K
DeepSeek-Coder-V2
代码 · 国内
可直连

DeepSeek 开源代码 MoE 模型,支持 338 种编程语言。

免费 开源 可商用 236B(MoE, 21B active) · 128K
Code Llama 70B
代码 · 国外
需代理

Meta 开源代码模型,覆盖主流语言的生成与补全。

免费 开源 限制商用 70B · 16K
StarCoder2-15B
代码 · 国外
需代理

BigCode 开源代码模型,600+ 语言训练,许可宽松。

免费 开源 可商用 15B · 16K
DeepSeek-R1
文本对话 · 国内
可直连

深度求索开源推理大模型,数学与代码推理对标顶级闭源。

免费 开源 可商用 671B(MoE, 37B active) · 128K
Qwen2.5-72B
文本对话 · 国内
可直连

通义千问 2.5 旗舰稠密模型,中文与通用能力强。

免费 开源 可商用 72B · 128K
ERNIE 4.5
文本对话 · 国内
可直连

百度文心 4.5 开源系列,多模态与中文理解强。

免费 开源 可商用 0.3B–424B(系列) · 128K
MiniMax-Text-01
文本对话 · 国内
可直连

MiniMax 开源大模型,线性注意力支持百万级上下文。

免费 开源 可商用 456B(MoE, 45.9B active) · 1000K
Mistral Large
文本对话 · 国外
需代理

Mistral 旗舰开源模型,多语言与代码能力强。

免费 开源 限制商用 123B · 128K
Gemma 2 27B
文本对话 · 国外
需代理

Google 开源 Gemma 2,轻量高效、部署友好。

免费 开源 可商用 27B · 8K
FLUX.1 [schnell]
图像生成 · 国外
需代理

Black Forest Labs 极速文生图模型,1-4 步出图可商用。

免费 开源 可商用 12B
Stable Diffusion 3.5 Large
图像生成 · 国外
需代理

Stability AI 文生图旗舰,画质与提示遵循提升。

免费 开源 限制商用 8B
HiDream-I1
图像生成 · 国内
可直连

智象未来开源文生图模型,17B 参数、MIT 可商用。

免费 开源 可商用 17B
CogView-4
图像生成 · 国内
可直连

智谱开源文生图模型,原生支持中文输入与中文渲染。

免费 开源 可商用 6B
Wan2.1-I2V-14B
视频生成 · 国内
可直连

阿里通义万相图生视频开源模型,720P 高质量。

免费 开源 可商用 14B
CogVideoX1.5-5B
视频生成 · 国内
可直连

智谱升级版开源文生视频,更长时长更高分辨率。

免费 开源 可商用 5B
Step-Video-T2V
视频生成 · 国内
可直连

阶跃星辰开源文生视频大模型,30B 参数 MIT 可商用。

免费 开源 可商用 30B
SenseVoice
音频语音 · 国内
可直连

阿里开源多语言语音理解,识别+情感+事件检测。

免费 开源 可商用 0.2B
Kokoro-82M
音频语音 · 国外
需代理

超轻量开源 TTS,82M 参数音质媲美大模型。

免费 开源 可商用 82M
Spark-TTS
音频语音 · 国内
可直连

基于 LLM 的开源高效 TTS,中英文零样本克隆。

免费 开源 可商用 0.5B
Qwen2.5-Omni-7B
多模态 · 国内
可直连

通义千问全模态模型,文本/图像/音频/视频输入+语音输出。

免费 开源 可商用 7B · 32K
DeepSeek-VL2
多模态 · 国内
可直连

深度求索 MoE 多模态模型,视觉理解高效。

免费 开源 可商用 27B(MoE, 4.5B active)
GLM-4.1V-Thinking
多模态 · 国内
可直连

智谱开源视觉推理模型,带思维链的多模态理解。

免费 开源 可商用 9B · 64K
DeepSeek-Coder-33B
代码 · 国内
可直连

深度求索代码模型,项目级代码补全与生成。

免费 开源 可商用 33B · 16K
CodeGeeX4-9B
代码 · 国内
可直连

智谱开源多语言代码模型,补全、解释、仓库问答。

免费 开源 限制商用 9B · 128K
StarCoder2-3B
代码 · 国外
需代理

BigCode 轻量代码模型,端侧补全友好、许可宽松。

免费 开源 可商用 3B · 16K
Qwen3-32B
文本对话 · 国内
可直连

通义千问3 稠密 32B,思考/非思考双模式,可商用。

免费 开源 可商用 32B · 128K
Qwen3-8B
文本对话 · 国内
可直连

通义千问3 轻量 8B,消费级显卡可跑,可商用。

免费 开源 可商用 8B · 128K
GLM-4.5
文本对话 · 国内
可直连

智谱 GLM-4.5 开源旗舰 MoE,主打 Agent 与推理。

免费 开源 可商用 355B(MoE, 32B active) · 128K
Kimi K2
文本对话 · 国内
可直连

月之暗面开源万亿参数 MoE 模型,Agent 与代码能力强。

免费 开源 可商用 1T(MoE, 32B active) · 128K
MiniMax-M1
文本对话 · 国内
可直连

MiniMax 开源推理模型,百万上下文 + 高效推理。

免费 开源 可商用 456B(MoE) · 1000K
dots.llm1
文本对话 · 国内
可直连

小红书 hi lab 开源 MoE 大模型,中文表现优秀。

免费 开源 可商用 142B(MoE, 14B active) · 32K
InternLM3-8B
文本对话 · 国内
可直连

上海 AI Lab 书生·浦语3 开源 8B,推理与对话均衡。

免费 开源 可商用 8B · 32K
Yi-1.5-34B
文本对话 · 国内
可直连

零一万物 Yi-1.5 开源 34B,中英双语能力强。

免费 开源 可商用 34B · 32K
Phi-4
文本对话 · 国外
需代理

微软开源小模型 Phi-4,推理与数学超越同尺寸。

免费 开源 可商用 14B · 16K
QwQ-32B
文本对话 · 国内
可直连

通义千问推理模型 QwQ-32B,32B 对标大推理模型。

免费 开源 可商用 32B · 128K
Qwen-Image
图像生成 · 国内
可直连

通义千问开源文生图模型,复杂中文文字渲染强。

免费 开源 可商用 20B
FLUX.1 Krea [dev]
图像生成 · 国外
需代理

BFL 与 Krea 联合开源文生图,真实感与美学强。

免费 开源 限制商用 12B
SANA
图像生成 · 国外
需代理

NVIDIA 高效文生图模型,笔记本可跑的 4K 生成。

免费 开源 可商用 1.6B
OmniGen2
图像生成 · 国内
可直连

智源开源统一图像生成模型,文生图+编辑+组合。

免费 开源 可商用 7B
Wan2.2
视频生成 · 国内
可直连

阿里通义万相2.2 开源视频生成,MoE 架构高画质。

免费 开源 可商用 27B(MoE, 14B active)
HunyuanVideo-I2V
视频生成 · 国内
可直连

腾讯混元开源图生视频模型,高保真动态。

免费 开源 限制商用 13B
SkyReels-V2
视频生成 · 国内
可直连

昆仑万维开源无限时长电影级视频生成模型。

免费 开源 可商用 14B
Step-Audio
音频语音 · 国内
可直连

阶跃星辰开源语音交互大模型,语音理解+生成一体。

免费 开源 可商用 130B
FireRedTTS
音频语音 · 国内
可直连

小红书开源 TTS,自然中文语音合成与克隆。

免费 开源 限制商用 0.4B
IndexTTS
音频语音 · 国内
可直连

B站开源工业级 TTS,中文发音可控、音色克隆。

免费 开源 可商用
MiniCPM-o 2.6
多模态 · 国内
可直连

面壁智能端侧全模态模型,视觉+语音+实时对话。

免费 开源 限制商用 8B
Ovis2-8B
多模态 · 国内
可直连

阿里国际开源多模态模型,结构化视觉理解强。

免费 开源 可商用 8B
Kimi-VL-A3B
多模态 · 国内
可直连

月之暗面开源 MoE 视觉模型,仅激活 3B 高效推理。

免费 开源 可商用 16B(MoE, 3B active) · 128K
Qwen3-Coder-480B
代码 · 国内
可直连

通义千问3 代码旗舰 MoE,Agentic 编码能力强。

免费 开源 可商用 480B(MoE, 35B active) · 256K
GLM-4.5-Air
代码 · 国内
可直连

智谱 GLM-4.5-Air 轻量 MoE,代码与 Agent 高性价比。

免费 开源 可商用 106B(MoE, 12B active) · 128K
Seed-Coder-8B
代码 · 国内
可直连

字节 Seed 开源代码模型,8B 代码能力对标更大模型。

免费 开源 可商用 8B · 32K
OpenCoder-8B
代码 · 国内
可直连

完全开源(含数据与流程)的代码大模型,可复现。

免费 开源 可商用 8B · 8K
Qwen3-30B-A3B
文本对话 · 国内
可直连

通义千问3 MoE 模型,仅激活 3B 即获强性能,可商用。

免费 开源 可商用 30B(MoE, 3B active) · 128K
Qwen2.5-7B
文本对话 · 国内
可直连

通义千问2.5 轻量 7B,应用最广的开源中文基座之一。

免费 开源 可商用 7B · 128K
DeepSeek-V3.1
文本对话 · 国内
可直连

深度求索 V3.1 混合推理模型,思考/非思考一体。

免费 开源 可商用 671B(MoE, 37B active) · 128K
GLM-Z1-32B
文本对话 · 国内
可直连

智谱 GLM-Z1 推理模型,数学与逻辑推理强,MIT。

免费 开源 可商用 32B · 128K
ERNIE-4.5-300B-A47B
文本对话 · 国内
可直连

百度文心4.5 旗舰 MoE,中文与多模态能力强,可商用。

免费 开源 可商用 300B(MoE, 47B active) · 128K
Hunyuan-A13B
文本对话 · 国内
可直连

腾讯混元开源 MoE 大模型,激活 13B、256K 上下文。

免费 开源 限制商用 80B(MoE, 13B active) · 256K
Skywork-13B
文本对话 · 国内
可直连

昆仑万维天工开源 13B 基座,中文语料充分。

免费 开源 可商用 13B · 8K
Mixtral 8x7B
文本对话 · 国外
需代理

Mistral 经典开源 MoE,性价比与多语言均衡。

免费 开源 可商用 47B(MoE, 13B active) · 32K
Gemma 3 27B
文本对话 · 国外
需代理

Google Gemma 3 开源多模态模型,支持图像与 140 语言。

免费 开源 可商用 27B · 128K
Llama 4 Scout
文本对话 · 国外
需代理

Meta Llama 4 原生多模态 MoE,千万级超长上下文。

免费 开源 限制商用 109B(MoE, 17B active) · 10000K
Seedream 3.0
图像生成 · 国内
可直连

字节豆包文生图模型,2K 高清与中英文字渲染强。

免费 可商用
Lumina-Image 2.0
图像生成 · 国内
可直连

上海 AI Lab 开源高效文生图模型,2.6B 高质量。

免费 开源 可商用 2.6B
LTX-Video 13B
视频生成 · 国外
需代理

Lightricks LTX-Video 升级版,实时高质量视频生成。

免费 开源 可商用 13B
MAGI-1
视频生成 · 国内
可直连

Sand AI 开源自回归视频生成模型,流式长视频。

免费 开源 可商用 24B
FramePack
视频生成 · 国外
需代理

lllyasviel 开源图生视频,6GB 显存即可生成长视频。

免费 开源 可商用 13B
Qwen2.5-Omni-3B
音频语音 · 国内
可直连

通义千问全模态轻量版,语音输入输出端到端。

免费 开源 限制商用 3B
Dia
音频语音 · 国外
需代理

Nari Labs 开源对话 TTS,生成带情感的多人对话音频。

免费 开源 可商用 1.6B
Higgs Audio V2
音频语音 · 国外
需代理

Boson AI 开源语音基座,多说话人与表现力强。

免费 开源 可商用 3B
InternVL3-78B
多模态 · 国内
可直连

上海 AI Lab 书生·万象3 开源多模态旗舰,MIT 可商用。

免费 开源 可商用 78B · 32K
Step3
多模态 · 国内
可直连

阶跃星辰开源多模态推理大模型,视觉推理强。

免费 开源 可商用 321B(MoE) · 64K
GLM-4.5V
多模态 · 国内
可直连

智谱开源多模态 MoE 旗舰,视觉推理 SOTA、MIT 可商用。

免费 开源 可商用 106B(MoE, 12B active) · 64K
Kimi-VL-Thinking
多模态 · 国内
可直连

月之暗面开源视觉推理 MoE,带思维链、MIT 可商用。

免费 开源 可商用 16B(MoE, 3B active) · 128K
Yi-Coder-9B
代码 · 国内
可直连

零一万物 Yi-Coder,9B 代码模型支持 52 种语言。

免费 开源 可商用 9B · 128K
Codestral
代码 · 国外
需代理

Mistral 代码专用模型,80+ 语言与填充补全。

免费 开源 限制商用 22B · 32K
Granite Code 34B
代码 · 国外
需代理

IBM 开源企业级代码模型,Apache-2.0 可商用。

免费 开源 可商用 34B · 8K
DeepSeek-Coder-V2-Lite
代码 · 国内
可直连

深度求索代码 MoE 轻量版,激活 2.4B 易本地部署。

免费 开源 可商用 16B(MoE, 2.4B active) · 128K
Qwen3-Next-80B
文本对话 · 国内
可直连

通义千问3-Next 高稀疏 MoE,激活 3B、超长上下文高效。

免费 开源 可商用 80B(MoE, 3B active) · 256K
Ling-mini
文本对话 · 国内
可直连

蚂蚁百灵开源 MoE 模型,激活 1.4B 高效推理。

免费 开源 可商用 16B(MoE, 1.4B active) · 128K
Baichuan-M1
文本对话 · 国内
可直连

百川智能开源医疗增强大模型,临床问答强。

免费 开源 可商用 14B · 128K
Wan2.2-Animate
视频生成 · 国内
可直连

阿里通义万相开源角色动画模型,照片驱动表演。

免费 开源 可商用 14B
gpt2
文本对话 · 国外
需代理

AI 会议记录工具,自动录制转写与摘要。

付费