AI 模型库
按模态/能力浏览 AI 模型。额外标注是否开源、是否可商用、参数规模与上下文长度。
通义千问开源旗舰 MoE 大模型,多语言、推理与代码能力强。
DeepSeek 开源 MoE 大模型,性价比极高,推理与代码强。
智谱 GLM-4 开源对话模型,中文综合能力优秀。
Meta 开源指令模型,70B 规模逼近更大模型表现。
Black Forest Labs 出品文生图模型,画质与文字渲染领先。
Stability AI 开源文生图基座,生态与插件最丰富。
快手开源文生图模型,中文提示词理解与中文海报渲染强。
阿里通义万相开源视觉生成模型,文生图/视频统一架构。
智谱开源文生视频模型,消费级显卡可推理。
腾讯混元开源文生视频大模型,画质与动态表现优秀。
Genmo 开源文生视频模型,运动连贯性表现出色。
Lightricks 开源实时文生视频模型,速度极快。
OpenAI 开源语音识别模型,多语言转写业界标杆。
阿里开源语音合成模型,少样本音色复刻与流式 TTS。
面向对话场景的开源中英文 TTS,韵律自然口语化。
开源流匹配 TTS,零样本音色克隆速度快效果好。
通义千问视觉语言旗舰,文档/图表/视频理解能力领先。
智谱开源多模态模型,中英文图文理解能力强。
面壁智能端侧多模态模型,8B 比肩更大模型,可手机运行。
上海 AI Lab 开源多模态旗舰,综合视觉理解逼近闭源。
通义千问代码大模型,开源代码能力比肩顶级闭源模型。
DeepSeek 开源代码 MoE 模型,支持 338 种编程语言。
Meta 开源代码模型,覆盖主流语言的生成与补全。
BigCode 开源代码模型,600+ 语言训练,许可宽松。
深度求索开源推理大模型,数学与代码推理对标顶级闭源。
通义千问 2.5 旗舰稠密模型,中文与通用能力强。
百度文心 4.5 开源系列,多模态与中文理解强。
MiniMax 开源大模型,线性注意力支持百万级上下文。
Mistral 旗舰开源模型,多语言与代码能力强。
Google 开源 Gemma 2,轻量高效、部署友好。
Black Forest Labs 极速文生图模型,1-4 步出图可商用。
Stability AI 文生图旗舰,画质与提示遵循提升。
智象未来开源文生图模型,17B 参数、MIT 可商用。
智谱开源文生图模型,原生支持中文输入与中文渲染。
阿里通义万相图生视频开源模型,720P 高质量。
智谱升级版开源文生视频,更长时长更高分辨率。
阶跃星辰开源文生视频大模型,30B 参数 MIT 可商用。
阿里开源多语言语音理解,识别+情感+事件检测。
超轻量开源 TTS,82M 参数音质媲美大模型。
基于 LLM 的开源高效 TTS,中英文零样本克隆。
通义千问全模态模型,文本/图像/音频/视频输入+语音输出。
深度求索 MoE 多模态模型,视觉理解高效。
智谱开源视觉推理模型,带思维链的多模态理解。
深度求索代码模型,项目级代码补全与生成。
智谱开源多语言代码模型,补全、解释、仓库问答。
BigCode 轻量代码模型,端侧补全友好、许可宽松。
通义千问3 稠密 32B,思考/非思考双模式,可商用。
通义千问3 轻量 8B,消费级显卡可跑,可商用。
智谱 GLM-4.5 开源旗舰 MoE,主打 Agent 与推理。
月之暗面开源万亿参数 MoE 模型,Agent 与代码能力强。
MiniMax 开源推理模型,百万上下文 + 高效推理。
小红书 hi lab 开源 MoE 大模型,中文表现优秀。
上海 AI Lab 书生·浦语3 开源 8B,推理与对话均衡。
零一万物 Yi-1.5 开源 34B,中英双语能力强。
微软开源小模型 Phi-4,推理与数学超越同尺寸。
通义千问推理模型 QwQ-32B,32B 对标大推理模型。
通义千问开源文生图模型,复杂中文文字渲染强。
BFL 与 Krea 联合开源文生图,真实感与美学强。
NVIDIA 高效文生图模型,笔记本可跑的 4K 生成。
智源开源统一图像生成模型,文生图+编辑+组合。
阿里通义万相2.2 开源视频生成,MoE 架构高画质。
腾讯混元开源图生视频模型,高保真动态。
昆仑万维开源无限时长电影级视频生成模型。
阶跃星辰开源语音交互大模型,语音理解+生成一体。
小红书开源 TTS,自然中文语音合成与克隆。
B站开源工业级 TTS,中文发音可控、音色克隆。
面壁智能端侧全模态模型,视觉+语音+实时对话。
阿里国际开源多模态模型,结构化视觉理解强。
月之暗面开源 MoE 视觉模型,仅激活 3B 高效推理。
通义千问3 代码旗舰 MoE,Agentic 编码能力强。
智谱 GLM-4.5-Air 轻量 MoE,代码与 Agent 高性价比。
字节 Seed 开源代码模型,8B 代码能力对标更大模型。
完全开源(含数据与流程)的代码大模型,可复现。
通义千问3 MoE 模型,仅激活 3B 即获强性能,可商用。
通义千问2.5 轻量 7B,应用最广的开源中文基座之一。
深度求索 V3.1 混合推理模型,思考/非思考一体。
智谱 GLM-Z1 推理模型,数学与逻辑推理强,MIT。
百度文心4.5 旗舰 MoE,中文与多模态能力强,可商用。
腾讯混元开源 MoE 大模型,激活 13B、256K 上下文。
昆仑万维天工开源 13B 基座,中文语料充分。
Mistral 经典开源 MoE,性价比与多语言均衡。
Google Gemma 3 开源多模态模型,支持图像与 140 语言。
Meta Llama 4 原生多模态 MoE,千万级超长上下文。
字节豆包文生图模型,2K 高清与中英文字渲染强。
上海 AI Lab 开源高效文生图模型,2.6B 高质量。
Lightricks LTX-Video 升级版,实时高质量视频生成。
Sand AI 开源自回归视频生成模型,流式长视频。
lllyasviel 开源图生视频,6GB 显存即可生成长视频。
通义千问全模态轻量版,语音输入输出端到端。
Nari Labs 开源对话 TTS,生成带情感的多人对话音频。
Boson AI 开源语音基座,多说话人与表现力强。
上海 AI Lab 书生·万象3 开源多模态旗舰,MIT 可商用。
阶跃星辰开源多模态推理大模型,视觉推理强。
智谱开源多模态 MoE 旗舰,视觉推理 SOTA、MIT 可商用。
月之暗面开源视觉推理 MoE,带思维链、MIT 可商用。
零一万物 Yi-Coder,9B 代码模型支持 52 种语言。
Mistral 代码专用模型,80+ 语言与填充补全。
IBM 开源企业级代码模型,Apache-2.0 可商用。
深度求索代码 MoE 轻量版,激活 2.4B 易本地部署。
通义千问3-Next 高稀疏 MoE,激活 3B、超长上下文高效。
蚂蚁百灵开源 MoE 模型,激活 1.4B 高效推理。
百川智能开源医疗增强大模型,临床问答强。
阿里通义万相开源角色动画模型,照片驱动表演。
AI 会议记录工具,自动录制转写与摘要。