AI 画图怎么用？6 大工具 + 100 个 prompt 完全指南

如果你对「AI 画图怎么用」只想找一篇能讲清楚的文章，那就是这篇。

这是一篇 Pillar 文章，覆盖 AI 画图从原理、工具盘点、入门路线、prompt 模板、风格教程、商用注意事项的完整链路。预计阅读时间 25 分钟，但不需要一次读完——可以按目录直接跳到你最关心的部分。

读完这篇，你会得到：

看懂文生图到底怎么工作的
知道目前 10 款主流工具该怎么选
拿到一份 7 天上手路线
100 个可直接复制使用的 prompt 模板
知道商用前要注意哪些坑

AI 画图到底是什么（原理）
6 大主流工具该怎么选
7 天入门路线
Prompt 工程的 6 大要素
5 大热门风格 prompt 模板
100 个场景化 prompt 速查
高级技巧：图生图、参考图、ControlNet
商用前必须知道的 5 件事
常见问题与失败案例
未来 12 个月的趋势预判

一、AI 画图到底是什么

一句话定义

AI 画图就是用文字描述让 AI 生成图片的技术，也叫文生图（text-to-image）。

你打一句话，10 秒后 AI 给你一张图。不需要美术功底，不需要会 PS，只需要会描述。

如果你想看更细的原理通俗解读，可以读 AI 画图是什么这篇专门展开的文章。

简单原理（不想看可跳过）

主流 AI 画图工具底层都是扩散模型（diffusion model）。训练阶段，模型被喂了几十亿张「图 + 文字描述」配对数据，学会了「猫」「黄昏」「水彩」这些词对应什么视觉特征。

生图阶段做的事是：

把你的 prompt 翻译成机器能懂的语义向量
从一团完全随机的噪点开始
一步步「去噪」，每一步都让画面更像你描述的
大约 20-50 步之后，一张图就生成了

记住一句话：AI 画图不是「画」出来的，是「猜」出来的。同样的 prompt 跑两次，结果会不一样，这是特性。

文生图 vs PS vs 摄影

新手最容易混淆这三者的关系：

PS 强在「修改已有图」：抠图、调色、合成
摄影强在「捕捉真实场景」：所见即所得，但要等天气、找模特
AI 画图 强在「从零创造」：你只有一句话，没有素材，让它生成

实际工作流通常是：AI 出几张候选 → 摄影补真实素材 → PS 做最终合成。三者配合，效率最高。

二、6 大主流工具该怎么选

完整对比 10 款工具的版本看 AI 画图工具有哪些。下面是这篇 Pillar 的速选版，按需求 1 分钟定位。

海外 3 大金刚

Midjourney：氛围感天花板，新手出片即漂亮

强项：美学、电影感、艺术气质
价格：约 10 美元 / 月起
国内可用性：需要科学上网 + 海外手机号

Flux：写实新王，2024 年起取代了不少 Midjourney 的商业场景

强项：写实人像、手指细节、文字渲染
价格：schnell 版免费开源，pro 付费
国内可用性：通过国内聚合平台可用

Stable Diffusion：开源自由派

强项：完全自由，可加 LoRA 定制风格
价格：模型免费，电脑成本约 6000 元起
国内可用性：本地部署完全可用

国产 3 大主力

即梦（字节）：国产美学最强

强项：氛围感接近 Midjourney 入门档次，中文 prompt 准
价格：免费 + 付费会员
国内可用性：抖音账号扫码登录，零门槛

可灵图（快手）：写实人像扛把子

强项：人物五官细节、皮肤质感真实
价格：每日 66 灵感值免费
国内可用性：快手账号扫码登录

文心一格（百度）：国风首选 + 免费额度大

强项：国风、水墨、传统画风
价格：每日 30 张免费
国内可用性：百度账号登录

3 步快速决策

第 1 步：能不能 / 想不想科学上网？

不能 → 看国产 3 款
能 → 海外 3 款都可考虑

第 2 步：主要画什么？

美学 / 氛围 → Midjourney（海外）或即梦（国产）
写实 / 人像 → Flux（海外）或可灵图（国产）
国风 / 古风 → 文心一格、即梦

第 3 步：是否商用？

个人玩 → 任意免费工具均可
商业项目 → Midjourney 付费版或自部署 Flux/SD，且看清协议

完整免费工具盘点（含通义万相、腾讯混元图等）看免费 AI 画图工具推荐。

三、7 天入门路线

新手从零到能稳定出片，按 7 天计划走最有效率。完整版看 AI 画图入门路线，这里是 Pillar 的精简版。

第 1 天：选工具 + 出第一张图

直接用国产免费工具（即梦 / 可灵图 / 文心一格任选一），扫码登录 → 输入文字 → 出图。30 分钟内完成。

练习题：画「一只穿小红裙的橘猫，坐在咖啡店窗边，水彩风格」。

第 2 天：学懂 prompt 的 6 个要素

要素	解释	例子
主体	画什么	一只橘猫
场景	在哪里	在窗边的咖啡店
风格	什么画风	水彩 / 油画 / 写实
灯光	什么光	黄昏暖光 / 自然光
视角	怎么看	平视 / 俯视 / 仰拍
画质	多精致	高细节 / 电影感 / 4k

把这 6 个要素拼起来，效果比裸 prompt 好 3 个档次。

第 3 天：跟模板画 5 种不同风格

水彩、写实摄影、二次元、扁平、复古胶片，每种用同一个主体跑一遍，建立直观风格库。

第 4 天：学会图生图改细节

上传一张图 + 描述 → AI 在原图基础上改。最适合改风格不改构图、改局部留主体的场景。

第 5 天：学会用参考图复刻风格

两种玩法：1）让 AI 分析参考图给你 prompt；2）用工具的「垫图」功能直接让 AI 模仿。

第 6 天：接触一个进阶工具（可选）

Midjourney 试用版 / Flux schnell / DiffusionBee（Mac 本地 SD），任选一个深入。

第 7 天：给自己一个实际任务做交付

不是「随便画几张玩」，必须有明确交付（封面、卡片、头像、海报）。

四、Prompt 工程的 6 大要素

写好 AI 画图 prompt 不是玄学，是有结构的。下面是任何一句好 prompt 必备的 6 大要素，按重要性排序。

要素 1：主体（subject）

写清楚画什么、什么状态。

错误示范：「一只猫」

正确示范：「一只 3 岁的橘猫，蹲坐在窗边，回头看镜头」

关键词：年龄、品种、姿态、表情、动作。

要素 2：场景（scene）

主体在哪里、周围有什么。

错误示范：「在咖啡店」

正确示范：「在一家有暖黄色灯光的复古咖啡店里，窗外是雨后的街道，桌上有一杯冒着热气的拿铁」

关键词：地点、时间、天气、配角物品、远近景。

要素 3：风格（style）

整体画风。这是决定图「看起来高级与否」的关键。

常用风格词：

写实类：写实摄影、35mm 胶片、电影感、纪录片质感
绘画类：油画、水彩、水墨、丙烯、印象派、新海诚画风
设计类：扁平插画、极简、矢量、孟菲斯风格、复古海报
二次元：日漫、新海诚、宫崎骏、京阿尼、赛博朋克
3D 类：皮克斯风格、低多边形、克莱风格、像素

要素 4：灯光（lighting）

光线决定氛围。同一个主体配不同灯光，气质天差地别。

常用灯光词：

自然光、晨光、黄昏暖光、午后斜光
室内灯、烛光、霓虹、电影级三点光
逆光、侧光、顶光、伦勃朗光
阴天柔光、雾光、海面反光

要素 5：视角（angle）

镜头从哪儿看。

平视：日常感、平等感
仰拍：高大感、英雄感
俯视：上帝视角、孤独感
微距：细节感、特写感
广角：壮阔感、电影感

要素 6：画质（quality）

最后加一组「画质词」，让 AI 知道你想要的精细度。

常用：高细节、超高细节、8k、4k、电影感、超写实、电影级调色、电影感构图。

把这 6 要素拼一句完整 prompt：

一只 3 岁的橘猫，蹲坐在窗边回头看镜头（主体），窗外是雨后的复古咖啡街道，桌上有一杯冒着热气的拿铁（场景），35mm 胶片摄影风格（风格），黄昏侧逆光从窗外照进来（灯光），平视微距视角（视角），高细节，电影感调色，浅景深（画质）

效果会比「一只猫在咖啡店」高 5 个档次。

下面这段 prompt 帮你把模糊想法自动扩写成结构化 prompt：

📋 Prompt 模板

我想用 AI 画图工具生成一张图，主题是：[填你的想法]

请帮我扩写成一段完整的中英文双语 prompt，包含以下 6 个要素：

主体（subject）：是什么 / 在做什么 / 什么状态
场景（scene）：在哪里 / 周围有什么 / 时间天气
风格（style）：油画 / 水彩 / 写实摄影 / 二次元等
灯光（lighting）：自然光 / 黄昏 / 室内灯 / 霓虹
视角（angle）：平视 / 俯视 / 仰拍 / 微距
画质（quality）：4k、高细节、电影感等

输出要求：

一份中文版（适合国产工具：即梦 / 可灵图 / 文心一格）
一份英文版（适合 Midjourney / Flux）
2 个变体版本，方便对比
每个版本不超过 100 字

五、5 大热门风格 prompt 模板

下面是 5 个最常用的风格模板，把方括号内换成你的主体即可使用。

模板 1：水彩插画

主体：[你想画的主体] 风格：水彩插画，柔和的笔触，水彩晕染效果，纸质纹理灯光：自然光，柔和视角：平视画质：高细节，手绘质感

模板 2：写实摄影

主体：[你想画的主体] 风格：写实摄影，35mm 镜头，浅景深，电影感调色灯光：黄昏侧逆光，电影级光照视角：略带俯视，构图三分法画质：8k，超高细节，照片级真实

模板 3：二次元日漫

主体：[你想画的主体] 风格：日系二次元动漫，新海诚画风，干净的线稿，鲜艳的色彩灯光：晴朗的下午光线视角：动漫常用的略仰视画质：高清晰度，细腻笔触

模板 4：极简扁平

主体：[你想画的主体] 风格：极简扁平插画，几何形状，2-3 个主色调，留白灯光：均匀光，无明显阴影视角：正面或平视画质：矢量风格，干净利落

模板 5：复古胶片

主体：[你想画的主体] 风格：复古胶片摄影，1990 年代质感，柯达胶卷颜色，颗粒感灯光：自然光，略过曝视角：随手抓拍感画质：胶片纹理，轻微噪点，怀旧色调

六、100 个场景化 prompt 速查

下面把 prompt 按 10 个场景分类，每类 10 个直接可用的模板，覆盖大多数日常需求。

场景 1：公众号 / 小红书封面（10 个）

一只戴着金色头冠的橘猫坐在云朵上，水彩插画风格，柔和暖色调
一杯冒着热气的拿铁咖啡，桌上散落着秋天的落叶，电影感写实摄影，黄昏暖光
一本翻开的旧书悬浮在星空背景中，书页里飞出萤火虫，奇幻插画
极简扁平风格的女性侧脸剪影，背景是粉色到橘色的渐变天空
复古海报风格的咖啡店招牌，木质墙面，1950 年代美式风
一只趴在书桌上睡觉的柴犬，旁边放着耳机和咖啡，温暖治愈插画
雾蒙蒙的山间日出，远处有一个独自走向山顶的旅人，电影感构图
一双女性的手捧着一盏发光的玻璃灯，背景是雪夜的森林，奇幻治愈风
极简日系插画，一个女生背着帆布包走在晴朗的小巷，干净的线条
复古信件、钢笔、干玫瑰花瓣摆在木桌上，怀旧风格静物摄影

场景 2：自媒体头像（10 个）

一只戴眼镜的卡通柴犬，正面，鲜艳色彩，扁平卡通风格
极简风格的女性侧脸线稿，单色，干净，适合做头像
二次元日漫风女孩，蓝色头发，星星眼，半身像
像素风格的猫咪，戴着小帽子，正面，8bit 风格
水彩风格的山水盆景，淡雅，留白多
油画风格的男性侧脸剪影，文艺复兴风格
一只穿着西装的柯基犬，正经坐姿，写实风格
抽象几何图形组合，蓝紫色系，现代设计感
卡通风格的咖啡杯拟人，可爱表情，扁平
国风水墨风格的竹子和小鸟，留白，淡雅

场景 3：电商主图（10 个）

白色陶瓷咖啡杯放在原木桌上，背景虚化的咖啡店，自然光，电商主图风格
一双米色运动鞋摆在浅灰色背景前，俯视构图，柔和阴影，商品摄影
一只装满燕麦片的玻璃罐，旁边散落坚果和浆果，自然光，健康食品风格
黑色背景上悬浮的金色护肤精华液瓶，光线打在瓶身，高端化妆品风
木质托盘上的一壶花茶，配茶杯和饼干，温馨午后风格
极简白色背景上的智能手表，配深色表带，3 个角度展示
浅色背景前的精致皮包，俯视，柔和阴影，配饰广告风
户外野餐场景，野餐毯上摆着便携小灶具，旅行装备风
一束鲜花插在玻璃花瓶里，背景是淡色墙面，自然光，家居生活风
米色织物背景前的精美香水瓶，柔和光晕，奢侈品摄影风

场景 4：儿童读物插画（10 个）

一只穿背带裤的小熊在森林里捡蘑菇，温暖水彩，绘本风格
月亮上的兔子用毛线钩星星，温柔插画，蓝紫色系
一只戴红帽子的小狐狸在雪地里追着雪花跑，可爱治愈风
大象在花丛中睡觉，蝴蝶停在它鼻子上，水彩，柔和粉色调
一群企鹅排队跳冰湖，冒险绘本风格，蓝白色调
海底世界里的小章鱼弹钢琴，鱼儿围着听，奇幻插画
云朵上面有一个小屋，烟囱冒着糖果味的烟，童话风格
一只兔子推着装满胡萝卜的小车走在彩虹桥上，明亮色彩
太空背景里的小宇航员牵着一只猫，星星点点，浪漫科幻
一只独角兽在花园里喝下午茶，茶杯里飘出星光，奇幻治愈

场景 5：游戏 / 概念设计（10 个）

中世纪城堡，月光下的尖塔，云雾环绕，奇幻概念图
赛博朋克城市夜景，霓虹招牌，雨夜，cyberpunk 风格
蒸汽朋克风格的飞行器停在云海中的港口，金属铜色调
末日废墟里长出的绿色植物，光线穿过破墙，意境感
东方仙侠世界的飞鹤楼阁，云海仙气，水墨风格
太空船降落在外星雪原，巨大的双月亮，科幻概念
神秘森林深处的发光蘑菇，萤火虫飞舞，奇幻氛围
沙漠中央的金字塔，沙尘暴正在逼近，史诗感
北欧风格的村落，被极光笼罩，宁静神秘
海底古城遗迹，鲸鱼悠然游过，蓝绿色调

场景 6：人像写真（10 个）

一位 25 岁亚洲女性，穿白色棉麻连衣裙，在花田中回眸，黄昏侧逆光，胶片摄影
一位 30 岁亚洲男性，穿深蓝色西装，在城市夜景前回头，电影感，霓虹光
一位长发女性，逆光下走在海边，剪影感，金色光线
老人坐在木椅上喝茶的特写，皱纹清晰，黑白胶片
一位运动员准备起跑的瞬间，俯视特写，专业体育摄影
小女孩在雨中撑伞的背影，水洼倒影，治愈风格
厨师在厨房专注做菜的侧脸特写，蒸汽缭绕，纪录片风格
一位音乐家闭眼演奏小提琴，舞台聚光灯下，情绪饱满
母亲牵着孩子的手走在公园林荫道，背影，温馨自然光
街头摄影师抓拍路人的瞬间，35mm 黑白胶片质感

场景 7：室内装修参考（10 个）

日式 muji 风格客厅，浅木色家具，米白沙发，自然光，宁静感
北欧风格小户型，白色墙面，绿植，简约家具，自然采光
工业风咖啡店，水泥墙面，金属管线，皮质沙发，暖黄色灯
法式复古卧室，软包床头，金色装饰，米色调，温柔氛围
极简日式茶室，榻榻米，竹帘，禅意，留白
美式乡村厨房，木质橱柜，挂蓝白格子毛巾，温馨实用
现代简约书房，执行窗，原木书桌，绿植，专注感
复古蒸汽朋克酒吧，皮质沙发，铜制吊灯，深色木地板
莫兰迪色调卧室，灰粉色墙面，软装精致，治愈感
阁楼公寓，斜屋顶，执行窗，绿植与原木，文艺青年风

场景 8：海报设计（10 个）

极简文字海报，单色背景，居中粗体英文「LESS IS MORE」，瑞士设计风格
复古电影海报，黄褐色调，1970 年代质感，胶片噪点
音乐节海报，霓虹色彩，几何图形，动感构图
咖啡店开业海报，温暖色调，咖啡豆飘散，手绘字体
健身房宣传海报，肌肉线条，黑红色调，力量感
春节祝福海报，红金配色，灯笼和福字，国风
读书会海报，文艺风格，书本叠成阶梯，柔和色调
旅行招募海报，雪山日出，剪影人物，史诗感
公益环保海报，地球与森林对比，色彩鲜明，警示感
极简产品发布海报，深色背景，居中产品图，柔和光晕

场景 9：PPT / Keynote 配图（10 个）

一只手指向上的数据曲线，简约 3D 风格，蓝色系
团队合作的扁平插画，5 个人围着白板讨论，办公场景
极简风格的灯泡发光，黄色背景，创意idea 概念
简约的山顶旗帜，象征目标达成，单色调
多个齿轮咬合，象征系统协作，蓝灰色调
城市天际线剪影，配科技元素，未来感
简约风格的时钟与日历，时间管理主题
抽象几何图形组成的网络节点，连接感，紫蓝色调
数据图表与图形结合的概念图，干净专业
一颗发芽的种子，简约插画，象征成长

场景 10：表情包 / 头像（10 个）

二次元风格的女孩做鬼脸，色彩鲜艳，可爱
一只猫翻白眼，无奈表情，卡通风
柴犬伸出舌头吐槽，扁平风格
小宝宝双手捂脸害羞，温暖色调
加菲猫风格的橘猫翻白眼，复古插画
一只熊猫边吃竹子边竖大拇指，简笔画风格
小恐龙生气喷火，可爱风
一只兔子捂嘴偷笑，柔和粉色
卡通版的程序员对着电脑哭，扁平插画
一只仓鼠捂着钱袋哭穷，可爱风

七、高级技巧：图生图、参考图、ControlNet

入门后想做更复杂的事，下面 3 个高级功能必学。

技巧 1：图生图（image-to-image）

上传一张图 + 写 prompt，AI 在原图基础上改。

适用场景：

把照片转风格（真人 → 二次元）
改局部不改整体（衣服颜色、背景元素）
升级图的精度（低清 → 高清）

操作要点：

国产工具大多在「图生图」入口直接操作
关键参数是「相似度」（0-1），越低改动越大
想保留构图就调高相似度（0.7-0.9）

技巧 2：参考图 / 垫图

让 AI 模仿一张参考图的风格 / 构图 / 色彩。

适用场景：

复刻一张你喜欢的图的风格
保持系列图的统一画风（绘本、表情包系列）
客户给了参考图要你照着做

操作要点：

Midjourney 用 --cref 或 --sref 参数
国产工具大多有「参考图」上传入口
通常可以分别控制「参考构图」「参考风格」「参考色彩」

技巧 3：ControlNet 精确控制

ControlNet 是 Stable Diffusion 生态里的高级插件，能让你精确控制人物姿势、线稿轮廓、深度信息。

典型应用：

给 AI 一个火柴人姿势线稿 → AI 按这个姿势生成完整人物
给 AI 一张建筑线稿 → AI 上色变成完整效果图
给 AI 一张深度图 → AI 在保留空间感的前提下重画

入门门槛：需要 Stable Diffusion + ComfyUI 或 WebUI，新手不建议一开始就学。等用国产工具用了 3 个月再考虑碰 ControlNet。

八、商用前必须知道的 5 件事

AI 画图商用是灰色地带，下面 5 件事是底线。本节不构成法律意见，具体合规请咨询专业人士。

1. 看清每个工具的最新协议

不同工具的商用条款差异很大：

Midjourney 付费版通常允许商用
Stable Diffusion 模型本身免费，但加的 LoRA / Checkpoint 可能有协议
国产工具的免费版多数允许个人和小商用，但要求标注
商业 API 一般另签协议

铁律：商用前花 10 分钟看一遍当前最新协议，截图存档。

2. 不要 prompt 里写「某画师风格」

「模仿在世画家风格」是当前最大的法律风险。避免在 prompt 写：

「in the style of [某位在世画家]」
「by [某位摄影师]」
「modeled after [某品牌设计]」

可以用风格描述代替具体人名：「水彩风格」「胶片摄影」「现代极简」。

3. 人物相似度的隐患

如果生成的人物看起来太像某个真实名人（公众人物 / 朋友 / 客户），有侵犯肖像权风险。

避坑做法：

不要 prompt 里写具体名人名字
生成后觉得「太像某人」就重新跑或人工修改五官
商业图涉及具体人物，最好用真实模特摄影

4. AI 生成图的版权归属不清

2024-2026 年期间，多国法院的判决倾向于 AI 生成图不享有完整版权（因为没有「人类创意」）。这意味着：

你画的图可能被别人随意抄走，你无法主张版权
商业合同里如果要交付「版权图」，AI 直出不算
建议：AI 出底稿 + 人工修改 + 标注「AI 辅助创作」

5. 客户和监管的标注要求

越来越多平台和场景要求标注「AI 生成」：

自媒体配图：建议小字标注「AI 生成」
电商主图：部分平台要求标注或限制使用
新闻 / 纪实类内容：必须标注
涉及人物的图：最好注明「AI 合成图，非真实人物」

九、常见问题与失败案例

失败案例 1：「我画的手有 6 根手指」

原因：早期 AI 模型对「手」的训练数据少，经常画错。

解决：

用新一代模型（Flux、Midjourney v7）
prompt 加「perfect hands, 5 fingers」
画完用 PS 或 inpaint 单独修手
让人物把手藏起来 / 放口袋里

失败案例 2：「同一个角色画 10 张，每张都不像」

原因：AI 画图本质有随机性，每次都从随机噪点开始。

解决：

用「参考图」功能锁定角色
Midjourney 用 --cref 参数
Stable Diffusion 用 LoRA 训练自己的角色
国产工具找「角色一致性」功能（多数都有）

失败案例 3：「prompt 写了一堆，AI 还是画错主体」

原因：

prompt 太长，AI 会忽略后面的细节
主体描述放得太靠后
关键词权重不够

解决：

prompt 控制在 100 字以内
主体写在最前面
重要的词用权重符号（Midjourney ::2，SD (word:1.5)）
一次只突出 1 个主题

失败案例 4：「图片画质很糊」

原因：

工具默认输出分辨率低（512x512 或 1024x1024）
没有用高清放大
用了快速 / 低精度模式

解决：

用工具的「高清放大」（upscale）功能
切换到高精度生成模式
用专门的图像超分工具（如 Topaz Gigapixel）后处理

失败案例 5：「画出来的人脸像 AI 脸」

原因：早期模型的人脸都有「同一张 AI 脸」的特征。

解决：

用新模型（Flux pro、Midjourney v7、可灵图）
prompt 加「natural face, real person, imperfect features」
国产可灵图的人脸是国产里最自然的，写实场景优先用

十、未来 12 个月的趋势预判

下面 5 个判断基于 2026 年初的行业进展，仅作参考，未来 12 个月可能验证或推翻。

趋势 1：免费工具的额度会逐步缩减

国产 AI 画图工具的免费额度从 2023 年的「无限」到 2026 年的「每天几十张」，预计未来 12 个月会继续缩减。建议现在就把使用习惯建立起来，付费时你已经知道最适合自己的工具。

趋势 2：视频生成会快速进入主流

Sora、可灵 AI、即梦视频已经把文生视频做到「能商用」的水平。预计 2026 年下半年文生视频会像 2023 年的文生图一样爆发。AI 画图用户可以提前关注文生视频学习路径。

趋势 3：人像生成会更难分辨真假

写实人像质量在快速逼近「不可分辨真伪」。对个人：用 AI 美颜成本越来越低；对社会：身份诈骗、虚假新闻风险增加，平台和监管会加强标注要求。

趋势 4：「AI 出底稿 + 人工修」会成为主流工作流

纯 AI 直出的图越来越被业内识别（「AI 味」），高端商业项目会更倾向「AI 出底稿 + 摄影师 / 设计师精修」的混合工作流。AI 画图能力的天花板，开始取决于你的审美 + 后期能力。

趋势 5：开源会继续赶上闭源

Flux、Stable Diffusion 3 等开源模型在质量上已经接近 Midjourney。对个人和小团队：开源 + 本地部署的 ROI 会持续提升。对企业：私有部署 AI 画图能力会成为标配。

整篇 Pillar 总结

如果只让你记住 5 件事：

AI 画图是用文字让 AI 生成图片，底层是扩散模型，本质是「猜」不是「画」
新手直接用国产免费工具（即梦 / 可灵图 / 文心一格），不要一上来折腾 SD / Midjourney
写好 prompt 的关键是 6 大要素：主体、场景、风格、灯光、视角、画质
7 天能入门，按文中路线走，第 7 天给自己一个真实交付任务巩固
商用前看协议，不要写「某画师风格」，建议人工修改后标注「AI 辅助创作」

站内延伸阅读

按学习路径推荐：

想看原理详细版 → AI 画图是什么
想看完整入门路线 → AI 画图入门 7 天路线
想看更详细工具对比 → AI 画图工具有哪些
想看 0 元方案 → 免费 AI 画图工具推荐

常见问题

Q：我应该一上来就学 Stable Diffusion 吗？ A：不建议。先用国产网页工具体验 1 个月，确认自己真的喜欢 AI 画图再考虑本地部署。SD 的配置 + 模型下载能耗你 2-3 天，新手 90% 在这步劝退。

Q：英语不好能玩 AI 画图吗？ A：完全能。国产工具（即梦 / 可灵图 / 文心一格 / 通义万相）的中文 prompt 已经很准。海外工具配合 ChatGPT 翻译也能用。英语好的最大优势是看 Midjourney 官方文档和社区资源，但不影响入门。

Q：手机能学吗？ A：能。即梦、可灵图、文心一格都有手机 App 或移动网页版，全流程可以手机完成。但电脑屏幕大、操作快，长期学习建议有电脑就用电脑。

Q：AI 画图能赚钱吗？ A：能但门槛在涨。2024 年随便接小红书图单都能赚，2026 年要做到「比客户自己用 AI 画得好」才有差异化。靠 AI 画图赚钱的人，赚的不是「画图费」，是「审美 + 流程 + 客户沟通」的钱。

Q：怎么判断我画的图是「能用的」？ A：3 个标准：1）整体氛围对了（风格、色调、情绪）；2）没有明显瑕疵（手、脸、文字、肢体比例正常）；3）能传达 prompt 的核心意思（不是「AI 自由发挥」的方向跑偏）。3 个都满足就是能用的，不需要追求 100 分。

Q：免费工具的图能直接商用吗？ A：法律上要看每家最新协议。多数国产免费工具允许个人和小商用，但要求标注「AI 生成」。电商主图、品牌设计等高商用场景，建议升级付费版或用本地部署的开源模型。

Q：我学了 3 个月还是画不好怎么办？ A：检查 3 件事：1）有没有真实交付任务——只为兴趣画的人，3 个月也只能停在 6 分；2）有没有看高手的 prompt——多刷 Midjourney showcase、即梦广场；3）有没有做后期——纯 AI 直出永远比 AI + 人工修差一截。