Midjourney v5学会看图说话!超简单小白上手教程

教程 3年前 (2023) 火星Ai导航
38,936 0 0

Midjourney V5上线后,网友们用它生成了数不清的惊叹作品。在这个AI作画工具面前,人和人的差距,或许就体现在prompt上了。去年在科罗拉多州博览会艺术比赛上用AI打败了人类的获奖者,花了80多个小时,经过900次迭代后,才用Midjourney完成了《太空歌剧院》这一艺术杰作。而ta直接拒绝分享出自己的prompt。

Midjourney v5学会看图说话!超简单小白上手教程

 

是的,现在很多时候,一行完美又专业的prompt,已经价值千金。

而Midjourney仿佛深知我们的需求,最近,它上线了一个新功能——/describe,可以帮我们从图像中反推prompt。

Midjourney v5学会看图说话!超简单小白上手教程

 

从图像反推prompt

现在,如果你有一个想模仿的图像,但你不知道要用什么样的prompt去描述它,这时候,describe就帮你大忙了。比如,下图是新海诚的《言叶之庭》(「言の葉の庭」)。

Midjourney v5学会看图说话!超简单小白上手教程

 

拖进图像后,Midjourney生成了下面四种prompt。

Midjourney v5学会看图说话!超简单小白上手教程

 

根据这四个prompt,Midjourney又生成了类似风格的四幅图。

简直完美。

Midjourney v5学会看图说话!超简单小白上手教程

 

并且,Midjourney提供的描述也可以激发出用户的更多灵感。传统的画家可能会患有空白画布综合征,AI艺术家有时也会词穷,很难找到描述照片的词语。在Midjourney的Discord频道上,从「/describe」就可以启动文本描述过程了。

Midjourney v5学会看图说话!超简单小白上手教程

 

Midjourney提供了一个拖放区,可以让你拖入图像。

然后按下回车键,就可以等待prompt了。

Midjourney v5学会看图说话!超简单小白上手教程

 

四个文本提示,包括描述性词语、样式详细信息和纵横比。宽高比在像素精确度方面与计算机类似,比如如果是一个16:9的图像,它会输出504:283。而四个文本提示生成后,你可以直接点击按钮,直接用它们生成图像,当然,在提交之前,你也可以选择自己优化提示。

作家的意外收获?

更有趣的是,Midjourney的这个新功能,竟然意外地让作家们获得了帮手。

如果找不到完美的形容词来描绘一幅画,只需要把图像上传到Midjourney,文采斐然的句子就自动蹦出来了。

而Midjourney返回的文本提示,真是让人惊喜连连。其中包括「palewave」、「cranberrycore」和「icepunk」等流行语,以及各种艺术家、摄影师和作者的姓名。

而提示中出现人名时,甚至是可点击的链接,可以打开谷歌搜索,如果点击进去,你或许会获得更多的灵感来源。

比如,上传Ross Burgener的一张绝佳的作品,Midjourney会这样描述:"极光在LED照明的冰屋上跳舞,给雪的颜色带来了蓝色调"。

Midjourney v5学会看图说话!超简单小白上手教程

 

它认出了北极光,会在提示中给出建议——可参考艺术家Qlexis Gritchenko和摄影师Nathan Wirth。它采用的词汇包括 「极地冰山」、「发光的天空」和「空灵的雕塑」。

网友们大喜,已玩疯

现在,网友们已经玩疯了。

有网友利用describe功能,生成了许多穿白色蕾丝裙的美女。

Midjourney v5学会看图说话!超简单小白上手教程 Midjourney v5学会看图说话!超简单小白上手教程

 

有人输入了一堆珠宝的图像。

Midjourney v5学会看图说话!超简单小白上手教程

 

得到了如下的prompt。

Midjourney v5学会看图说话!超简单小白上手教程

 

根据这些prompt生成的图像如下。

Midjourney v5学会看图说话!超简单小白上手教程

 

输入一个二次元萌妹。

Midjourney v5学会看图说话!超简单小白上手教程

 

输出的prompt,出图效果很惊艳。

Midjourney v5学会看图说话!超简单小白上手教程

 

输入一只气质憨憨的大捻角羚的照片。

Midjourney v5学会看图说话!超简单小白上手教程

 

输入一只气质憨憨的大捻角羚的照片。

Midjourney v5学会看图说话!超简单小白上手教程

 

输出的prompt生成的大捻角羚,气质更为冷峻。

Midjourney v5学会看图说话!超简单小白上手教程

 

输入一只海滩上的狗。

Midjourney v5学会看图说话!超简单小白上手教程

 

Prompt生出了四只埋在坑里的狗。

Midjourney v5学会看图说话!超简单小白上手教程

 

输入穿着燕尾服的动漫人物。

Midjourney v5学会看图说话!超简单小白上手教程

 

输入穿着燕尾服的动漫人物。

Midjourney v5学会看图说话!超简单小白上手教程

 

生成四张动漫人物。

Midjourney v5学会看图说话!超简单小白上手教程

 

是RLHF?

可以看到,Midjourney最近的进步,可以用飞速形容。

英伟达AI科学家Jim Fan猜测,Midjourney一直在根据人类反馈(「RLHF」)进行大规模的强化学习,并且,这可能是有史以来规模最大的文本到图像强化学习。

当用户选择放大图像时,是因为他们更喜欢它。如果不把这个过程当作奖励信号,那真是巨大的浪费。这些数据收集起来很便宜,而且完全符合用户群的需求。

拥有的用户越多,可以做的RLHF就越好,然后获得的用户就越多。

Midjourney v5学会看图说话!超简单小白上手教程

 

他还给出了一个免责声明,表示这就是自己的一个脑洞,自己并不认识Midjourney的人。

但他们一定已经是这么做的,因为UI的格式看起来就像一个多项选择题。

Midjourney v5学会看图说话!超简单小白上手教程

 

最后,要注意的是,同图像生成一样,describe功能需要使用积分,所以需要谨慎地考虑。

而且现在,Midjourney的免费功能,已经彻底关闭了。

Promptbase
版权声明:火星Ai导航 发表于 2023-06-16 16:16。
转载请注明:Midjourney v5学会看图说话!超简单小白上手教程 | 火星Ai导航

相关文章

Sora2 文本转视频系统

🚀 Sora2 文本转视频系统 · 提前预售方案(授权域名版 · 商用级)

系统定位: Sora 文本转视频系统(Sora Studio)https://sora.alibbbb.com是由 甘肃火星探索数字科技有限公司 独立研发的 AI 文本生成视频 SaaS 平台。源码部署需要协商价格。 本次预售采用 独立域名授权模式(不提供完整源码),含终身升级 + 软著授权,可私有化部署、可长期商用。 微信:MarsXone

🎯 一、产品定位(为什么值得提前预售)

Sora Studio 的目标是: 打造国内首个可私有化、可商用、可授权、可不断升级的 AI 文本转视频平台。 你不只是买一个系统, 而是购买一个 未来 3 年的黄金赛道入场票

🟦 二、系统当前核心能力(已完成 80%)

以下能力已经完全开发、可运行、可商用:

🔥 1. 文本生成视频(核心功能)

  • 输入一句话 → 自动生成视频
  • 支持 OpenAI Video(Sora)、国内模型
  • 自动轮询任务状态
  • 自动切换到视频播放器
  • 支持 5–30 秒视频生成

🔥 2. 银河流动视频带(首页主视觉)

  • 最新生成的视频自动出现在流动视频墙
  • 科技感光影 + 卡片流动效果
  • 支持点击播放 / 全屏
  • 支持复制链接、复制提示词

🔥 3. 生成记录时间线(Command System)

  • 按时间倒序展示历史视频
  • 缩略图自动生成
  • 点击可切换预览
  • 支持复制提示词 / 链接
  • 支持查看生成时间

🔥 4. 视频自动下载(PC)

  • 视频生成后自动下载到电脑
  • 防重复下载机制
  • 可设置下载名称格式

🔥 5. 手机端自动保存逻辑(iOS + Android)

  • 自动跳转到播放器
  • 用户长按即可保存到相册
  • 已兼容微信浏览器

🔥 6. 视频本地存储(服务器端)

  • 视频自动保存至: /assets/media/myvideos/
  • 命名规范: sora_video_任务ID_时间戳.mp4

🔥 7. 多端同步(数据库版)

通过 MySQL:
  • 生成视频自动写入数据库
  • 手机端、电脑端 同一个域名下同步显示
  • 历史记录永不丢失
  • 支持保留最近 30 条

🔥 8. 私有化部署(宝塔可运行)

  • 国内服务器可部署
  • 支持 HTTPS
  • 支持 /api 反代
  • 支持带宽和流量扩容
  • 无需国外服务器

🔥 9. 商用授权(软著授权)

预售用户将获得:
  • 软著授权书
  • 域名永久授权
  • 商用权、可经营营收(不限量)
  • 可用于投标、备案、合作

🟩 三、授权形式(重头戏)

系统采取 域名授权版(非开源版本):

❌ 不提供:

  • 完整 index.html 源码
  • 完整 JS 源码
  • 完整 API 源码
  • 文件结构讲解
  • 二次开发源码

✔ 提供:

  • 可运行的部署包(不可逆向)
  • 域名永久授权(1主域名 )
  • 一次部署协助
  • 数据库 SQL 文件
  • 运行所需 assets(混淆版)
  • 全局配置文件(env)
  • 软著授权书
  • 永久升级服务(含未来大版本)

🟧 四、预售价:1999 元(限时 · 永久授权版)

一次购买,永久使用。

你将获得:

✔(1)运行部署包(不可逆向)

  • 运行版 index.html
  • 运行版 CSS/JS(已混淆)
  • 运行版 API
  • 本地视频存储目录
  • 可直接放到宝塔部署

✔(2)域名永久授权(可商用)

  • 主域名 1 个
  • 不限调用、无限用户、无限视频生成

✔(3)软著授权书

  • 用于经营、备案、招投标
  • 可上传到工商局、资质申报

✔(4)部署协助一次

  • 域名
  • SSL
  • FILE PATH
  • API 对接
  • 本地目录结构

✔(5)永久升级(V1.0 → V5.0 全免费)

包括未来全部功能:
  • 后台
  • 会员系统
  • 多模型
  • 小程序
  • App
  • 海外版
  • 多语言
  • AI 剪辑工作台
  • 付费系统
  • 模板库
  • 企业版
你买的不是系统,是未来 3 年的增长红利

🟥 五、Sora 文本转视频系统 · 全球化 + 多产品矩阵迭代方案(2025–2027)


🌍 1. 全球语言版本(V3.0 开始)

支持全球 12 种核心语言:
  • 英语
  • 中文(简体/繁体)
  • 日语
  • 韩语
  • 西班牙语
  • 法语
  • 德语
  • 葡萄牙语
  • 阿拉伯语
  • 印地语
  • 印尼语
未来用户可一键切换语言界面 + 提示词翻译。

🌎 2. 海外版本(Sora Global Edition)

  • 全球 CDN
  • Stripe + PayPal 支付
  • GDPR 隐私合规
  • 多服务器集群
  • 多地区加速(美/欧/亚)
目标: 打造华人世界第一个全球型 AI 视频平台。

✨ 3. 多产品矩阵(也是未来你能卖的系统)

🔥 A. 标书 AI(工程行业独家优势)

  • 自动生成投标文件
  • 自动排版
  • 自动调用国标规范
  • Word/PDF 导出

🔥 B. PPT AI

  • 自动生成 10–40 页 PPT
  • 自动配图 + 图表
  • 导出 PPTX

🔥 C. 文案 AI

  • 营销文案
  • SEO
  • 电商文案
  • 海外广告文案

🔥 D. AI 配音工厂

  • 百种声音
  • 多语言
  • 情绪控制
  • 广告 / 剧情配音

🔥 E. AI 视频剪辑工作台

  • 自动字幕
  • 自动剪辑
  • 自动模板
  • 自动背景音乐

🔥 F. SaaS 多租户版本

  • 开分站
  • 分成系统
  • 白标定制
  • 类似“AI版 WordPress”

🟪 六、Sora 主线版本规划

V1.0 – 文本 → 视频(已完成 100%)

V2.0 – 后台 + 用户体系(预售客户免费升级)

V2.5 – 会员体系 + 付费系统

V3.0 – 多语言 + 多模型(全球版)

V3.5 – 小程序 + App

V4.0 – 视频剪辑工作台(短视频平台)

V5.0 – AI 多产品矩阵(标书AI/PPTAI/配音AI/等)

三年内打造国产最完整的 AI 创作生态系统

🟩 七、总结(对预售用户极具吸引力)

你现在支付 1999 元 获得的不仅是一套文本生成视频系统,而是未来 3 年完整的 AI 创作生态。 ✔ 域名永久授权 ✔ 可运行部署包(商业可用) ✔ 软著授权 ✔ 部署协助 ✔ 终身升级(含海外版、多语言、全矩阵产品) 在这个阶段预售,是最划算的时间点。