WangShuXian6 / blog

FE-BLOG
https://wangshuxian6.github.io/blog/
MIT License
46 stars 10 forks source link

Midjourney AI #147

Open WangShuXian6 opened 1 year ago

WangShuXian6 commented 1 year ago

Midjourney AI

Midjourney是一个由同名研究实验室开发的人工智能程序,可根据文本生成图像,于2022年7月12日进入公开测试阶段,用户可透过Discord的机器人指令进行操作。该研究实验室由Leap Motion的创办人大卫·霍尔兹负责领导

https://docs.midjourney.com/ https://discord.gg/midjourney https://discord.com/channels/662267976984297473/952771221915840552

免费试用已结束,必须付费订阅

Midjourney 的开放性默认情况下是对所有人公开的社区,包括在私人 Discord 服务器、直接消息和 Midjourney 网站上创建的图像。Pro 计划的订阅者可以使用 Stealth Mode 防止他们的图像在 Midjourney 网站上被其他人看到。/stealth/public 命令在 Stealth 和 Public 模式之间切换。

只有 Stealth 模式可以防止其他人在 Midjourney.com 上查看您的图像!在使用 Stealth 模式时,在公共渠道生成的图像始终可供其他用户查看。如果要防止其他人查看您使用 Stealth 模式创建的图像,请在您的直接消息或私人 Discord 服务器上生成图像。

WangShuXian6 commented 1 year ago

使用

Beginner Prompts 初学者提示

在创意或自然语言处理领域中,"Prompts" 是一组指导性问题或提示,用于激发创意或作为 GPT 系统的输入,以帮助生成相关和准确的文本。

/imagine

从discord 进入随机分配的新人频道 截屏2023-04-14 12 20 31

/imagine命令从简短的文本描述(称为Prompt)生成一个独特的图像

在聊天框输入 Prompts 提示 使用斜杠开头的命令生成图像 /imagine prompt:water 将生成水的图像 Midjourney Bot 需要大约一分钟的时间来生成四个选项

默认为一张4合一图,通过点击U1 左上,U2 右上,U3 左下,U4 右下选择 ,具体图像。

截屏2023-04-14 13 02 22

点击open original 打开选择图像的原图,1024*1024 像素。

点击V 将重新生成4个图像

初始图像网格生成完成后,会出现两行按钮: 生成图像网格后的 Midjourney Discord 按钮界面图像 U1 U2 U3 U4 U 按钮放大图像,生成所选图像的更大版本并添加更多细节。

V1 V2 V3 V4 V 按钮创建所选网格图像的细微变化。创建变体会生成与所选图像的整体风格和构图相似的新图像网格。

🔄 🔄(重新滚动)重新运行作业。在这种情况下,它将重新运行原始提示,生成新的图像网格。

使用放大图像后,将出现一组新选项: 放大图像后的 Midjourney Discord 按钮界面图像 🪄 Make Variations 🔍 Light Upscale Redo 🔍 Beta Upscale Redo ↗️Web

Make Variations:创建放大图像的变体并生成包含四个选项的新网格。

Beta/Light Upscale Redo:使用不同的升级器模型重做升级

网络:在Midjourney.com 上打开图库中的图像

😖 😒 🙂 😍

在Midjourney 网站或 Discord上点击一个笑脸按钮来评价任何放大的图像。

每天,排名前 1000 位的图像评分者都会获得一个小时的免费快速模式时间。对您的工作或其他人的工作进行排名。根据您的个人风格和意见进行排名。喜欢外观、效果、颜色、概念或主题?请给它一个😍!


提示[Prompts] / 标记[tokens]

提示[Prompt]是 Midjourney Bot 解释以生成图像的短文本短语。

Midjourney Bot 将提示中的单词和短语分解为更小的部分,称为标记[tokens], 可以将其与其训练数据进行比较,然后用于生成图像。 精心制作的提示可以帮助制作独特而令人兴奋的图像。

结构 Structure

基本提示 Basic Prompts

基本提示可以像单个单词、短语或表情符号一样简单

image

高级提示 Advanced Prompts

更高级的提示可以包括一个或多个图像 URL多个文本短语以及一个或多个参数

image

Image Prompts

可以将图像 URL 添加到提示中以影响最终结果的样式和内容。图片 URL 始终位于提示的前面。

阅读有关图像提示的更多信息

Prompt Text

您要生成的图像的文本描述。 精心编写的提示有助于生成令人惊叹的图像。

Parameters

参数改变图像的生成方式。参数可以更改宽高比、模型、放大器等等。 参数位于提示的末尾。

阅读有关参数的更多信息

提示笔记 Prompting Notes

提示长度 Prompt Length

提示可以非常简单。单个词(甚至是表情符号!)将产生图像。 非常短的提示将在很大程度上依赖于 Midjourney 的默认样式,因此更具描述性的提示更适合独特的外观。 然而,超长提示并不总是更好。专注于您要创建的主要概念。

语法 Grammar

Midjourney Bot 不像人类一样理解语法、句子结构或单词。 在许多情况下,单词的选择也很重要。 更具体的同义词在很多情况下表现更好。 例如,可以用 gigantic、enormous 或 immense 代替 big。 尽可能地删减单词,这样每个单词的影响力更大。 使用逗号、括号和连字符有助于组织思路,但是 Midjourney Bot 无法可靠地解释它们。 Midjourney Bot 不考虑大小写。

Midjourney Model Version 4 在解释传统句子结构方面略优于其他模型。

"gigantic" 通常用来描述非常巨大的事物,强调大小、规模和威力。例如:"a gigantic skyscraper"(巨大的摩天大楼)。

"enormous" 同样也强调大小和规模,但通常指事物的数量、程度或程度的极端,也可以用来描述情感、问题等方面的巨大。例如:"an enormous amount of money"(巨额的钱)。

"immense" 强调范围的广阔和程度的极端,通常用于描述无法计量的数量或非常广阔的空间。例如:"an immense ocean"(广阔无垠的海洋)。

专注于你想要的

最好描述你想要什么而不是你不想要什么。 如果您要求举办“没有蛋糕”的派对,您的图片可能会包含一个蛋糕。 如果要确保某个对象不在最终图像中,请尝试使用--no参数提前提示。

思考重要的细节

任何未说的内容可能会让您大吃一惊。 尽可能具体或模糊,但您遗漏的任何内容都会随机化。含糊其词是获得多样性的好方法,但您可能无法获得所需的具体细节。

尽量弄清楚对您来说很重要的任何背景或细节。

想一想:

主题:人、动物、人物、地点、物体等。 媒介:照片、绘画、插图、雕塑、涂鸦、挂毯等。 环境:室内、室外、月球上、纳尼亚、水下、翡翠城等。 照明:柔和、环境、阴天、霓虹灯、工作室灯等 颜色:充满活力、柔和、明亮、单色、彩色、黑白、柔和等。 情绪:稳重、平静、喧闹、精力充沛等。 构图:人像、爆头、特写、鸟瞰图等。

使用集合名词

复数词留下了很多未知的可能性。 试着使用具体的数字。"Three cats"(三只猫)比 "cats"(猫)更具体。 集合名词也可以使用,例如用“flock of birds”(一群鸟)代替 "birds"(鸟)


探索提示 Explore Prompting

即使是简短的单个单词提示也会以 Midjourney 的默认风格生成精美的图像,但您可以通过结合艺术媒介、历史时期、位置等概念来创建更有趣的个性化结果。

选择媒介

拿出颜料、蜡笔、刮画板、印刷机、闪粉、墨水和彩色纸张。 生成时尚图像的最佳方式之一是指定艺术媒介。

例如:/imagine prompt <任何艺术风格> 风格 猫。 提示示例:/imagine prompt style cat

版画Block Print image

民间艺术Folk Art image

蓝版 Cyanotype image

涂鸦 Graffiti image

按数字绘画 Paint by Numbers image

曲线图 risograph image

浮世绘 Ukiyo-e image

铅笔素描 Pencil Sketch image

水彩 Watercolor image

像素艺术 Pixel Art image

黑光绘画 Blacklight Painting image

十字绣 Cross Stitch image

具体化

更精确的单词和短语将有助于创建具有完全正确外观和感觉的图像。

例如:/imagine prompt <风格> 猫的素描 提示示例:/imagine prompt