1、imagen
网址:https://imagen.research.google/
Imagen 是一个人工智能系统,可以从输入文本中创建逼真的图像。 具体来说,谷歌推出的一款文本-图像的扩散(CLIP)模型,可以根据给定的提示词,生成高度契合文本含义及具有照片般真实感的图像。 据称,Imagen可以创建比OpenAI的人工智能工具DALL-E2更逼真和逼真的图像。
2、DALL-E 2
网址:https://openai.com/dall-e-2/
「DALL-E 2」,名称合成自超现实主义艺术家“萨尔瓦多·达利(Salvador Dalí)”和《机器人总动员》的英文名“WALL-E”。 DALL-E 2诞生的时间也很短暂,今年的4月份刚刚推出,它的前身DALL·E也诞生才一年半左右。只要输入一些描绘你想要的画作的关键词,几秒钟就可以给你生成一幅。可惜的是,目前还未对公众开放,而其他一些已经开放的平台,“画功”稍逊一筹。
3、Midjourney
网址:https://midjourney.gitbook.io
Midjourney AI生成艺术工具,打上一段你想要呈现的文字,系统就将自动返回四幅极富创造力和艺术感的作品供你选择,而以上这张图片只是其中之一。 今年以来,各种文字转化图片生成平台在人工智能领域异军突起。最近硅星人也曾报道过包括英伟达的GauGAN2、DALL-E、Stable Diffusion等同类工具。但此次,当亲自使用Midjourney之后,仍然被它所生成的效果所惊艳到。目前这些平台有些追求照片式的逼真效果,有些追求对文本的精准解析,但如果要说艺术性和高级感,硅星人觉得Midjourney应该是这几个工具中最好的。
4、StableDiffusion
网址:https://huggingface.co/spaces/stabilityai/stable-diffusion
“Stable Diffusion”是开源图像合成模型,可以让任何拥有一台 PC 和一个像样 GPU 的人,将文本转化为图像。这个 AI 作画工具几乎可以模仿任何视觉风格,如果你输入一个描述性短语,图像就会像魔术一样出现在你的屏幕上。 有些艺术家对此技术的前景感到兴奋,有些则不然,而整个社会似乎仍然没有意识到 AI 作画所带来的广泛影响。可以说,图像合成技术带来的影响堪比照相机的发明,或者堪比视觉艺术本身的创造。甚至我们的历史感也可能受到威胁,这取决于事态的发展。无论如何,Stable Diffusion 正引领一波深度学习创新工具的新浪潮,这必将彻底改变视觉媒体的创作。
5、Disco Diffusion
网址:https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb
Disco Diffusion 是在今年 2 月初开始流行的一个 AI 图像生成程序,它可以根据描述场景的关键词渲染出对应的图像,可以在 Google Drive 直接运行,也可以部署到本地运行,目前最新的版本是 Disco Diffusion v5.2。
6、Parti
网址:https://parti.research.google/
Parti,全名叫「Pathways Autoregressive Text-to-Image」,是谷歌大脑老大Jeff Dean提出的多任务AI大模型蓝图Pathway的一部分。 Parti是一个自回归模型,它的方法首先将一组图像转换为一系列代码条目,类似于拼图。然后将给定的文本提示转换为这些代码条目并「拼成」一个新图像。 换言之,Parti将「文本到图像的生成」转换成一个「序列到序列」的建模问题,类似于机器翻译——这使得它能够受益于大型语言模型(如PaLM),这对于处理长而复杂的文本提示和生成高质量的图像至关重要。 在这种情况下,目标输出是图像token的序列,而不是另一种语言的文本token。 Parti通过使用功能强大的图像标记器「ViT-VQGAN」将图像编码为离散token序列,并利用其重建图像token序列的能力,使其成为高质量、视觉多样化的图像。
7、NovelAI
网址:novelai.net/
《novelai》是个非常好用的绘画网站,可以方便快捷的画出精美好看的图画,相对于一些通用的AI绘画生成器来说,novelai在二次元图上更加的准确。