大家还记得 Stable Diffusion,就是那个曾经和谐的人, DALL·E 、 Midjourney 生成齐名图像 AI 。
老板跑路后,核心开发成员离职,过去搅动图像 AI 市场的 Stability AI ,里面已经乱成一锅粥了。
近几个月来,关于其资金链断裂、寻求卖身的消息并没有被打破。
当前东家陷入尴尬境地,想到自救时,年初离开的成员正好与Stable对标 Diffusion Black成立了一家新公司 Forest Lab ( 黑森林实验室 )。
就在本月初,当他们宣布成立一家新公司时,他们还发布了三个不同体量的文生图模型 FLUX.1 。
以图片质量为主的大杯 pro ;兼顾速度和图片质量的中杯 dev ;还有人称 “ 速度旋风 ” 的小杯 schnell 。
根据他们官网的说法,大中杯的 FLUX ,已经变成了所有的图片 AI 最强大的存在。
各种拆分能力,如视觉质量、尺寸可变性、输出多样性等,也比其他模型强得多。
不仅官方这么说,在很多网友和媒体的口中,刚刚发布的这个 FLUX ,拳击也已经到了 Midjourney ,脚踢 DALL·E 的程度。
看看网上的评论,却勾起了世超的兴趣。FLUX 是不是真的像大家说的那么厉害,这次我们拉来了? Midjourney ,和大杯在一起 FLUX 把一块放在一起测量。
一开始,让我们热身一个常规的测试题,让他们两个画一幅中国水墨画。
结果表现不错,比如渔夫、群山、芦苇等提示词的内容,都画出来了。但是。 Midjourney 在这里画太阳,真的有点太大了,也没有夕阳的感觉。
提示词:
中国水墨画风格,一个孤独的渔夫在传统的木船上,在夕阳下在宁静的湖面上轻轻漂流,中国水墨画风格,温暖的蓝色色调反映了平静的水面,柔和的笔触捕捉到了夜晚的宁静,远处的山在渐渐的灯光下剪影,岸边的传统小屋,芦苇在微风中摇曳, 8K 分辨率,电影般的感觉,怀旧宁静的氛围
FLUX ( 左 ), Midjourney ( 右 )
关注图片 AI 这一块的朋友应该都知道, “ 文字生成太差 ” 几乎是所有 AI 都过头了。以前的地方。 DALL·E 也专门针对这个弱点优化过一次,但偶尔还是会出错。
而这一次,据说 FLUX 在这方面的能力是完美的,所以我特别选择了几个提示词来生成文本并扔给它和 Midjorney 。
还没有评论,来说两句吧...