梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAI第4色.com
最新AI文生图模子Flux1.1,通宵刷屏。
只需一个直爽妙技,就能去除图中的“AI味”,无论东谈主物如故感奋皆能达到相片级为止。
挑剔区网友的反应be like:我分不清,果然分不清啊。
这个妙技用起来也相等直爽,在辅导词中效法单反相机的文献定名步地即可。
比如“CR2”等于相机使用的原始图像文献步地,输入“IMG”+飞快编号+“.CR2”,再加指定的本色,就能取得一张写实图像了。
后头也持续有尝试过的网友反馈,换成索尼相机的“ARW”、尼康相机的“NEF”,致使的“HEIC”步地,皆能取得可以的为止。
以至于有东谈主皆开动怀疑,不会是模子飞快吐出来一张考试数据里的真相片吧?
不外放大看一些特定细节,如故很容易看出确乎是AI生成的,比如车招牌上的翰墨皆是乱码。
偷拍走光那么是否Flux1.1模子自己才智就很强劲,这个妙技在其中起到了多大作用呢?
一位资深修图师父晒出了对比,左边加了IMG_1018.CR2,对比右边不加的,他合计辞别弘大。
咱们的实测为止也能看出,加上这个妙技能权臣提高画面实在性。
当今念念免费试玩这个Flux1.1模子,可以来到together.ai平台,注册即送5好意思元的积分。
松驰生成一张在长城的旅客自拍照,乍一看像那么回事,但仔细不雅察东谈主物皮肤质感、配景山和植物皆有如故有一股AI味。
换成“IMG_0314.cr2: selfie on The Great Wall”,是不是立马就不同样了?
代号蓝莓第4色.com,最新SOTA文生图模子
跟着FLUX1.1的崇敬发布,此前在文生图模子名次榜上屡占榜首的两个无东谈主认领的“蓝莓”模子的奥密面纱也被揭下,恰是它。
官方不藏了,径直放出数据,在Artificial Analysis image arena上,FLUX1.1 [pro]以“blueberry”为代号,越过通盘其它模子,取得最高的举座Elo评分。
比拟之下,FLUX1.1 [pro]价钱也更低,速率更快,各项规划越过Midjourney、SD3、Ideogram等。
生成速率上,FLUX1.1 [pro]在保抓图像质地、指示反应和各类性提高的同期,速率是前代FLUX.1 [pro]的6倍。
趁便提一下,当今FLUX.1 [pro]也进行了更新,速率是之前的2倍,FLUX1.1 [pro]的速率是现时可用的FLUX.1 [pro]的3倍。
此外,官方暗示行将推出快速高分裂率生成,FLUX1.1 [pro]可原生维持的那种,在不就义任何指示反应情况下,能生成2k图像。
FLUX1.1 [pro]将通过Together.ai 、Replicate 、fal.ai、Freepik等在线平台提供。
同期官方还推出了BFL API,可供其他开辟者集成到我方的利用门径中,API订价是:
FLUX.1 [dev]:每张图2.5好意思分(约RMB 0.18元)FLUX.1 [pro]:每张图5好意思分(约RMB 0.35元)FLUX1.1 [pro]:每张图4好意思分(约RMB 0.28元)Stable Diffusion原班东谈主马打造
FLUX1.1 [pro]的背后是Stable Diffusion原团队,成员包括Robin Rombach、Andreas Blattmann、Dominik Lorenz等。
△Robin Rombach
其实Stable Diffusion当先是一个学术筹办形势。
由Björn Ommer磨真金不怕火领衔,Robin Rombach、Andreas Blattmann、Dominik Lorenz等几位慕尼黑大学机器视觉与学习筹办小构成员,以及Runway的筹办东谈主员Patrick Esser完成。
筹办论文发表七个月后,Stability AI开动介入,提供绸缪资源,以进一步开辟文本到图像生成模子。2022年,上述几位论文作家加入Stability AI。
团队一同创建了Stable Diffusion XL、Stable Video Diffusion等。
ICML 2024最好论文之一、Stable Diffusion 3技艺论文的Rectified Flow Transformers,还有SDXL-Turbo使用的抵挡扩散蒸馏样式(Adversarial Diffusion Distillation),亦然这帮子东谈主在筹办。
本年三月份这些中枢筹办团队成员被曝集体离职。
此后,他们构成了新团队名为Black Forest Labs(黑丛林现实室),总部位于德国。
本年8月初刚刚秘书缔造,并发布了其初代文生图模子FLUX.1,FLUX.1有三个变体:FLUX.1 [pro]、FLUX.1 [dev]和 FLUX.1 [schnell],均衡了性能和可拜谒性。
现时黑丛林现实室已完成种子轮融资,共融资3100万好意思元,Andreessen Horowitz领投,Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun等跟投。
听说他们还依然收到General Catalyst、MätchVC的后续投资。
黑丛林现实室和马斯克还有调解,将其图像生成模子引入xAI的Grok助手中。
接下来,团队走漏将推出SOTA级文本到视频生成模子。
听说他们正在以10亿好意思元的估值筹集1亿好意思元资金,比之前1.5亿好意思元的估值大幅高潮。
从Pika 1.5到Meta Movie Gen,本年下半场视频生成赛谈爆火,黑丛林现实室的加入,大要会带来不同样的火花。
Flux1.1试玩https://api.together.ai/playground/image/black-forest-labs/FLUX.1.1-pro
参考流畅:[1]https://x.com/fofrAI/status/1841854401717403944[2]https://blackforestlabs.ai/announcing-flux-1-1-pro-and-the-bfl-api/[3]https://techcrunch.com/2024/10/03/black-forest-labs-the-startup-behind-groks-image-generator-releases-an-api/