首页资讯正文

度小满携AI反诈技术亮相Create2025百度AI开发者大会让参会者体验防深伪技术

体育正文 2025-06-04 10:51:19 127 0

近日，国外AI团队黑森林实验室(shíyànshì)（Black Forest Labs）宣布推出新一代 AI 图像(túxiàng)生成与(yǔ)编辑模型FLUX.1 Kontext，这是继去年(qùnián) 8 月首次发布Flux模型后(hòu)，该团队在多模态生成领域的又一里程碑。据官方介绍，与传统文本到图像模型不同(bùtóng)，FLUX.1 Kontext 首次实现了文本与图像双输入的上下文生成与编辑，允许用户通过自然语言指令直接修改现有图像的局部或全局元素，同时保持角色一致性(yízhìxìng)和视觉连贯性。 Flux.1 Kontext系列模型包括(bāokuò)两个型号：Flux.1 Kontex [pro] 和(hé) Flux.1 Kontex [max]。Flux.1 Kontex [pro] 允许用户(yònghù)生成图像并(bìng)通过(tōngguò)多次回合对其进行(jìnxíng)优化，保留字符和样式。Flux.1 Kontex [max] 强调速度、一致性和对提示的(de)遵守(zūnshǒu)。不过，与以往的FLux模型不同，Flux.1 Kontex [pro] 和 Flux.1 Kontex [max] 无法下载(xiàzài)离线使用(shǐyòng)。然而，Black Forest Labs 正在制作一个开放的 Kontext 模型 Flux.1 Kontext [dev]，可用于私人(sīrén)测试版，用于研究和安全测试。 FLUX.1 Kontext采用流(liú)匹配架构（Flow Matching），彻底打破了文本(wénběn)编码器与扩散模型分离的(de)传统设计。通过将文本提示与参考图像的潜在特征编码为统一序列，模型能够精准捕捉视觉概念与语义(yǔyì)指令的关联，实现 “所见即(suǒjiànjí)所改” 的交互式创作。这种架构(jiàgòu)带来四大核心优势： 1. 角色一致性：多轮编辑中保持人物身份特征，例如将角色从城市街道转移(zhuǎnyí)到雪山场景时，发型、服装(fúzhuāng)等细节丝毫不差； 2. 局部编辑：支持像素级精准修改，如(rú)删除图像中的杂物、调整特定区域色彩，而不影响其他部分(bùfèn)； 3. 风格(fēnggé)参考：基于参考图像的(de)风格生成新场景，例如将一张文艺复兴风格的油画转换为现代卡通风格，同时保留主体构图； 4. 交互速度：1024×1024 分辨率下生成时间仅(jǐn)需 3-5 秒，比主流竞品快一个数量级，显著提升创意迭代(diédài)效率。 5月31日，记者(jìzhě)在官方试玩平台Flux Playground上进行(jìnxíng)了多场景测试：文本编辑：上传一张含有(hányǒu)手写字的(de)照片，输入 “将文字改为Nanjing”，模型不仅准确修改文字内容，还自动调整排版与背景光影，使新标题与画面融为一体(róngwéiyītǐ)。风格(fēnggé)迁移：提供一张梵高的向日葵画作(huàzuò)作为参考，输入 “用相同笔触(bǐchù)绘制一幅玫瑰画作”，生成的图像既保留印象派的色彩层次，又精准还原玫瑰花的细节。图片编辑：尝试 “将戴珍珠耳环的(de)少女改成一个长发戴着宝石耳环和项链(xiàngliàn)”的创意，模型(móxíng)同时处理少女的发型、项链、耳环等元素，最终输出的图像细节丰富。值得注意的是，FLUX.1 Kontext 对中文提示(tíshì)词的理解能力也有不错表现。例如输入“青砖黛瓦(dàiwǎ)的江南水乡，细雨中撑伞的旗袍女子”，模型生成的画面不仅准确(zhǔnquè)还原了中式建筑的韵味，人物服饰的纹理和动态(dòngtài)也极具真实感。

标签

淮安飞特 127 0

暂无评论，快抢沙发吧~