近几年来以GPT为首的AI技术大爆发,对一系列行业造成了巨大的冲击。在建筑设计行业,也开始有设计师尝试利用人工智能工具进行创作。5月23日,中铁房地产集团设计咨询公司创作二室郑有池在第198期“简·说”分享会上,向公司员工分享了近期热度暴涨的人工智能绘画软件的发展情况,并介绍了利用AI绘画工具进行辅助设计工作的一些方法。
(资料图片)
与GPT之类更侧重于逻辑分析能力的大语言模型不同,AI绘画属于人工智能生成内容领域,其更擅长对于形式和风格的模仿,可以依据简单的提示和限制,快速生成大量具有表现力的方案图像。在建筑设计的过程中,这种能力可以帮助建筑师在建筑设计前期工作尤其是概念设计阶段扩展设计思路,也可以帮助提高与合作方之间的沟通效率。
目前市场上主要的AI绘图产品很多,其中最有代表性的是Midjourney和Stable Diffusion两款应用。
使用Midjourney需要通过Discord聊天平台或QQ频道进行付费订阅,该款软件主要特点是操作简单,生成图像品质较高,可以根据文本提示或参考图片每次随机生成4张全新的图像。Midjourney的产品设计针对设计思考过程进行了优化,例如Variation功能可以根据指定图像进行联想扩展,并结合提示词重新生成4张不同的图像;Blend功能可以融合两张参考图的元素生成新图像,Seed功能可以记录图像风格基因,便于复制使用。这些功能在大部分美术创作工作中都能提供良好的使用体验,生成富有启发性的内容。而在建筑设计过程中,建筑师往往需要对形体和内容进行更精确的控制,Midjourney在这方面的功能目前还相对较弱。
Stable Diffusion是由StabilityAI公司推出的开源模型,可以通过其官网付费订阅,也可以在本地部署使用。需要注意的是AI算法需要进行大量并行计算,在本地部署时需要显卡支持CUDA算法,显存至少达到4G,才能保证较好的出图质量。由于Stable Diffusion的开源属性,网络中聚集了大量的二次开发者和内容分享者,他们创作了大量的功能扩展插件和微调模型,为精确控制AI进行绘图提供了可能。
以使用Stable Diffusion进行文生图功能为例,用户先要选择合适的主模型作为工作基础。主模型是负责控制文本、编码、图片的映射关系的核心组成部分,用户可以通过DreamBooth的方式对官方发布的主模型进行微调,强化其在特定领域生成图像的能力。
确定合适的主模型后用户需要将正面和负面提示词分别填入对应的输入框。然后选择采样方法和相应的迭代步数。默认的欧拉采样器最佳迭代步数在20~50之间,一般情况下迭代步数越高,生成图像的质量越高,对显卡的计算能力要求也越高。在主界面设置图像的高度和宽度时可以先将其设置在512像素之内,再通过Tiled Diffusion 和Tiled Vae插件提高最终生成图片的分辨率,以提高显卡工作效率,获得更高质量的图像。
完成设置后,点击生成按键,程序即可开始随机生成图像。以上过程与Midjourney的生成过程类似。对于建筑设计辅助工作来说,可能会有更进一步的需求,例如对某种特定建筑风格的强化或对建筑形体进行精确控制,这些需求可以通过附加网络模型和Controlnet等插件功能来满足。
AI生成图像效果 1
附加网络模型是另一种微调模型,能够在不改变主模型的前提下,强化AI对特定风格或形象的模仿能力。目前使用最广的是Lora模型,其工作原理可简单理解为在主模型计算过程的每次迭代间隙插入计算,以实现对结果的引导。与微调大模型的方式相比,Lora模型具有诸多优势,其体量更小,一般在70~150MB之间;而且训练相对便捷,用户可以根据需求训练自己的lora模型;并且多个lora模型还可以叠加使用,各模型可以分别设置权重参数,调整各自对生成过程的影响能力。
ControlNet插件可以对模型实现比较精准的控制,其集成了多种控制算法,包括线稿控制、深度信息控制、法线信息控制、seg语义分割控制、人体姿势控制、shuffle色调控制、reference参考图控制等。使用时先导入作为控制条件的图像,根据需要选择相应的预处理器和模型,并设置控制条件对生成图像影响的权重参数即可。
AI生成图像效果 2
在配备高质量模型的情况下,合理利用AI绘图工具,可以快速生成大量具有一定表现力的图像,可用于头脑风暴启发设计思路;或者作为填色底图,丰富成果表现内容;也可以作为前期意向图片,提高与甲方或相关单位的沟通效果。
除了以上两款软件,还有很多值得一提的产品。OpenAI推出的DALL·E模型已经集成在微软的NewBing搜索引擎,配合其独到的ChatGPT语言模型,可以通过聊天的方式,生成高质量图片。另外百度推出的文心一格可以通过中文提示词生成图像,并且也推出了参考图功能,目前在快速发展迭代过程中。
在人工智能生成内容领域,与建筑设计高度相关的除了AI绘画方向之外,还有AI建模,AI矢量内容生成等方向的研发,现在已经出现了ShapE、Finch3D等产品。
虽然AI绘画工具在使用中还存在一些问题,相关的应用方式也还在探索过程中。然而改变已经开始;也许在不久的将来,随着AIGC产品的逐渐成熟,建筑行业会迎来一场深刻的的技术变革。作为本次技术变革的拥抱者与参与者,设计公司全体员工将在技术上精益求精、在创新上奋勇争先,顺势而谋、因势而为,为丰富人工智能在具体工作中的应用不懈努力。(撰稿:郑有池)
来源:号外网